resnet-cppn-gan-tensorflow/train.py at master · hardmaru/resnet-cppn-gan-tensorflow · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
import numpy as np
import tensorflow as tf

import argparse
import time
import os
import cPickle

from mnist_data import *
from model import CPPNVAE

'''
cppn vae:

compositional pattern-producing generative adversarial network

LOADS of help was taken from:

https://github.com/carpedm20/DCGAN-tensorflow
https://jmetzen.github.io/2015-11-27/vae.html

'''

def main():
  parser = argparse.ArgumentParser()
  parser.add_argument('--training_epochs', type=int, default=3000,
                     help='training epochs')
  parser.add_argument('--display_step', type=int, default=1,
                     help='display step')
  parser.add_argument('--checkpoint_step', type=int, default=1,
                     help='checkpoint step')
  parser.add_argument('--batch_size', type=int, default=1000,
                     help='batch size')
  parser.add_argument('--learning_rate_g', type=float, default=0.001,
                     help='learning rate for G and VAE')
  parser.add_argument('--learning_rate_vae', type=float, default=0.0001,
                     help='learning rate for VAE')
  parser.add_argument('--learning_rate_d', type=float, default=0.001,
                     help='learning rate for D')
  parser.add_argument('--keep_prob', type=float, default=0.65,
                     help='dropout keep probability')
  parser.add_argument('--beta1', type=float, default=0.75,
                     help='adam momentum param for descriminator')
  args = parser.parse_args()
  return train(args)

def train(args):

  learning_rate_g = args.learning_rate_g
  learning_rate_d = args.learning_rate_d
  learning_rate_vae = args.learning_rate_vae
  batch_size = args.batch_size
  training_epochs = args.training_epochs
  display_step = args.display_step
  checkpoint_step = args.checkpoint_step # save training results every check point step
  beta1 = args.beta1
  keep_prob = args.keep_prob
  dirname = 'save'
  if not os.path.exists(dirname):
    os.makedirs(dirname)

  with open(os.path.join(dirname, 'config.pkl'), 'w') as f:
    cPickle.dump(args, f)

  mnist = read_data_sets()
  n_samples = mnist.num_examples

  cppnvae = CPPNVAE(batch_size=batch_size, learning_rate_g = learning_rate_g, learning_rate_d = learning_rate_d, learning_rate_vae = learning_rate_vae, beta1 = beta1, keep_prob = keep_prob)

  # load previously trained model if appilcable
  ckpt = tf.train.get_checkpoint_state(dirname)
  if ckpt:
    cppnvae.load_model(dirname)

  counter = 0

  # Training cycle
  for epoch in range(training_epochs):
    avg_d_loss = 0.
    avg_d_loss_real = 0.
    avg_d_loss_fake = 0.
    avg_q_loss = 0.
    avg_vae_loss = 0.
    avg_d_real_accuracy = 0.
    avg_d_fake_accuracy = 0.
    avg_g_accuracy = 0.
    mnist.shuffle_data()
    total_batch = int(n_samples / batch_size)
    # Loop over all batches
    for i in range(total_batch):
      batch_images, batch_labels = mnist.next_batch(batch_size, with_label = True) # obtain training labels

      d_loss, g_loss, vae_loss, n_operations, d_real_accuracy, d_fake_accuracy, g_accuracy, d_loss_real, d_loss_fake = cppnvae.partial_train(batch_images, batch_labels)

      assert( vae_loss < 1000000 ) # make sure it is not NaN or Inf
      assert( d_loss < 1000000 ) # make sure it is not NaN or Inf
      assert( g_loss < 1000000 ) # make sure it is not NaN or Inf
      assert( d_loss_real < 1000000 ) # make sure it is not NaN or Inf
      assert( d_loss_fake < 1000000 ) # make sure it is not NaN or Inf
      assert( d_real_accuracy < 1000000 ) # make sure it is not NaN or Inf
      assert( d_fake_accuracy < 1000000 ) # make sure it is not NaN or Inf
      assert( g_accuracy < 1000000 ) # make sure it is not NaN or Inf

      # Display logs per epoch step
      if (counter+1) % display_step == 0:
        print "Sample:", '%d' % ((i+1)*batch_size), " Epoch:", '%d' % (epoch), \
              "d_loss=", "{:.4f}".format(d_loss), \
              "d_real=", "{:.4f}".format(d_loss_real), \
              "d_fake=", "{:.4f}".format(d_loss_fake), \
              "g_loss=", "{:.4f}".format(g_loss), \
              "vae_loss=", "{:.4f}".format(vae_loss), \
              "d_real_accuracy=", "{:.2f}".format(d_real_accuracy), \
              "d_fake_accuracy=", "{:.2f}".format(d_fake_accuracy), \
              "g_accuracy=", "{:.2f}".format(g_accuracy), \
              "n_op=", '%d' % (n_operations)
      counter += 1
      # Compute average loss
      avg_d_loss += d_loss / n_samples * batch_size
      avg_d_loss_real += d_loss_real / n_samples * batch_size
      avg_d_loss_fake += d_loss_fake / n_samples * batch_size
      avg_q_loss += g_loss / n_samples * batch_size
      avg_vae_loss += vae_loss / n_samples * batch_size
      avg_d_real_accuracy += d_real_accuracy / n_samples * batch_size
      avg_d_fake_accuracy += d_fake_accuracy / n_samples * batch_size
      avg_g_accuracy += g_accuracy / n_samples * batch_size

    # Display logs per epoch step
    if epoch >= 0:
      print "Epoch:", '%04d' % (epoch), \
            "avg_d_loss=", "{:.6f}".format(avg_d_loss), \
            "avg_d_real=", "{:.6f}".format(avg_d_loss_real), \
            "avg_d_fake=", "{:.6f}".format(avg_d_loss_fake), \
            "avg_q_loss=", "{:.6f}".format(avg_q_loss), \
            "d_real_accuracy=", "{:.2f}".format(avg_d_real_accuracy), \
            "d_fake_accuracy=", "{:.2f}".format(avg_d_fake_accuracy), \
            "g_accuracy=", "{:.2f}".format(avg_g_accuracy), \
            "avg_vae_loss=", "{:.6f}".format(avg_vae_loss)

    # save model
    if epoch >= 0 and epoch % checkpoint_step == 0:
      checkpoint_path = os.path.join('save', 'model.ckpt')
      cppnvae.save_model(checkpoint_path, epoch)
      print "model saved to {}".format(checkpoint_path)

  # save model one last time, under zero label to denote finish.
  cppnvae.save_model(checkpoint_path, 0)

if __name__ == '__main__':
  main()