from tensorflow.keras.datasets import imdb
(train_input, train_target), (test_input, test_target) = imdb.load_data(num_words=500)

/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/framework/dtypes.py:516: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/framework/dtypes.py:517: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/framework/dtypes.py:518: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/framework/dtypes.py:519: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/framework/dtypes.py:520: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/framework/dtypes.py:525: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  np_resource = np.dtype([("resource", np.ubyte, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorboard/compat/tensorflow_stub/dtypes.py:541: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorboard/compat/tensorflow_stub/dtypes.py:542: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorboard/compat/tensorflow_stub/dtypes.py:543: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorboard/compat/tensorflow_stub/dtypes.py:544: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorboard/compat/tensorflow_stub/dtypes.py:545: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorboard/compat/tensorflow_stub/dtypes.py:550: FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / '(1,)type'.
  np_resource = np.dtype([("resource", np.ubyte, 1)])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/keras/datasets/imdb.py:128: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
  x_train, y_train = np.array(xs[:idx]), np.array(labels[:idx])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/keras/datasets/imdb.py:129: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
  x_test, y_test = np.array(xs[idx:]), np.array(labels[idx:])


print(train_input.shape, test_input.shape)

(25000,) (25000,)


print(len(train_input[0]))

218


print(len(train_input[1]))

189


print(train_input[0])

[1, 14, 22, 16, 43, 2, 2, 2, 2, 65, 458, 2, 66, 2, 4, 173, 36, 256, 5, 25, 100, 43, 2, 112, 50, 2, 2, 9, 35, 480, 284, 5, 150, 4, 172, 112, 167, 2, 336, 385, 39, 4, 172, 2, 2, 17, 2, 38, 13, 447, 4, 192, 50, 16, 6, 147, 2, 19, 14, 22, 4, 2, 2, 469, 4, 22, 71, 87, 12, 16, 43, 2, 38, 76, 15, 13, 2, 4, 22, 17, 2, 17, 12, 16, 2, 18, 2, 5, 62, 386, 12, 8, 316, 8, 106, 5, 4, 2, 2, 16, 480, 66, 2, 33, 4, 130, 12, 16, 38, 2, 5, 25, 124, 51, 36, 135, 48, 25, 2, 33, 6, 22, 12, 215, 28, 77, 52, 5, 14, 407, 16, 82, 2, 8, 4, 107, 117, 2, 15, 256, 4, 2, 7, 2, 5, 2, 36, 71, 43, 2, 476, 26, 400, 317, 46, 7, 4, 2, 2, 13, 104, 88, 4, 381, 15, 297, 98, 32, 2, 56, 26, 141, 6, 194, 2, 18, 4, 226, 22, 21, 134, 476, 26, 480, 5, 144, 30, 2, 18, 51, 36, 28, 224, 92, 25, 104, 4, 226, 65, 16, 38, 2, 88, 12, 16, 283, 5, 16, 2, 113, 103, 32, 15, 16, 2, 19, 178, 32]


print(train_target[:20])

[1 0 0 1 0 0 1 0 1 0 1 0 0 0 0 0 1 1 0 1]


from sklearn.model_selection import train_test_split
train_input, val_input, train_target, val_target = train_test_split(
    train_input, train_target, test_size=0.2, random_state=42)


import numpy as np
lengths = np.array([len(x) for x in train_input])


print(np.mean(lengths), np.median(lengths))

239.00925 178.0


import matplotlib.pyplot as plt
plt.hist(lengths)
plt.xlabel('length')
plt.ylabel('frequency')
plt.show()


from tensorflow.keras.preprocessing.sequence import pad_sequences
train_seq = pad_sequences(train_input, maxlen=100)


print(train_seq.shape)

(20000, 100)


print(train_seq[0])

[ 10   4  20   9   2 364 352   5  45   6   2   2  33 269   8   2 142   2
   5   2  17  73  17 204   5   2  19  55   2   2  92  66 104  14  20  93
  76   2 151  33   4  58  12 188   2 151  12 215  69 224 142  73 237   6
   2   7   2   2 188   2 103  14  31  10  10 451   7   2   5   2  80  91
   2  30   2  34  14  20 151  50  26 131  49   2  84  46  50  37  80  79
   6   2  46   7  14  20  10  10 470 158]


print(train_input[0][-10:])

[6, 2, 46, 7, 14, 20, 10, 10, 470, 158]


print(train_seq[5])

[  0   0   0   0   1   2 195  19  49   2   2 190   4   2 352   2 183  10
  10  13  82  79   4   2  36  71 269   8   2  25  19  49   7   4   2   2
   2   2   2  10  10  48  25  40   2  11   2   2  40   2   2   5   4   2
   2  95  14 238  56 129   2  10  10  21   2  94 364 352   2   2  11 190
  24 484   2   7  94 205 405  10  10  87   2  34  49   2   7   2   2   2
   2   2 290   2  46  48  64  18   4   2]


val_seq = pad_sequences(val_input, maxlen=100)


from tensorflow import keras
model = keras.Sequential()
model.add(keras.layers.SimpleRNN(8, input_shape=(100,500)))
model.add(keras.layers.Dense(1, activation='sigmoid'))

WARNING:tensorflow:From /home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/ops/init_ops.py:1251: calling VarianceScaling.__init__ (from tensorflow.python.ops.init_ops) with dtype is deprecated and will be removed in a future version.
Instructions for updating:
Call initializer instance with the dtype argument instead of passing it to the constructor


train_oh = keras.utils.to_categorical(train_seq)


print(train_oh.shape)

(20000, 100, 500)


print(train_oh[0][0][:12])

[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 0.]


print(np.sum(train_oh[0][0]))

1.0


val_oh = keras.utils.to_categorical(val_seq)


model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
simple_rnn (SimpleRNN)       (None, 8)                 4072      
_________________________________________________________________
dense (Dense)                (None, 1)                 9         
=================================================================
Total params: 4,081
Trainable params: 4,081
Non-trainable params: 0
_________________________________________________________________


rmsprop = keras.optimizers.RMSprop(learning_rate=1e-4)
model.compile(optimizer=rmsprop, loss='binary_crossentropy', 
              metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-simplernn-model.h5', 
                                                save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=3,
                                                  restore_best_weights=True)

history = model.fit(train_oh, train_target, epochs=100, batch_size=64,
                    validation_data=(val_oh, val_target),
                    callbacks=[checkpoint_cb, early_stopping_cb])

WARNING:tensorflow:From /home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/ops/nn_impl.py:180: add_dispatch_support.<locals>.wrapper (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
Train on 20000 samples, validate on 5000 samples
Epoch 1/100
20000/20000 [==============================] - 25s 1ms/sample - loss: 0.6985 - acc: 0.4954 - val_loss: 0.6975 - val_acc: 0.4998
Epoch 2/100
20000/20000 [==============================] - 15s 750us/sample - loss: 0.6955 - acc: 0.5036 - val_loss: 0.6955 - val_acc: 0.5040
Epoch 3/100
20000/20000 [==============================] - 10s 501us/sample - loss: 0.6935 - acc: 0.5094 - val_loss: 0.6940 - val_acc: 0.5042
Epoch 4/100
20000/20000 [==============================] - 9s 466us/sample - loss: 0.6918 - acc: 0.5192 - val_loss: 0.6926 - val_acc: 0.5136
Epoch 5/100
20000/20000 [==============================] - 10s 477us/sample - loss: 0.6896 - acc: 0.5325 - val_loss: 0.6881 - val_acc: 0.5348
Epoch 6/100
20000/20000 [==============================] - 9s 453us/sample - loss: 0.6815 - acc: 0.5755 - val_loss: 0.6788 - val_acc: 0.5870
Epoch 7/100
20000/20000 [==============================] - 9s 453us/sample - loss: 0.6710 - acc: 0.6092 - val_loss: 0.6687 - val_acc: 0.6104
Epoch 8/100
20000/20000 [==============================] - 9s 447us/sample - loss: 0.6569 - acc: 0.6420 - val_loss: 0.6527 - val_acc: 0.6566
Epoch 9/100
20000/20000 [==============================] - 9s 439us/sample - loss: 0.6406 - acc: 0.6740 - val_loss: 0.6365 - val_acc: 0.6776
Epoch 10/100
20000/20000 [==============================] - 9s 434us/sample - loss: 0.6236 - acc: 0.6946 - val_loss: 0.6216 - val_acc: 0.6940
Epoch 11/100
20000/20000 [==============================] - 9s 426us/sample - loss: 0.6065 - acc: 0.7116 - val_loss: 0.6059 - val_acc: 0.7120
Epoch 12/100
20000/20000 [==============================] - 9s 430us/sample - loss: 0.5902 - acc: 0.7257 - val_loss: 0.5912 - val_acc: 0.7218
Epoch 13/100
20000/20000 [==============================] - 9s 464us/sample - loss: 0.5741 - acc: 0.7384 - val_loss: 0.5774 - val_acc: 0.7294
Epoch 14/100
20000/20000 [==============================] - 10s 486us/sample - loss: 0.5585 - acc: 0.7488 - val_loss: 0.5633 - val_acc: 0.7406
Epoch 15/100
20000/20000 [==============================] - 10s 500us/sample - loss: 0.5442 - acc: 0.7569 - val_loss: 0.5513 - val_acc: 0.7482
Epoch 16/100
20000/20000 [==============================] - 9s 475us/sample - loss: 0.5312 - acc: 0.7646 - val_loss: 0.5395 - val_acc: 0.7556
Epoch 17/100
20000/20000 [==============================] - 9s 443us/sample - loss: 0.5191 - acc: 0.7707 - val_loss: 0.5293 - val_acc: 0.7588
Epoch 18/100
20000/20000 [==============================] - 8s 422us/sample - loss: 0.5080 - acc: 0.7761 - val_loss: 0.5188 - val_acc: 0.7684
Epoch 19/100
20000/20000 [==============================] - 9s 461us/sample - loss: 0.4984 - acc: 0.7804 - val_loss: 0.5140 - val_acc: 0.7652
Epoch 20/100
20000/20000 [==============================] - 10s 516us/sample - loss: 0.4893 - acc: 0.7850 - val_loss: 0.5039 - val_acc: 0.7722
Epoch 21/100
20000/20000 [==============================] - 10s 487us/sample - loss: 0.4811 - acc: 0.7879 - val_loss: 0.4970 - val_acc: 0.7780
Epoch 22/100
20000/20000 [==============================] - 10s 513us/sample - loss: 0.4739 - acc: 0.7903 - val_loss: 0.4921 - val_acc: 0.7770
Epoch 23/100
20000/20000 [==============================] - 11s 533us/sample - loss: 0.4670 - acc: 0.7943 - val_loss: 0.4869 - val_acc: 0.7792
Epoch 24/100
20000/20000 [==============================] - 11s 572us/sample - loss: 0.4610 - acc: 0.7941 - val_loss: 0.4817 - val_acc: 0.7806
Epoch 25/100
20000/20000 [==============================] - 12s 576us/sample - loss: 0.4554 - acc: 0.7984 - val_loss: 0.4779 - val_acc: 0.7808
Epoch 26/100
20000/20000 [==============================] - 10s 515us/sample - loss: 0.4500 - acc: 0.8018 - val_loss: 0.4758 - val_acc: 0.7810
Epoch 27/100
20000/20000 [==============================] - 9s 467us/sample - loss: 0.4456 - acc: 0.8030 - val_loss: 0.4722 - val_acc: 0.7830
Epoch 28/100
20000/20000 [==============================] - 10s 480us/sample - loss: 0.4414 - acc: 0.8036 - val_loss: 0.4694 - val_acc: 0.7856
Epoch 29/100
20000/20000 [==============================] - 10s 488us/sample - loss: 0.4377 - acc: 0.8067 - val_loss: 0.4690 - val_acc: 0.7838
Epoch 30/100
20000/20000 [==============================] - 9s 462us/sample - loss: 0.4344 - acc: 0.8073 - val_loss: 0.4660 - val_acc: 0.7858
Epoch 31/100
20000/20000 [==============================] - 10s 476us/sample - loss: 0.4312 - acc: 0.8083 - val_loss: 0.4633 - val_acc: 0.7890
Epoch 32/100
20000/20000 [==============================] - 10s 492us/sample - loss: 0.4284 - acc: 0.8111 - val_loss: 0.4629 - val_acc: 0.7872
Epoch 33/100
20000/20000 [==============================] - 10s 482us/sample - loss: 0.4260 - acc: 0.8130 - val_loss: 0.4599 - val_acc: 0.7912
Epoch 34/100
20000/20000 [==============================] - 9s 450us/sample - loss: 0.4235 - acc: 0.8131 - val_loss: 0.4603 - val_acc: 0.7902
Epoch 35/100
20000/20000 [==============================] - 10s 500us/sample - loss: 0.4213 - acc: 0.8146 - val_loss: 0.4617 - val_acc: 0.7872
Epoch 36/100
20000/20000 [==============================] - 10s 480us/sample - loss: 0.4194 - acc: 0.8159 - val_loss: 0.4569 - val_acc: 0.7894
Epoch 37/100
20000/20000 [==============================] - 9s 428us/sample - loss: 0.4179 - acc: 0.8158 - val_loss: 0.4570 - val_acc: 0.7904
Epoch 38/100
20000/20000 [==============================] - 9s 431us/sample - loss: 0.4161 - acc: 0.8165 - val_loss: 0.4569 - val_acc: 0.7904
Epoch 39/100
20000/20000 [==============================] - 9s 451us/sample - loss: 0.4144 - acc: 0.8184 - val_loss: 0.4570 - val_acc: 0.7900


plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train', 'val'])
plt.show()


model2 = keras.Sequential()
model2.add(keras.layers.Embedding(500, 16, input_length=100))
model2.add(keras.layers.SimpleRNN(8))
model2.add(keras.layers.Dense(1, activation='sigmoid'))

WARNING:tensorflow:From /home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/keras/initializers.py:119: calling RandomUniform.__init__ (from tensorflow.python.ops.init_ops) with dtype is deprecated and will be removed in a future version.
Instructions for updating:
Call initializer instance with the dtype argument instead of passing it to the constructor


model2.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding (Embedding)        (None, 100, 16)           8000      
_________________________________________________________________
simple_rnn_1 (SimpleRNN)     (None, 8)                 200       
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 9         
=================================================================
Total params: 8,209
Trainable params: 8,209
Non-trainable params: 0
_________________________________________________________________


rmsprop = keras.optimizers.RMSprop(learning_rate=1e-4)
model2.compile(optimizer=rmsprop, loss='binary_crossentropy', 
               metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-embedding-model.h5', 
                                                save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=3,
                                                  restore_best_weights=True)

history = model2.fit(train_seq, train_target, epochs=100, batch_size=64,
                     validation_data=(val_seq, val_target),
                     callbacks=[checkpoint_cb, early_stopping_cb])

Train on 20000 samples, validate on 5000 samples
Epoch 1/100
20000/20000 [==============================] - 6s 312us/sample - loss: 0.6953 - acc: 0.5103 - val_loss: 0.6931 - val_acc: 0.5102
Epoch 2/100
20000/20000 [==============================] - 6s 278us/sample - loss: 0.6811 - acc: 0.5796 - val_loss: 0.6717 - val_acc: 0.6300
Epoch 3/100
20000/20000 [==============================] - 6s 279us/sample - loss: 0.6599 - acc: 0.6622 - val_loss: 0.6538 - val_acc: 0.6798
Epoch 4/100
20000/20000 [==============================] - 6s 285us/sample - loss: 0.6407 - acc: 0.7027 - val_loss: 0.6350 - val_acc: 0.7128
Epoch 5/100
20000/20000 [==============================] - 6s 288us/sample - loss: 0.6216 - acc: 0.7285 - val_loss: 0.6190 - val_acc: 0.7248
Epoch 6/100
20000/20000 [==============================] - 6s 280us/sample - loss: 0.6039 - acc: 0.7444 - val_loss: 0.6104 - val_acc: 0.7268
Epoch 7/100
20000/20000 [==============================] - 6s 280us/sample - loss: 0.5869 - acc: 0.7593 - val_loss: 0.5902 - val_acc: 0.7442
Epoch 8/100
20000/20000 [==============================] - 5s 260us/sample - loss: 0.5702 - acc: 0.7656 - val_loss: 0.5789 - val_acc: 0.7424
Epoch 9/100
20000/20000 [==============================] - 5s 274us/sample - loss: 0.5550 - acc: 0.7743 - val_loss: 0.5611 - val_acc: 0.7630
Epoch 10/100
20000/20000 [==============================] - 5s 273us/sample - loss: 0.5404 - acc: 0.7796 - val_loss: 0.5515 - val_acc: 0.7604
Epoch 11/100
20000/20000 [==============================] - 6s 298us/sample - loss: 0.5272 - acc: 0.7864 - val_loss: 0.5397 - val_acc: 0.7658
Epoch 12/100
20000/20000 [==============================] - 6s 280us/sample - loss: 0.5144 - acc: 0.7898 - val_loss: 0.5298 - val_acc: 0.7680
Epoch 13/100
20000/20000 [==============================] - 5s 273us/sample - loss: 0.5039 - acc: 0.7936 - val_loss: 0.5210 - val_acc: 0.7704
Epoch 14/100
20000/20000 [==============================] - 8s 387us/sample - loss: 0.4933 - acc: 0.7970 - val_loss: 0.5140 - val_acc: 0.7734
Epoch 15/100
20000/20000 [==============================] - 6s 286us/sample - loss: 0.4838 - acc: 0.7998 - val_loss: 0.5066 - val_acc: 0.7786
Epoch 16/100
20000/20000 [==============================] - 6s 299us/sample - loss: 0.4758 - acc: 0.8029 - val_loss: 0.5026 - val_acc: 0.7740
Epoch 17/100
20000/20000 [==============================] - 6s 279us/sample - loss: 0.4676 - acc: 0.8050 - val_loss: 0.4949 - val_acc: 0.7800
Epoch 18/100
20000/20000 [==============================] - 5s 271us/sample - loss: 0.4601 - acc: 0.8079 - val_loss: 0.4914 - val_acc: 0.7788
Epoch 19/100
20000/20000 [==============================] - 6s 277us/sample - loss: 0.4541 - acc: 0.8094 - val_loss: 0.4892 - val_acc: 0.7802
Epoch 20/100
20000/20000 [==============================] - 5s 267us/sample - loss: 0.4477 - acc: 0.8122 - val_loss: 0.4872 - val_acc: 0.7798
Epoch 21/100
20000/20000 [==============================] - 5s 260us/sample - loss: 0.4429 - acc: 0.8133 - val_loss: 0.4841 - val_acc: 0.7792
Epoch 22/100
20000/20000 [==============================] - 7s 364us/sample - loss: 0.4377 - acc: 0.8145 - val_loss: 0.4786 - val_acc: 0.7820
Epoch 23/100
20000/20000 [==============================] - 7s 337us/sample - loss: 0.4324 - acc: 0.8163 - val_loss: 0.4771 - val_acc: 0.7842
Epoch 24/100
20000/20000 [==============================] - 6s 284us/sample - loss: 0.4281 - acc: 0.8187 - val_loss: 0.4759 - val_acc: 0.7820
Epoch 25/100
20000/20000 [==============================] - 6s 281us/sample - loss: 0.4246 - acc: 0.8197 - val_loss: 0.4747 - val_acc: 0.7818
Epoch 26/100
20000/20000 [==============================] - 6s 280us/sample - loss: 0.4205 - acc: 0.8224 - val_loss: 0.4733 - val_acc: 0.7838
Epoch 27/100
20000/20000 [==============================] - 6s 282us/sample - loss: 0.4169 - acc: 0.8237 - val_loss: 0.4765 - val_acc: 0.7810
Epoch 28/100
20000/20000 [==============================] - 6s 276us/sample - loss: 0.4141 - acc: 0.8253 - val_loss: 0.4717 - val_acc: 0.7816
Epoch 29/100
20000/20000 [==============================] - 6s 283us/sample - loss: 0.4109 - acc: 0.8253 - val_loss: 0.4754 - val_acc: 0.7820
Epoch 30/100
20000/20000 [==============================] - 6s 277us/sample - loss: 0.4084 - acc: 0.8266 - val_loss: 0.4720 - val_acc: 0.7836
Epoch 31/100
20000/20000 [==============================] - 6s 282us/sample - loss: 0.4062 - acc: 0.8272 - val_loss: 0.4708 - val_acc: 0.7836
Epoch 32/100
20000/20000 [==============================] - 6s 295us/sample - loss: 0.4036 - acc: 0.8283 - val_loss: 0.4725 - val_acc: 0.7816
Epoch 33/100
20000/20000 [==============================] - 6s 282us/sample - loss: 0.4016 - acc: 0.8295 - val_loss: 0.4729 - val_acc: 0.7826
Epoch 34/100
20000/20000 [==============================] - 6s 277us/sample - loss: 0.3993 - acc: 0.8309 - val_loss: 0.4716 - val_acc: 0.7822


plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train', 'val'])
plt.show()


from tensorflow.keras.datasets import imdb
from sklearn.model_selection import train_test_split

(train_input, train_target), (test_input, test_target) = imdb.load_data(num_words=500)

train_input, val_input, train_target, val_target = train_test_split(
    train_input, train_target, test_size=0.2, random_state=42)

/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/keras/datasets/imdb.py:128: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
  x_train, y_train = np.array(xs[:idx]), np.array(labels[:idx])
/home/jaeyoon89/.local/lib/python3.6/site-packages/tensorflow/python/keras/datasets/imdb.py:129: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
  x_test, y_test = np.array(xs[idx:]), np.array(labels[idx:])


from tensorflow.keras.preprocessing.sequence import pad_sequences
train_seq = pad_sequences(train_input, maxlen=100)
val_seq = pad_sequences(val_input, maxlen=100)


from tensorflow import keras
model = keras.Sequential()
model.add(keras.layers.Embedding(500, 16, input_length=100))
model.add(keras.layers.LSTM(8))
model.add(keras.layers.Dense(1, activation='sigmoid'))


model.summary()

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding_1 (Embedding)      (None, 100, 16)           8000      
_________________________________________________________________
lstm (LSTM)                  (None, 8)                 800       
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 9         
=================================================================
Total params: 8,809
Trainable params: 8,809
Non-trainable params: 0
_________________________________________________________________


rmsprop = keras.optimizers.RMSprop(learning_rate=1e-4)
model.compile(optimizer=rmsprop, loss='binary_crossentropy', 
              metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-lstm-model.h5', 
                                                save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=3,
                                                  restore_best_weights=True)

history = model.fit(train_seq, train_target, epochs=100, batch_size=64,
                    validation_data=(val_seq, val_target),
                    callbacks=[checkpoint_cb, early_stopping_cb])

Train on 20000 samples, validate on 5000 samples
Epoch 1/100
20000/20000 [==============================] - 13s 653us/sample - loss: 0.6923 - acc: 0.5436 - val_loss: 0.6912 - val_acc: 0.5882
Epoch 2/100
20000/20000 [==============================] - 14s 686us/sample - loss: 0.6897 - acc: 0.6084 - val_loss: 0.6879 - val_acc: 0.6268
Epoch 3/100
20000/20000 [==============================] - 14s 699us/sample - loss: 0.6842 - acc: 0.6470 - val_loss: 0.6801 - val_acc: 0.6638
Epoch 4/100
20000/20000 [==============================] - 14s 713us/sample - loss: 0.6695 - acc: 0.6804 - val_loss: 0.6548 - val_acc: 0.6976
Epoch 5/100
20000/20000 [==============================] - 15s 768us/sample - loss: 0.6111 - acc: 0.7244 - val_loss: 0.5717 - val_acc: 0.7258
Epoch 6/100
20000/20000 [==============================] - 18s 912us/sample - loss: 0.5526 - acc: 0.7391 - val_loss: 0.5447 - val_acc: 0.7444
Epoch 7/100
20000/20000 [==============================] - 18s 914us/sample - loss: 0.5291 - acc: 0.7566 - val_loss: 0.5267 - val_acc: 0.7542
Epoch 8/100
20000/20000 [==============================] - 18s 920us/sample - loss: 0.5093 - acc: 0.7674 - val_loss: 0.5090 - val_acc: 0.7656
Epoch 9/100
20000/20000 [==============================] - 18s 908us/sample - loss: 0.4925 - acc: 0.7770 - val_loss: 0.4940 - val_acc: 0.7738
Epoch 10/100
20000/20000 [==============================] - 18s 880us/sample - loss: 0.4775 - acc: 0.7875 - val_loss: 0.4828 - val_acc: 0.7786
Epoch 11/100
20000/20000 [==============================] - 18s 911us/sample - loss: 0.4662 - acc: 0.7922 - val_loss: 0.4740 - val_acc: 0.7824
Epoch 12/100
20000/20000 [==============================] - 18s 906us/sample - loss: 0.4561 - acc: 0.7962 - val_loss: 0.4659 - val_acc: 0.7888
Epoch 13/100
20000/20000 [==============================] - 18s 885us/sample - loss: 0.4483 - acc: 0.8005 - val_loss: 0.4611 - val_acc: 0.7862
Epoch 14/100
20000/20000 [==============================] - 18s 889us/sample - loss: 0.4422 - acc: 0.8024 - val_loss: 0.4556 - val_acc: 0.7890
Epoch 15/100
20000/20000 [==============================] - 18s 883us/sample - loss: 0.4368 - acc: 0.8053 - val_loss: 0.4537 - val_acc: 0.7896
Epoch 16/100
20000/20000 [==============================] - 18s 875us/sample - loss: 0.4325 - acc: 0.8092 - val_loss: 0.4492 - val_acc: 0.7906
Epoch 17/100
20000/20000 [==============================] - 18s 890us/sample - loss: 0.4289 - acc: 0.8094 - val_loss: 0.4470 - val_acc: 0.7924
Epoch 18/100
20000/20000 [==============================] - 20s 976us/sample - loss: 0.4256 - acc: 0.8117 - val_loss: 0.4456 - val_acc: 0.7938
Epoch 19/100
20000/20000 [==============================] - 18s 896us/sample - loss: 0.4229 - acc: 0.8130 - val_loss: 0.4443 - val_acc: 0.7940
Epoch 20/100
20000/20000 [==============================] - 19s 966us/sample - loss: 0.4210 - acc: 0.8134 - val_loss: 0.4407 - val_acc: 0.7966
Epoch 21/100
20000/20000 [==============================] - 18s 893us/sample - loss: 0.4185 - acc: 0.8138 - val_loss: 0.4390 - val_acc: 0.7974
Epoch 22/100
20000/20000 [==============================] - 18s 885us/sample - loss: 0.4171 - acc: 0.8144 - val_loss: 0.4390 - val_acc: 0.7974
Epoch 23/100
20000/20000 [==============================] - 18s 904us/sample - loss: 0.4154 - acc: 0.8144 - val_loss: 0.4362 - val_acc: 0.7974
Epoch 24/100
20000/20000 [==============================] - 17s 868us/sample - loss: 0.4136 - acc: 0.8162 - val_loss: 0.4356 - val_acc: 0.7974
Epoch 25/100
20000/20000 [==============================] - 18s 907us/sample - loss: 0.4125 - acc: 0.8145 - val_loss: 0.4336 - val_acc: 0.8002
Epoch 26/100
20000/20000 [==============================] - 18s 902us/sample - loss: 0.4109 - acc: 0.8164 - val_loss: 0.4337 - val_acc: 0.7986
Epoch 27/100
20000/20000 [==============================] - 18s 906us/sample - loss: 0.4097 - acc: 0.8168 - val_loss: 0.4325 - val_acc: 0.7986
Epoch 28/100
20000/20000 [==============================] - 18s 898us/sample - loss: 0.4089 - acc: 0.8166 - val_loss: 0.4316 - val_acc: 0.8004
Epoch 29/100
20000/20000 [==============================] - 17s 865us/sample - loss: 0.4076 - acc: 0.8171 - val_loss: 0.4310 - val_acc: 0.8010
Epoch 30/100
20000/20000 [==============================] - 17s 852us/sample - loss: 0.4068 - acc: 0.8174 - val_loss: 0.4348 - val_acc: 0.7930
Epoch 31/100
20000/20000 [==============================] - 17s 861us/sample - loss: 0.4059 - acc: 0.8173 - val_loss: 0.4291 - val_acc: 0.8030
Epoch 32/100
20000/20000 [==============================] - 17s 846us/sample - loss: 0.4054 - acc: 0.8192 - val_loss: 0.4291 - val_acc: 0.8040
Epoch 33/100
20000/20000 [==============================] - 18s 924us/sample - loss: 0.4044 - acc: 0.8183 - val_loss: 0.4276 - val_acc: 0.8034
Epoch 34/100
20000/20000 [==============================] - 18s 891us/sample - loss: 0.4033 - acc: 0.8193 - val_loss: 0.4270 - val_acc: 0.8034
Epoch 35/100
20000/20000 [==============================] - 19s 927us/sample - loss: 0.4027 - acc: 0.8195 - val_loss: 0.4278 - val_acc: 0.8054
Epoch 36/100
20000/20000 [==============================] - 19s 932us/sample - loss: 0.4018 - acc: 0.8201 - val_loss: 0.4273 - val_acc: 0.8036
Epoch 37/100
20000/20000 [==============================] - 18s 906us/sample - loss: 0.4012 - acc: 0.8207 - val_loss: 0.4261 - val_acc: 0.8036
Epoch 38/100
20000/20000 [==============================] - 17s 873us/sample - loss: 0.4004 - acc: 0.8213 - val_loss: 0.4248 - val_acc: 0.8056
Epoch 39/100
20000/20000 [==============================] - 18s 896us/sample - loss: 0.3996 - acc: 0.8221 - val_loss: 0.4247 - val_acc: 0.8056
Epoch 40/100
20000/20000 [==============================] - 18s 916us/sample - loss: 0.3988 - acc: 0.8205 - val_loss: 0.4244 - val_acc: 0.8056
Epoch 41/100
20000/20000 [==============================] - 18s 907us/sample - loss: 0.3986 - acc: 0.8202 - val_loss: 0.4253 - val_acc: 0.8042
Epoch 42/100
20000/20000 [==============================] - 20s 985us/sample - loss: 0.3979 - acc: 0.8210 - val_loss: 0.4255 - val_acc: 0.8052
Epoch 43/100
20000/20000 [==============================] - 18s 898us/sample - loss: 0.3973 - acc: 0.8217 - val_loss: 0.4234 - val_acc: 0.8064
Epoch 44/100
20000/20000 [==============================] - 18s 914us/sample - loss: 0.3964 - acc: 0.8220 - val_loss: 0.4236 - val_acc: 0.8074
Epoch 45/100
20000/20000 [==============================] - 19s 942us/sample - loss: 0.3960 - acc: 0.8213 - val_loss: 0.4231 - val_acc: 0.8084
Epoch 46/100
20000/20000 [==============================] - 18s 916us/sample - loss: 0.3953 - acc: 0.8215 - val_loss: 0.4232 - val_acc: 0.8070
Epoch 47/100
20000/20000 [==============================] - 18s 899us/sample - loss: 0.3944 - acc: 0.8231 - val_loss: 0.4228 - val_acc: 0.8074
Epoch 48/100
20000/20000 [==============================] - 18s 886us/sample - loss: 0.3939 - acc: 0.8220 - val_loss: 0.4228 - val_acc: 0.8068
Epoch 49/100
20000/20000 [==============================] - 18s 904us/sample - loss: 0.3935 - acc: 0.8216 - val_loss: 0.4209 - val_acc: 0.8086
Epoch 50/100
20000/20000 [==============================] - 18s 900us/sample - loss: 0.3928 - acc: 0.8228 - val_loss: 0.4216 - val_acc: 0.8076
Epoch 51/100
20000/20000 [==============================] - 18s 876us/sample - loss: 0.3924 - acc: 0.8239 - val_loss: 0.4235 - val_acc: 0.8066
Epoch 52/100
20000/20000 [==============================] - 18s 901us/sample - loss: 0.3918 - acc: 0.8249 - val_loss: 0.4205 - val_acc: 0.8074
Epoch 53/100
20000/20000 [==============================] - 19s 941us/sample - loss: 0.3909 - acc: 0.8231 - val_loss: 0.4214 - val_acc: 0.8078
Epoch 54/100
20000/20000 [==============================] - 18s 900us/sample - loss: 0.3906 - acc: 0.8255 - val_loss: 0.4201 - val_acc: 0.8078
Epoch 55/100
20000/20000 [==============================] - 18s 885us/sample - loss: 0.3900 - acc: 0.8246 - val_loss: 0.4220 - val_acc: 0.8072
Epoch 56/100
20000/20000 [==============================] - 17s 847us/sample - loss: 0.3890 - acc: 0.8257 - val_loss: 0.4202 - val_acc: 0.8082
Epoch 57/100
20000/20000 [==============================] - 17s 848us/sample - loss: 0.3891 - acc: 0.8243 - val_loss: 0.4197 - val_acc: 0.8070
Epoch 58/100
20000/20000 [==============================] - 17s 838us/sample - loss: 0.3884 - acc: 0.8251 - val_loss: 0.4216 - val_acc: 0.8074
Epoch 59/100
20000/20000 [==============================] - 17s 843us/sample - loss: 0.3878 - acc: 0.8248 - val_loss: 0.4214 - val_acc: 0.8074
Epoch 60/100
20000/20000 [==============================] - 18s 890us/sample - loss: 0.3870 - acc: 0.8257 - val_loss: 0.4213 - val_acc: 0.8052


import matplotlib.pyplot as plt
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train','val'])
plt.show()


model2 = keras.Sequential()

model2.add(keras.layers.Embedding(500, 16, input_length=100))
model2.add(keras.layers.LSTM(8, dropout=0.3))
model2.add(keras.layers.Dense(1, activation='sigmoid'))


rmsprop = keras.optimizers.RMSprop(learning_rate=1e-4)
model2.compile(optimizer=rmsprop, loss='binary_crossentropy', 
               metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-dropout-model.h5', 
                                                save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=3,
                                                  restore_best_weights=True)

history = model2.fit(train_seq, train_target, epochs=100, batch_size=64,
                     validation_data=(val_seq, val_target),
                     callbacks=[checkpoint_cb, early_stopping_cb])

Train on 20000 samples, validate on 5000 samples
Epoch 1/100
20000/20000 [==============================] - 22s 1ms/sample - loss: 0.6929 - acc: 0.5145 - val_loss: 0.6924 - val_acc: 0.5492
Epoch 2/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.6914 - acc: 0.5706 - val_loss: 0.6906 - val_acc: 0.6042
Epoch 3/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.6883 - acc: 0.6147 - val_loss: 0.6853 - val_acc: 0.6636
Epoch 4/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.6749 - acc: 0.6474 - val_loss: 0.6507 - val_acc: 0.7004
Epoch 5/100
20000/20000 [==============================] - 19s 946us/sample - loss: 0.6342 - acc: 0.6816 - val_loss: 0.6142 - val_acc: 0.7076
Epoch 6/100
20000/20000 [==============================] - 19s 973us/sample - loss: 0.6066 - acc: 0.7076 - val_loss: 0.5899 - val_acc: 0.7288
Epoch 7/100
20000/20000 [==============================] - 19s 957us/sample - loss: 0.5849 - acc: 0.7265 - val_loss: 0.5714 - val_acc: 0.7368
Epoch 8/100
20000/20000 [==============================] - 19s 951us/sample - loss: 0.5670 - acc: 0.7390 - val_loss: 0.5562 - val_acc: 0.7474
Epoch 9/100
20000/20000 [==============================] - 19s 957us/sample - loss: 0.5490 - acc: 0.7529 - val_loss: 0.5394 - val_acc: 0.7618
Epoch 10/100
20000/20000 [==============================] - 19s 950us/sample - loss: 0.5330 - acc: 0.7621 - val_loss: 0.5259 - val_acc: 0.7670
Epoch 11/100
20000/20000 [==============================] - 19s 955us/sample - loss: 0.5177 - acc: 0.7693 - val_loss: 0.5105 - val_acc: 0.7750
Epoch 12/100
20000/20000 [==============================] - 20s 977us/sample - loss: 0.5012 - acc: 0.7793 - val_loss: 0.4988 - val_acc: 0.7768
Epoch 13/100
20000/20000 [==============================] - 19s 940us/sample - loss: 0.4912 - acc: 0.7835 - val_loss: 0.4863 - val_acc: 0.7822
Epoch 14/100
20000/20000 [==============================] - 19s 949us/sample - loss: 0.4794 - acc: 0.7898 - val_loss: 0.4769 - val_acc: 0.7888
Epoch 15/100
20000/20000 [==============================] - 19s 957us/sample - loss: 0.4694 - acc: 0.7940 - val_loss: 0.4698 - val_acc: 0.7908
Epoch 16/100
20000/20000 [==============================] - 19s 941us/sample - loss: 0.4613 - acc: 0.7963 - val_loss: 0.4622 - val_acc: 0.7936
Epoch 17/100
20000/20000 [==============================] - 19s 956us/sample - loss: 0.4539 - acc: 0.7996 - val_loss: 0.4573 - val_acc: 0.7970
Epoch 18/100
20000/20000 [==============================] - 19s 952us/sample - loss: 0.4472 - acc: 0.8016 - val_loss: 0.4532 - val_acc: 0.7950
Epoch 19/100
20000/20000 [==============================] - 19s 956us/sample - loss: 0.4439 - acc: 0.8030 - val_loss: 0.4490 - val_acc: 0.7970
Epoch 20/100
20000/20000 [==============================] - 19s 954us/sample - loss: 0.4380 - acc: 0.8049 - val_loss: 0.4454 - val_acc: 0.7980
Epoch 21/100
20000/20000 [==============================] - 19s 945us/sample - loss: 0.4356 - acc: 0.8039 - val_loss: 0.4459 - val_acc: 0.7958
Epoch 22/100
20000/20000 [==============================] - 19s 965us/sample - loss: 0.4320 - acc: 0.8069 - val_loss: 0.4420 - val_acc: 0.7996
Epoch 23/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4305 - acc: 0.8062 - val_loss: 0.4404 - val_acc: 0.7998
Epoch 24/100
20000/20000 [==============================] - 19s 953us/sample - loss: 0.4269 - acc: 0.8080 - val_loss: 0.4384 - val_acc: 0.8018
Epoch 25/100
20000/20000 [==============================] - 19s 955us/sample - loss: 0.4257 - acc: 0.8095 - val_loss: 0.4376 - val_acc: 0.8000
Epoch 26/100
20000/20000 [==============================] - 19s 954us/sample - loss: 0.4243 - acc: 0.8081 - val_loss: 0.4388 - val_acc: 0.8018
Epoch 27/100
20000/20000 [==============================] - 19s 954us/sample - loss: 0.4209 - acc: 0.8096 - val_loss: 0.4358 - val_acc: 0.8002
Epoch 28/100
20000/20000 [==============================] - 19s 962us/sample - loss: 0.4226 - acc: 0.8087 - val_loss: 0.4346 - val_acc: 0.7998
Epoch 29/100
20000/20000 [==============================] - 19s 947us/sample - loss: 0.4210 - acc: 0.8093 - val_loss: 0.4346 - val_acc: 0.7986
Epoch 30/100
20000/20000 [==============================] - 19s 951us/sample - loss: 0.4189 - acc: 0.8127 - val_loss: 0.4340 - val_acc: 0.8006
Epoch 31/100
20000/20000 [==============================] - 19s 961us/sample - loss: 0.4177 - acc: 0.8110 - val_loss: 0.4331 - val_acc: 0.8002
Epoch 32/100
20000/20000 [==============================] - 19s 955us/sample - loss: 0.4167 - acc: 0.8126 - val_loss: 0.4324 - val_acc: 0.7992
Epoch 33/100
20000/20000 [==============================] - 19s 967us/sample - loss: 0.4161 - acc: 0.8116 - val_loss: 0.4318 - val_acc: 0.8012
Epoch 34/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.4142 - acc: 0.8130 - val_loss: 0.4327 - val_acc: 0.8010
Epoch 35/100
20000/20000 [==============================] - 19s 958us/sample - loss: 0.4146 - acc: 0.8127 - val_loss: 0.4327 - val_acc: 0.8030
Epoch 36/100
20000/20000 [==============================] - 19s 945us/sample - loss: 0.4130 - acc: 0.8134 - val_loss: 0.4317 - val_acc: 0.8044
Epoch 37/100
20000/20000 [==============================] - 19s 963us/sample - loss: 0.4114 - acc: 0.8136 - val_loss: 0.4318 - val_acc: 0.8032
Epoch 38/100
20000/20000 [==============================] - 19s 944us/sample - loss: 0.4118 - acc: 0.8141 - val_loss: 0.4339 - val_acc: 0.8016
Epoch 39/100
20000/20000 [==============================] - 19s 957us/sample - loss: 0.4119 - acc: 0.8127 - val_loss: 0.4309 - val_acc: 0.8040
Epoch 40/100
20000/20000 [==============================] - 19s 949us/sample - loss: 0.4107 - acc: 0.8128 - val_loss: 0.4304 - val_acc: 0.8026
Epoch 41/100
20000/20000 [==============================] - 19s 955us/sample - loss: 0.4112 - acc: 0.8127 - val_loss: 0.4313 - val_acc: 0.8008
Epoch 42/100
20000/20000 [==============================] - 20s 990us/sample - loss: 0.4107 - acc: 0.8133 - val_loss: 0.4306 - val_acc: 0.8024
Epoch 43/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.4087 - acc: 0.8154 - val_loss: 0.4301 - val_acc: 0.8020
Epoch 44/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4099 - acc: 0.8145 - val_loss: 0.4307 - val_acc: 0.8030
Epoch 45/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.4096 - acc: 0.8139 - val_loss: 0.4301 - val_acc: 0.8018
Epoch 46/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4078 - acc: 0.8143 - val_loss: 0.4301 - val_acc: 0.8024
Epoch 47/100
20000/20000 [==============================] - 20s 989us/sample - loss: 0.4078 - acc: 0.8136 - val_loss: 0.4295 - val_acc: 0.8030
Epoch 48/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.4079 - acc: 0.8141 - val_loss: 0.4289 - val_acc: 0.8016
Epoch 49/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4053 - acc: 0.8156 - val_loss: 0.4307 - val_acc: 0.8024
Epoch 50/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4070 - acc: 0.8137 - val_loss: 0.4324 - val_acc: 0.8036
Epoch 51/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4061 - acc: 0.8137 - val_loss: 0.4287 - val_acc: 0.8042
Epoch 52/100
20000/20000 [==============================] - 20s 997us/sample - loss: 0.4054 - acc: 0.8156 - val_loss: 0.4300 - val_acc: 0.8022
Epoch 53/100
20000/20000 [==============================] - 21s 1ms/sample - loss: 0.4063 - acc: 0.8156 - val_loss: 0.4289 - val_acc: 0.8034
Epoch 54/100
20000/20000 [==============================] - 20s 1ms/sample - loss: 0.4056 - acc: 0.8158 - val_loss: 0.4299 - val_acc: 0.8030


plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train','val'])
plt.show()


model3 = keras.Sequential()

model3.add(keras.layers.Embedding(500, 16, input_length=100))
model3.add(keras.layers.LSTM(8, dropout=0.3, return_sequences=True))
model3.add(keras.layers.LSTM(8, dropout=0.3))
model3.add(keras.layers.Dense(1, activation='sigmoid'))

model3.summary()

Model: "sequential_5"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding_3 (Embedding)      (None, 100, 16)           8000      
_________________________________________________________________
lstm_2 (LSTM)                (None, 100, 8)            800       
_________________________________________________________________
lstm_3 (LSTM)                (None, 8)                 544       
_________________________________________________________________
dense_4 (Dense)              (None, 1)                 9         
=================================================================
Total params: 9,353
Trainable params: 9,353
Non-trainable params: 0
_________________________________________________________________


rmsprop = keras.optimizers.RMSprop(learning_rate=1e-4)
model3.compile(optimizer=rmsprop, loss='binary_crossentropy', 
               metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-2rnn-model.h5', 
                                                save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=3,
                                                  restore_best_weights=True)

history = model3.fit(train_seq, train_target, epochs=100, batch_size=64,
                     validation_data=(val_seq, val_target),
                     callbacks=[checkpoint_cb, early_stopping_cb])

Train on 20000 samples, validate on 5000 samples
Epoch 1/100
20000/20000 [==============================] - 32s 2ms/sample - loss: 0.6930 - acc: 0.5193 - val_loss: 0.6928 - val_acc: 0.5490
Epoch 2/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.6922 - acc: 0.5477 - val_loss: 0.6916 - val_acc: 0.5946
Epoch 3/100
20000/20000 [==============================] - 37s 2ms/sample - loss: 0.6897 - acc: 0.5845 - val_loss: 0.6873 - val_acc: 0.6514
Epoch 4/100
20000/20000 [==============================] - 37s 2ms/sample - loss: 0.6791 - acc: 0.6323 - val_loss: 0.6662 - val_acc: 0.6902
Epoch 5/100
20000/20000 [==============================] - 37s 2ms/sample - loss: 0.6316 - acc: 0.6801 - val_loss: 0.5903 - val_acc: 0.7204
Epoch 6/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.5796 - acc: 0.7128 - val_loss: 0.5534 - val_acc: 0.7336
Epoch 7/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.5465 - acc: 0.7355 - val_loss: 0.5298 - val_acc: 0.7452
Epoch 8/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.5260 - acc: 0.7487 - val_loss: 0.5174 - val_acc: 0.7490
Epoch 9/100
20000/20000 [==============================] - 37s 2ms/sample - loss: 0.5132 - acc: 0.7570 - val_loss: 0.5015 - val_acc: 0.7622
Epoch 10/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.5012 - acc: 0.7650 - val_loss: 0.4940 - val_acc: 0.7656
Epoch 11/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4924 - acc: 0.7714 - val_loss: 0.4848 - val_acc: 0.7714
Epoch 12/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4834 - acc: 0.7768 - val_loss: 0.4784 - val_acc: 0.7728
Epoch 13/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4772 - acc: 0.7783 - val_loss: 0.4741 - val_acc: 0.7742
Epoch 14/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4716 - acc: 0.7840 - val_loss: 0.4732 - val_acc: 0.7760
Epoch 15/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4656 - acc: 0.7875 - val_loss: 0.4655 - val_acc: 0.7820
Epoch 16/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4618 - acc: 0.7889 - val_loss: 0.4632 - val_acc: 0.7854
Epoch 17/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4579 - acc: 0.7909 - val_loss: 0.4641 - val_acc: 0.7840
Epoch 18/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4536 - acc: 0.7932 - val_loss: 0.4616 - val_acc: 0.7856
Epoch 19/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4523 - acc: 0.7943 - val_loss: 0.4590 - val_acc: 0.7848
Epoch 20/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4497 - acc: 0.7968 - val_loss: 0.4539 - val_acc: 0.7892
Epoch 21/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4467 - acc: 0.7981 - val_loss: 0.4555 - val_acc: 0.7866
Epoch 22/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4459 - acc: 0.7965 - val_loss: 0.4541 - val_acc: 0.7898
Epoch 23/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4439 - acc: 0.8001 - val_loss: 0.4500 - val_acc: 0.7902
Epoch 24/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4418 - acc: 0.8019 - val_loss: 0.4497 - val_acc: 0.7894
Epoch 25/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4413 - acc: 0.8025 - val_loss: 0.4490 - val_acc: 0.7906
Epoch 26/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4388 - acc: 0.8026 - val_loss: 0.4456 - val_acc: 0.7918
Epoch 27/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4364 - acc: 0.8038 - val_loss: 0.4444 - val_acc: 0.7924
Epoch 28/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4361 - acc: 0.8022 - val_loss: 0.4446 - val_acc: 0.7930
Epoch 29/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4342 - acc: 0.8019 - val_loss: 0.4432 - val_acc: 0.7928
Epoch 30/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4320 - acc: 0.8062 - val_loss: 0.4414 - val_acc: 0.7936
Epoch 31/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4329 - acc: 0.8053 - val_loss: 0.4428 - val_acc: 0.7962
Epoch 32/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4310 - acc: 0.8053 - val_loss: 0.4412 - val_acc: 0.7962
Epoch 33/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4296 - acc: 0.8059 - val_loss: 0.4400 - val_acc: 0.7970
Epoch 34/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4287 - acc: 0.8061 - val_loss: 0.4391 - val_acc: 0.7974
Epoch 35/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4274 - acc: 0.8084 - val_loss: 0.4397 - val_acc: 0.7968
Epoch 36/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4268 - acc: 0.8070 - val_loss: 0.4381 - val_acc: 0.7972
Epoch 37/100
20000/20000 [==============================] - 37s 2ms/sample - loss: 0.4249 - acc: 0.8081 - val_loss: 0.4369 - val_acc: 0.7992
Epoch 38/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4258 - acc: 0.8069 - val_loss: 0.4357 - val_acc: 0.7990
Epoch 39/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4245 - acc: 0.8086 - val_loss: 0.4348 - val_acc: 0.7998
Epoch 40/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4232 - acc: 0.8098 - val_loss: 0.4362 - val_acc: 0.8020
Epoch 41/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4243 - acc: 0.8105 - val_loss: 0.4341 - val_acc: 0.8022
Epoch 42/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4212 - acc: 0.8108 - val_loss: 0.4379 - val_acc: 0.7920
Epoch 43/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4193 - acc: 0.8120 - val_loss: 0.4339 - val_acc: 0.7996
Epoch 44/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4195 - acc: 0.8102 - val_loss: 0.4315 - val_acc: 0.8022
Epoch 45/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4185 - acc: 0.8106 - val_loss: 0.4343 - val_acc: 0.8044
Epoch 46/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4158 - acc: 0.8138 - val_loss: 0.4324 - val_acc: 0.7980
Epoch 47/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4163 - acc: 0.8148 - val_loss: 0.4299 - val_acc: 0.8024
Epoch 48/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4151 - acc: 0.8131 - val_loss: 0.4353 - val_acc: 0.8014
Epoch 49/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4142 - acc: 0.8133 - val_loss: 0.4295 - val_acc: 0.8016
Epoch 50/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4165 - acc: 0.8125 - val_loss: 0.4284 - val_acc: 0.8030
Epoch 51/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4112 - acc: 0.8158 - val_loss: 0.4275 - val_acc: 0.8030
Epoch 52/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4128 - acc: 0.8118 - val_loss: 0.4264 - val_acc: 0.8042
Epoch 53/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4110 - acc: 0.8159 - val_loss: 0.4289 - val_acc: 0.8006
Epoch 54/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4111 - acc: 0.8163 - val_loss: 0.4261 - val_acc: 0.8018
Epoch 55/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4095 - acc: 0.8181 - val_loss: 0.4258 - val_acc: 0.8034
Epoch 56/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4073 - acc: 0.8157 - val_loss: 0.4267 - val_acc: 0.8058
Epoch 57/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4069 - acc: 0.8169 - val_loss: 0.4257 - val_acc: 0.8054
Epoch 58/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4067 - acc: 0.8174 - val_loss: 0.4258 - val_acc: 0.8048
Epoch 59/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4070 - acc: 0.8170 - val_loss: 0.4248 - val_acc: 0.8050
Epoch 60/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4084 - acc: 0.8150 - val_loss: 0.4250 - val_acc: 0.8070
Epoch 61/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4074 - acc: 0.8172 - val_loss: 0.4240 - val_acc: 0.8062
Epoch 62/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4034 - acc: 0.8162 - val_loss: 0.4237 - val_acc: 0.8048
Epoch 63/100
20000/20000 [==============================] - 35s 2ms/sample - loss: 0.4044 - acc: 0.8170 - val_loss: 0.4265 - val_acc: 0.8058
Epoch 64/100
20000/20000 [==============================] - 36s 2ms/sample - loss: 0.4054 - acc: 0.8160 - val_loss: 0.4248 - val_acc: 0.8052
Epoch 65/100
20000/20000 [==============================] - 39s 2ms/sample - loss: 0.4024 - acc: 0.8174 - val_loss: 0.4244 - val_acc: 0.8042


plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train', 'val'])
plt.show()


model4 = keras.Sequential()

model4.add(keras.layers.Embedding(500, 16, input_length=100))
model4.add(keras.layers.GRU(8))
model4.add(keras.layers.Dense(1, activation='sigmoid'))

model4.summary()

Model: "sequential_6"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding_4 (Embedding)      (None, 100, 16)           8000      
_________________________________________________________________
gru (GRU)                    (None, 8)                 600       
_________________________________________________________________
dense_5 (Dense)              (None, 1)                 9         
=================================================================
Total params: 8,609
Trainable params: 8,609
Non-trainable params: 0
_________________________________________________________________


rmsprop = keras.optimizers.RMSprop(learning_rate=1e-4)
model4.compile(optimizer=rmsprop, loss='binary_crossentropy', 
               metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-gru-model.h5', 
                                                save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=3,
                                                  restore_best_weights=True)

history = model4.fit(train_seq, train_target, epochs=100, batch_size=64,
                     validation_data=(val_seq, val_target),
                     callbacks=[checkpoint_cb, early_stopping_cb])

Train on 20000 samples, validate on 5000 samples
Epoch 1/100
20000/20000 [==============================] - 18s 878us/sample - loss: 0.6925 - acc: 0.5300 - val_loss: 0.6918 - val_acc: 0.5476
Epoch 2/100
20000/20000 [==============================] - 16s 798us/sample - loss: 0.6905 - acc: 0.5788 - val_loss: 0.6894 - val_acc: 0.5822
Epoch 3/100
20000/20000 [==============================] - 16s 775us/sample - loss: 0.6870 - acc: 0.6014 - val_loss: 0.6853 - val_acc: 0.6022
Epoch 4/100
20000/20000 [==============================] - 15s 745us/sample - loss: 0.6810 - acc: 0.6193 - val_loss: 0.6782 - val_acc: 0.6142
Epoch 5/100
20000/20000 [==============================] - 15s 752us/sample - loss: 0.6713 - acc: 0.6324 - val_loss: 0.6672 - val_acc: 0.6230
Epoch 6/100
20000/20000 [==============================] - 15s 746us/sample - loss: 0.6562 - acc: 0.6478 - val_loss: 0.6505 - val_acc: 0.6390
Epoch 7/100
20000/20000 [==============================] - 15s 749us/sample - loss: 0.6342 - acc: 0.6654 - val_loss: 0.6255 - val_acc: 0.6638
Epoch 8/100
20000/20000 [==============================] - 15s 753us/sample - loss: 0.5996 - acc: 0.6898 - val_loss: 0.5855 - val_acc: 0.7016
Epoch 9/100
20000/20000 [==============================] - 15s 762us/sample - loss: 0.5470 - acc: 0.7258 - val_loss: 0.5333 - val_acc: 0.7372
Epoch 10/100
20000/20000 [==============================] - 15s 756us/sample - loss: 0.5086 - acc: 0.7517 - val_loss: 0.5106 - val_acc: 0.7508
Epoch 11/100
20000/20000 [==============================] - 15s 754us/sample - loss: 0.4898 - acc: 0.7685 - val_loss: 0.4986 - val_acc: 0.7562
Epoch 12/100
20000/20000 [==============================] - 15s 760us/sample - loss: 0.4772 - acc: 0.7743 - val_loss: 0.4837 - val_acc: 0.7736
Epoch 13/100
20000/20000 [==============================] - 15s 764us/sample - loss: 0.4659 - acc: 0.7808 - val_loss: 0.4744 - val_acc: 0.7748
Epoch 14/100
20000/20000 [==============================] - 15s 760us/sample - loss: 0.4575 - acc: 0.7864 - val_loss: 0.4672 - val_acc: 0.7794
Epoch 15/100
20000/20000 [==============================] - 15s 764us/sample - loss: 0.4498 - acc: 0.7920 - val_loss: 0.4623 - val_acc: 0.7826
Epoch 16/100
20000/20000 [==============================] - 16s 800us/sample - loss: 0.4439 - acc: 0.7949 - val_loss: 0.4575 - val_acc: 0.7852
Epoch 17/100
20000/20000 [==============================] - 15s 758us/sample - loss: 0.4394 - acc: 0.8003 - val_loss: 0.4540 - val_acc: 0.7838
Epoch 18/100
20000/20000 [==============================] - 15s 756us/sample - loss: 0.4353 - acc: 0.8012 - val_loss: 0.4509 - val_acc: 0.7878
Epoch 19/100
20000/20000 [==============================] - 15s 772us/sample - loss: 0.4322 - acc: 0.8043 - val_loss: 0.4487 - val_acc: 0.7888
Epoch 20/100
20000/20000 [==============================] - 15s 757us/sample - loss: 0.4295 - acc: 0.8037 - val_loss: 0.4492 - val_acc: 0.7952
Epoch 21/100
20000/20000 [==============================] - 15s 758us/sample - loss: 0.4274 - acc: 0.8066 - val_loss: 0.4465 - val_acc: 0.7912
Epoch 22/100
20000/20000 [==============================] - 15s 756us/sample - loss: 0.4254 - acc: 0.8073 - val_loss: 0.4543 - val_acc: 0.7948
Epoch 23/100
20000/20000 [==============================] - 15s 763us/sample - loss: 0.4238 - acc: 0.8081 - val_loss: 0.4466 - val_acc: 0.7952
Epoch 24/100
20000/20000 [==============================] - 16s 782us/sample - loss: 0.4226 - acc: 0.8109 - val_loss: 0.4489 - val_acc: 0.7962


plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train', 'val'])
plt.show()

혼자 공부하는 머신러닝+딥러닝(ch8. 이미지를 위한 인공 신경망) (0)	2021.05.27
혼자 공부하는 머신러닝+딥러닝(ch7-3 신경망 모델 훈련) (0)	2021.05.26
혼자 공부하는 머신러닝+딥러닝(ch7-2 심층 신경망) (0)	2021.05.25
혼자 공부하는 머신러닝+딥러닝(ch7-1 인공 신경망) (0)	2021.05.24
혼자 공부하는 머신러닝+딥러닝(ch6-3 주성분 분석) (0)	2021.05.07

speed&direction

티스토리 뷰

혼자 공부하는 머신러닝+딥러닝(ch9. 텍스트를 위한 인공 신경망)

Chapter.9 텍스트를 위한 인공 신경망¶

09-1 순차 데이터와 순차 신경망¶

- 순차 데이터¶

- 순환 신경망¶

- 셀의 가중치와 입출력¶

09-2 순환 신경망으로 IMDB 리뷰 분류하기¶

- IMDB 리뷰 데이터셋¶

- 순환 신경망 만들기¶

- 순환 신경망 훈련하기¶

- 단어 임베딩을 사용하기¶

09-3 LSTM과 GRU 셀¶

- LSTM 구조¶

- LSTM 신경망 훈련하기¶

- 순환층에 드롭아웃 적용하기¶

- 2개의 층을 연결하기¶

- GRU 구조¶

-GRU 신경망 훈련하기¶

'혼자공부하는 머신러닝+딥러닝' 카테고리의 다른 글

티스토리툴바

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28