4.2) Alexnet

12/30/2020 AlexNet.
ipynb - Colaboratory
4.2) AlexNet
# (1) Importing dependency

import matplotlib.pyplot as plt
import keras
from keras.models import Sequential
from keras.layers import Dense, Activation,Flatten,\
Conv2D, MaxPooling2D
from keras.layers.normalization import BatchNormalization
import numpy as np
np.random.seed(1000)
from keras.datasets import cifar10
import tensorflow as tf
from tensorflow import keras
(train_images, train_labels), (test_images, test_labels) = keras.datasets.cifar10.load_data()
Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

170500096/170498071 [==============================] - 2s 0us/step
CLASS_NAMES= ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship'
train_ds=tf.data.Dataset.from_tensor_slices((train_images,train_labels))
test_ds=tf.data.Dataset.from_tensor_slices((test_images,test_labels))
plt.figure(figsize=(30,30))
for i,(image,label) in enumerate(train_ds.take(20)):
#print(label)
ax=plt.subplot(5,5,i+1)
plt.imshow(image)
plt.title(CLASS_NAMES[label.numpy()[0]])
plt.axis('off')
https://colab.research.google.com/drive/1j26lqaxBKqqFnt867KjZNkrsjzQ3o64m#scrollTo=aQd5NvWeYQWm&printMode=true 1/10
12/30/2020 AlexNet.ipynb - Colaboratory
def process_image(image,label):
image=tf.image.per_image_standardization(image)
image=tf.image.resize(image,(64,64))
return image,label
train_ds_size=tf.data.experimental.cardinality(train_ds).numpy()
test_ds_size=tf.data.experimental.cardinality(test_ds).numpy()
print('Train size:',train_ds_size)
print('Test size:',test_ds_size)
Train size: 50000

Test size: 10000
train_ds=(train_ds
.map(process_image)
.shuffle(buffer_size=train_ds_size)
.batch(batch_size=32,drop_remainder=True)
)
test_ds=(test_ds
.map(process_image)
.shuffle(buffer_size=test_ds_size)
.batch(batch_size=32,drop_remainder=True)
)
# The Dropout layer randomly sets input units to 0 with a frequency of `rate`at each step dur
def drop_out(X, rate):
keep_probability = 1 - rate
mask = nd.random_uniform(0, 1.0, X.shape, ctx=X.context) < keep_probability
if keep_probability > 0.0:
scale = (1/keep_probability)
else:
scale = 0.0
return mask * X * scale
image_shape=(64,64,3)
model= tf.keras.Sequential()
#from keras.models import Sequential
# 1st Convolutional Layer
model.add(tf.keras.layers.Conv2D(filters=96, input_shape=image_shape, kernel_size=(11,11),\
strides=(4,4), padding='valid'))
model.add(tf.keras.layers.Activation('relu'))
# Pooling
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2), strides=(2,2), padding='valid'))
# Batch Normalisation before passing it to the next layer
model.add(tf.keras.layers.BatchNormalization())
# 2nd Convolutional Layer
model.add(tf.keras.layers.Conv2D(filters=256, kernel_size=(5,5), strides=(1,1), padding='same
# Pooling
# Batch Normalisation
# 3rd Convolutional Layer

model.add(Activation('relu'))
# 4th Convolutional Layer

t Co o ut o a aye
# 5th Convolutional Layer

# Pooling
# Passing it to a dense layer

model.add(tf.keras.layers.Flatten())
# 1st Dense Layer
model.add(tf.keras.layers.Dense(4096, input_shape=(64*64*3,)))
d1=model.add(tf.keras.layers.Activation('relu'))
# Add Dropout to prevent overfitting
model.add(tf.keras.layers.Dropout(0.5))
# 2nd Dense Layer
model.add(tf.keras.layers.Dense(4096))
r1=model.add(tf.keras.layers.Activation('relu'))
# Add Dropout
# 3rd Dense Layer

model.add(tf.keras.layers.Dense(1000))
# Add Dropout
model.add(tf.keras.layers.Activation('softmax'))
model.summary()
conv2d_11 (Conv2D) (None, 7, 7, 256) 614656
_________________________________________________________________
activation_19 (Activation) (None, 7, 7, 256) 0
_________________________________________________________________
max_pooling2d_7 (MaxPooling2 (None, 3, 3, 256) 0
_________________________________________________________________
batch_normalization_17 (Batc (None, 3, 3, 256) 1024
_________________________________________________________________
conv2d_12 (Conv2D) (None, 3, 3, 384) 885120
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
conv2d_13 (Conv2D) (None, 3, 3, 384) 1327488
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
conv2d_14 (Conv2D) (None, 3, 3, 256) 884992
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
flatten_2 (Flatten) (None, 256) 0
_________________________________________________________________
dense_6 (Dense) (None, 4096) 1052672
_________________________________________________________________
activation_23 (Activation) (None, 4096) 0
_________________________________________________________________
dropout_6 (Dropout) (None, 4096) 0
_________________________________________________________________
batch_normalization_21 (Batc (None, 4096) 16384
_________________________________________________________________
dense_7 (Dense) (None, 4096) 16781312
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
dense_8 (Dense) (None, 1000) 4097000
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
=================================================================
Total params: 25,720,456
Trainable params: 25,699,320
Non-trainable params: 21,136
model.compile(
loss='sparse_categorical_crossentropy',
optimizer=tf.optimizers.SGD(lr=0.001),
metrics=['accuracy']
)
model.summary()
_________________________________________________________________
conv2d_11 (Conv2D) (None, 7, 7, 256) 614656
_________________________________________________________________
( ) ( )
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
conv2d_12 (Conv2D) (None, 3, 3, 384) 885120
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
conv2d_13 (Conv2D) (None, 3, 3, 384) 1327488
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
conv2d_14 (Conv2D) (None, 3, 3, 256) 884992
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
flatten_2 (Flatten) (None, 256) 0
_________________________________________________________________
dense_6 (Dense) (None, 4096) 1052672
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
dense_7 (Dense) (None, 4096) 16781312
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
dense_8 (Dense) (None, 1000) 4097000

_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
=================================================================
Total params: 25,720,456
Trainable params: 25,699,320
Non-trainable params: 21,136
Double-click (or enter) to edit
history=model.fit(
train_ds,
epochs=25,
validation_data=test_ds,
validation_freq=1
)
Epoch 1/25
1562/1562 [==============================] - 1059s 672ms/step - loss: 7.6388 - accuracy
Epoch 2/25
Epoch 3/25
Epoch 4/25
Epoch 5/25
Epoch 6/25
Epoch 7/25
Epoch 8/25
Epoch 9/25
Epoch 10/25
Epoch 11/25
Epoch 12/25
Epoch 13/25
Epoch 14/25
Epoch 15/25
Epoch 16/25
Epoch 17/25
Epoch 18/25
Epoch 19/25
Epoch 20/25
Epoch 21/25
Epoch 22/25
Epoch 23/25
Epoch 24/25
Epoch 25/25
model.history.history.keys()
dict_keys(['loss', 'accuracy', 'val_loss', 'val_accuracy'])
f,ax=plt.subplots(2,1,figsize=(10,10))
#Assigning the first subplot to graph training loss and validation loss
ax[0].plot(model.history.history['loss'],color='b',label='Training Loss')
ax[0].plot(model.history.history['val_loss'],color='r',label='Validation Loss')
#Plotting the training accuracy and validation accuracy

ax[1].plot(model.history.history['accuracy'],color='b',label='Training Accuracy')
ax[1].plot(model.history.history['val_accuracy'],color='r',label='Validation Accuracy')
plt.legend()
<matplotlib.legend.Legend at 0x7fb9ba1af048>
print('Accuracy Score = ',np.max(history.history['val_accuracy']))
Accuracy Score = 0.625
4.2.1 ) Dropout
def drop_out(X, drop_probability):

keep_probability = 1 - drop_probability
mask = np.random.binomial(0, 1.0, X.shape, ctx=X.context) < keep_probability
#############################
# Avoid division by 0 when scaling
#############################
if keep_probability > 0.0:
scale = (1/keep_probability)
else:
scale = 0.0
return mask * X * scale
4.2.1 ) Data Augmentation
Horizontal Flip
def horizontal_flip(X, rate=0.5):

if np.random.rand() < rate:
X = X[:, ::-1, :]
return image
4.3) Batch Normalization
def batchnorm_forward(x, gamma, beta, bn_param):

mode = bn_param['mode']
eps = bn_param.get('eps', 1e-5)
momentum = bn_param.get('momentum', 0.9)
N, D = x.shape
running_mean = bn_param.get('running_mean', np.zeros(D, dtype=x.dtype))
running_var = bn_param.get('running_var', np.zeros(D, dtype=x.dtype))
out, cache = None, None
if mode == 'train':
sample_mean = np.mean(x, axis=0)
sample_var = np.var(x, axis=0)
vareps sample var + eps
vareps = sample_var + eps
x_normalized = (x - sample_mean) / np.sqrt(vareps)
out = gamma * x_normalized + beta
running_mean = momentum * running_mean + (1 - momentum) * sample_mean

running_var = momentum * running_var + (1 - momentum) * sample_var
cache = (x, gamma, sample_mean, vareps, x_normalized)
elif mode == 'test':

x_normalized = (x - running_mean) / np.sqrt(running_var + eps)
out = gamma * x_normalized + beta
else:
raise ValueError('Invalid forward batchnorm mode "%s"' % mode)
bn_param['running_mean'] = running_mean
bn_param['running_var'] = running_var
return out, cache

4.2) Alexnet

Uploaded by

Document Informationclick to expand document information

Copyright:

Available Formats

4.2) Alexnet

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

4.2) Alexnet

Uploaded by

Copyright:

Available Formats

12/30/2020 AlexNet.

# (1) Importing dependency

(train_images, train_labels), (test_images, test_labels) = keras.datasets.cifar10.load_data()

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

Train size: 50000

# 3rd Convolutional Layer

# 4th Convolutional Layer

# 5th Convolutional Layer

# Passing it to a dense layer

# 3rd Dense Layer

dense_8 (Dense) (None, 1000) 4097000

Double-click (or enter) to edit

dict_keys(['loss', 'accuracy', 'val_loss', 'val_accuracy'])

#Plotting the training accuracy and validation accuracy

print('Accuracy Score = ',np.max(history.history['val_accuracy']))

Accuracy Score = 0.625

def drop_out(X, drop_probability):

4.2.1 ) Data Augmentation

def horizontal_flip(X, rate=0.5):

4.3) Batch Normalization

def batchnorm_forward(x, gamma, beta, bn_param):

running_mean = momentum * running_mean + (1 - momentum) * sample_mean

elif mode == 'test':

You might also like