Adding LSTM neural network

JBris · JBris · commit c613e4d362bb · 2020-03-26T21:05:31.000+13:00
diff --git a/python/shampoo_sales/dataset.py b/python/shampoo_sales/dataset.py
@@ -1,7 +1,9 @@
 #!/usr/bin/env python
 
+import numpy as np
 import os
 import pandas as pd
+from sklearn.preprocessing import MinMaxScaler
 
 def load_date_series():
     dirname = os.path.dirname(os.path.realpath(__file__))
@@ -12,3 +14,45 @@ def split_date_series(series):
     X = series.values
     train, test = X[0:-12], X[-12:]
     return train, test
+
+# frame a sequence as a supervised learning problem
+def timeseries_to_supervised(data, lag=1):
+	df = pd.DataFrame(data)
+	columns = [df.shift(i) for i in range(1, lag+1)]
+	columns.append(df)
+	df = pd.concat(columns, axis=1)
+	df.fillna(0, inplace=True)
+	return df
+
+# create a differenced series
+def difference(dataset, interval=1):
+	diff = []
+	for i in range(interval, len(dataset)):
+		value = dataset[i] - dataset[i - interval]
+		diff.append(value)
+	return pd.Series(diff)
+
+# invert differenced value
+def inverse_difference(history, yhat, interval=1):
+	return yhat + history[-interval]
+
+# scale train and test data to [-1, 1]
+def scale(train, test):
+	# fit scaler
+	scaler = MinMaxScaler(feature_range=(-1, 1))
+	scaler = scaler.fit(train)
+	# transform train
+	train = train.reshape(train.shape[0], train.shape[1])
+	train_scaled = scaler.transform(train)
+	# transform test
+	test = test.reshape(test.shape[0], test.shape[1])
+	test_scaled = scaler.transform(test)
+	return scaler, train_scaled, test_scaled
+
+# inverse scaling for a forecasted value
+def invert_scale(scaler, X, value):
+	new_row = [x for x in X] + [value]
+	array = np.array(new_row)
+	array = array.reshape(1, len(array))
+	inverted = scaler.inverse_transform(array)
+	return inverted[0, -1]
diff --git a/python/shampoo_sales/lstm_neural_network.py b/python/shampoo_sales/lstm_neural_network.py
@@ -0,0 +1,106 @@
+#!/usr/bin/env python
+
+import matplotlib.pyplot as plt
+import pandas as pd
+from dataset import load_date_series, timeseries_to_supervised, difference, inverse_difference, scale, invert_scale
+from keras.models import Sequential
+from keras.layers import Dense
+from keras.layers import LSTM
+from math import sqrt
+from sklearn.metrics import mean_squared_error as mse
+
+# fit an LSTM network to training data
+def fit_lstm(train, batch_size, nb_epoch, neurons):
+	X, y = train[:, 0:-1], train[:, -1]
+	X = X.reshape(X.shape[0], 1, X.shape[1])
+	model = Sequential()
+	model.add(LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], X.shape[2]), stateful=True))
+	model.add(Dense(1))
+	model.compile(loss='mean_squared_error', optimizer='adam')
+	for i in range(nb_epoch):
+		model.fit(X, y, epochs=1, batch_size=batch_size, verbose=0, shuffle=False)
+		model.reset_states()
+	return model
+
+# make a one-step forecast
+def forecast_lstm(model, batch_size, X):
+	X = X.reshape(1, 1, len(X))
+	yhat = model.predict(X, batch_size=batch_size)
+	return yhat[0,0]
+
+def prepare_model():
+    # Convert series into supervised learning problem
+    series = load_date_series()
+    X = series.values
+    supervised = timeseries_to_supervised(X, 1)
+    print("*** Supervised Learning ***")
+    print(supervised.head())
+
+    # Convert time series to stationary
+    differenced = difference(series, 1)
+    print("*** Stationary Data Set ***")
+    print(differenced.head())
+    # invert transform
+    inverted = list()
+    for i in range(len(differenced)):
+        value = inverse_difference(series, differenced[i], len(series)-i)
+        inverted.append(value)
+    inverted = pd.Series(inverted)
+    print(inverted.head())
+
+    # Scale time series
+    scaler, scaled_X = scale(series)
+    scaled_series = pd.Series(scaled_X[:, 0])
+    print("*** Scaled Time Series ***")
+    print(scaled_series.head())
+    # invert transform
+    inverted_X = scaler.inverse_transform(scaled_X)
+    inverted_series = pd.Series(inverted_X[:, 0])
+    print(inverted_series.head())
+
+def model(series):
+    # transform data to be stationary
+    raw_values = series.values
+    diff_values = difference(raw_values, 1)
+
+    # transform data to be supervised learning
+    supervised = timeseries_to_supervised(diff_values, 1)
+    supervised_values = supervised.values
+
+    # split data into train and test-sets
+    train, test = supervised_values[0:-12], supervised_values[-12:]
+
+    # transform the scale of the data
+    scaler, train_scaled, test_scaled = scale(train, test)
+
+    # fit the model
+    lstm_model = fit_lstm(train_scaled, 1, 3000, 4)
+    # forecast the entire training dataset to build up state for forecasting
+    train_reshaped = train_scaled[:, 0].reshape(len(train_scaled), 1, 1)
+    lstm_model.predict(train_reshaped, batch_size=1)
+
+    # walk-forward validation on the test data
+    predictions = list()
+    for i in range(len(test_scaled)):
+        # make one-step forecast
+        X, y = test_scaled[i, 0:-1], test_scaled[i, -1]
+        yhat = forecast_lstm(lstm_model, 1, X)
+        # invert scaling
+        yhat = invert_scale(scaler, X, yhat)
+        # invert differencing
+        yhat = inverse_difference(raw_values, yhat, len(test_scaled)+1-i)
+        # store forecast
+        predictions.append(yhat)
+        expected = raw_values[len(train) + i + 1]
+        print('Month=%d, Predicted=%f, Expected=%f' % (i+1, yhat, expected))
+
+    # report performance
+    rmse = sqrt(mse(raw_values[-12:], predictions))
+    print('Test RMSE: %.3f' % rmse)
+    # line plot of observed vs predicted
+    plt.plot(raw_values[-12:])
+    plt.plot(predictions)
+    plt.show()
+
+series = load_date_series()
+model(series)