본문 바로가기

Study/Python

[파이썬]딥러닝(LSTM)을 이용한 'Apple' 주가 예측하기

Stock Price Prediction Project

 

1. 데이터셋 구축

yahoo finance에서 APPL의 주가 데이터(csv파일)를 다운받는다. 

(2010-01-08부터 2021-01-08의 데이터를 다운받았다.)

 

 

2. 데이터 불러오기 

 

import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
%matplotlib inline

from matplotlib.pylab import rcParams
rcParams['figure.figsize']=20,10
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM,Dropout,Dense


from sklearn.preprocessing import MinMaxScaler

 

 

3. 데이터셋 읽기

df=pd.read_csv("AAPL.csv")
df.head()

 

4. 주식종가 데이터 프레임 분석 

df["Date"]=pd.to_datetime(df.Date,format="%Y-%m-%d")
df.index=df['Date']

plt.figure(figsize=(16,8))
plt.plot(df["Close"],label='Close Price history')

 

 

5. 날짜 시간을 기준으로 데이터 셋을 정렬하고, "Date"와 "Close"열을 필터링하기

data=df.sort_index(ascending=True,axis=0)
new_dataset=pd.DataFrame(index=range(0,len(df)),columns=['Date','Close'])

for i in range(0,len(data)):
    new_dataset["Date"][i]=data['Date'][i]
    new_dataset["Close"][i]=data["Close"][i]

6. 데이터 정규화

2019년12월31일의 데이터까지 데이터를 훈련시킨다.  

scaler=MinMaxScaler(feature_range=(0,1))
new_dataset.index=new_dataset.Date
new_dataset.drop("Date",axis=1,inplace=True)
final_dataset=new_dataset.values

train_data=final_dataset[0:2513,:]
valid_data=final_dataset[2513:,:]


scaler=MinMaxScaler(feature_range=(0,1))
scaled_data=scaler.fit_transform(final_dataset)

x_train_data,y_train_data=[],[]

for i in range(60,len(train_data)):
    x_train_data.append(scaled_data[i-60:i,0])
    y_train_data.append(scaled_data[i,0])
    
x_train_data,y_train_data=np.array(x_train_data),np.array(y_train_data)

x_train_data=np.reshape(x_train_data,(x_train_data.shape[0],x_train_data.shape[1],1))

 

7. LSTM모델 구축과 훈련

lstm_model=Sequential()
lstm_model.add(LSTM(units=50,return_sequences=True,input_shape=(x_train_data.shape[1],1)))
lstm_model.add(LSTM(units=50))
lstm_model.add(Dense(1))

inputs_data=new_dataset[len(new_dataset)-len(valid_data)-60:].values
inputs_data=inputs_data.reshape(-1,1)
inputs_data=scaler.transform(inputs_data)

lstm_model.compile(loss='mean_squared_error',optimizer='adam')
lstm_model.fit(x_train_data,y_train_data,epochs=1,batch_size=1,verbose=2)

 

8. LSTM모델을 사용한 주가 예측을 위해 데이터셋 샘플 가져오기

X_test=[]
for i in range(60,inputs_data.shape[0]):
    X_test.append(inputs_data[i-60:i,0])
X_test=np.array(X_test)

X_test=np.reshape(X_test,(X_test.shape[0],X_test.shape[1],1))
predicted_closing_price=lstm_model.predict(X_test)
predicted_closing_price=scaler.inverse_transform(predicted_closing_price)

 

9. LSTM모델 저장하기

lstm_model.save("saved_model.h5")

 

10. 예측모델과 실제모델 값을 시각화하기

train_data=new_dataset[:2513]
valid_data=new_dataset[2513:]
valid_data['Predictions']=predicted_closing_price
plt.plot(train_data["Close"])
plt.plot(valid_data[['Close',"Predictions"]])

 

 

파란색선 - 훈련한 데이터

빨간색선 - 실제 모델 값

주황색선 - 훈련한 데이터를 예측한 값

----------------------------------------------------------------------------------------------------------------------------------------------------------------

 

완벽하게 예측하지는 못했지만 얼추 비슷하게 예측하였다.