DataScience
딥러닝을 이용한 시계열 예측
한창호
2019-05-05 09:15:00
수업보기
딥러닝을 이용한 시계열 예측

딥러닝(DNN: Deep Neural Networks) 모형은 1980~1990년대 인공지능 연구의 구심점이었던 인공신경망(ANN: Artificial Neural Networks) 모형에 뿌리를 두고 있지만 성능 면에서 비교가 되지 않을 정도로 발전된 모습을 보이고 있다.




인공지능이 인간의 능력에 비해 확연한 열세를 보여왔던 시각지능이나 언어지능 분야에 딥러닝 모형이 적용되면서 획기적인 성능 개선이 이루어졌다. 딥러닝 모형은 흔히 심층신경망 모형으로 번역되고 있는데, 기존 인공신경망 모형에 비해 은닉층의 갯수가 월등히 많아서 입력과 출력간의 복잡한 비선형 관계를 더 잘 포착해낼 수 있다. 그런데, 딥러닝 모형이 시각정보나 언어정보를 더 잘 처리하는 근본적인 이유는 단지 은닉층의 갯수가 많다는 점에 기인하기보다는 딥러닝 모형이 인공신경망 모형에 비해 유연한 네트워크 구조를 가지고 있으며, 특히 데이터가 지니고 있는 temporal structural 를 잘 포착해낼 수 있는 구조를 제공한다는 점에 더 크게 기인한다.



ANN 모형은 입력층에서 출력층으로 정보가 한 방향으로 직진하며 한 층의 모든 뉴런이 다음 층의 모든 뉴런과 상호 연결되는 네트워크 구조를 지니므로 언어정보나 시각정보가 지니는 특성을 제대로 반영할 수 없다. 특히 언어정보는 시계열 데이터의 속성을 강하게 지닌다. 단어를 순서대로 전개해야 의미가 통하는 문장이 되는데, 단어를 순서대로 전개하기 위해서는 직전에 무슨 단어가 나왔는지 잘 기억해야 한다. ANN 모형은 이런 기억 능력을 제공할 수 있는 구조를 지니고 있지 않다.



DNN 모형중에서 RNN(Recurrent Neural Networks) 모형은 은닉층 또는 출력층에서 입력층으로 정보가 피드백되는 구조를 지니고 있어서 네트워크가 단기 기억능력을 지닐 수 있다. RNN 모형의 한 부류인 LSTM(Long Short Term Model)은 장기 기억능력도 제공한다.




통계학적 시계열 모형은 어떤 변수의 현재값을 변수 자신의 과거값들의 가중평균과 교란항의 현재 값으로 표현(자기상관모형)하거나 또는 교란항 과거값들의 가중평균과 교란항의 현재 값으로 표현(이동평균모형)한다. 어느 정도까지의 과거값을 사용해야 주어진 시계열 데이터를 제대로 모델링 할 수 있는지는 시계열 모형의 차수에 반영된다. 모형의 차수를 추정하기 위해 다양한 통계적 기법을 동원하고 있지만 선형모형에 기반한 통계학적 시계열 모형으로는 매우 복잡한 비선형적 데이터 생성 확률과정을 지닌 시계열 데이터를 다루는 데 한계가 있다.




최근에는 RNN 모형을 시계열 데이터에 활용하여 시계열 데이터 깊은 곳에 숨겨져 있는 패턴을 찾아내어 미래를 예측하는 데 많이 활용하고 있다. 뿐만 아니라 시각정보 데이터 처리에 특화된 CNN 모형은 RGB 색상 정보 입력을 위해 다채널 입력층 구조를 이용하는 데 이구조를 다변량 시계열 분석에 활용할 수 있으므로 최근에는 CNN과 RNN을 결합하여 시계열 데이터 분석과 예측에 활용하여 기존의 통계적 분석 방법으로는 도달 불가능한 성능을 구현하고 있다.


한창호 튜터
안녕하세요 한창호튜터 입니다
튜터의 DataScience 수업 들으러 가기 (클릭)
436
0
0

답글 작성하기
등록하기