본문 바로가기

timeseries

Fitting the ARMA model 저번에 배운 ARMA 모델을 바탕으로 어떻게 해당 모델을 fitting 해서 어떠한 미래 데이터를 얻을 수 있는 지에 대해 간단하게 살펴보겠습니다 plot_acf 와 plot_pacf 를 통해 어떠한 parameter로 fitting 할 지 대략적인 감을 잡은 뒤 AIC 또는 BIC를 사용하여. 가장 알맞은 모델을 골라줄 수 있습니다. 2011 - 2021 까지의 SP500 data를 사용해보겠습니다. SP500_diff = SP500.diff().dropna() fig, (ax1, ax2) = plt.subplots(2,1, figsize=(12,8)) plot_acf(SP500_diff, ax=ax1) plot_pacf(SP500_diff, ax=ax2) SP500의 ACF를 살펴봤더니, 추세가 존재.. 더보기
시계열분석 _ ARMA모델 개념정리 Stationary 저번에 마지막에 약간 다뤘는데 다시 한 번 살짝 짚고 넘어가면 보통 아래 3가지를 만족하면 stationary data입니다. 1) 데이터의 평균이 상수인 경우 2) 데이터의 분산이 상수인 경우 3) 계절성이 존재하지 않는 경우 그리고 이중에서도 특히, 데이터의 평균이 0인 경우는 특별하게, white noise라고 합니다. 눈으로 확인하는 것보다는 Adfuller test (ADF) 를 진행해보는 것이 가장 정확할 것입니다. ARMA 모델에 데이터를 넣기 위해서는 해당 데이터가 stationary 해야하기 때문에 다시 한 번 stationary 에 대해 정리했습니다. PACF 저번 포스트(?) 에서 ㅋㅋACF에 대해서는 다뤘는데 PACF에 대해서는 다루지 않았는데 PACF는 part.. 더보기
시계열분석 _ 자기상관과 ACF 시계열 분석을 공부를 어제 시작했는데 저는 여기서부터 벌써 막혀버렸네요...어렵다는 것은 알았지만 제가 생각한 것 보다 더 어렵네요..! 역시 거두절미하고 시작하겠습니다. Auto correlation 먼저, 자기 상관(auto correlation) 은 자기 자신과 일정한 시점 뒤의 자기 자신 사이의 상관관계입니다. 아래식은 자기 상관 계수에 관한 식인데요, 보통의 상관계수와 마찬가지로 계수는 -1과 1사이에서 결정되며, 계수가 1에 가까울수록 강한 양의 상관관계, 계수가 -1에 가까울수록 강한 음의 상관관계를 가집니다. 이 때 양의 값을 가지면, 추세를 따름, 음의 값 을 가지면 평균 되돌림이라고 하기도 합니다. 위 식을 보면 k 가 lag를 의미한다는 것을 알 수 있습니다. 원래 데이터와 원래 데이.. 더보기
시계열분석 기초(1) 시계열 분석은 보통 시간 순서로 정렬된 데이터를 분석하는 것을 의미합니다. 그래서 보통 주가 등의 financial data나 기온 변화 등에 대한 데이터를 많이 사용합니다. 제가 시계열분석을 공부하고자 마음먹은 이유도 저 financial data를 잘 다루고 싶어서 입니다. 거두절미하고, 제가 오늘 공부한 내용을 바로 소개해드릴게요~ 저는 데이터캠프에서 시계열분석에 대해 공부하고 있는데 관련 데이터를 제공해주지 않아 제가 간단한 데이터를 다운받았습니다! https://trends.google.com/trends/?geo=KR Google 트렌드 trends.google.com 여긴 구글에서 특정단어를 검색한 횟수를 날짜별로 제공해주는 사이트인데요..! csv파일도 쉽게 다운 받을 수 있고, 시계열에 .. 더보기