時系列分析とは|変動、予測モデル、手法、事例を解説!
目次[非表示]
はじめに
ここでは時系列分析について、基本知識、分析の具体的な進め方について、事例を交えながら、分かりやすく解説していきます。
この記事を読んで分かること、できるようになること
●時系列分析の意味、基本知識が、理解できる。
●時系列データの変動・予測モデルを、正しく理解できる。
●時系列分析をエクセルを使ってでできるようになる。
●時系列分析に関するQ&Aやまとめ資料を、無料でダウンロードできる。
時系列分析とは
時系列分析とは、時間単位や日単位、月単位、年単位など一定の期間ごとに集めた「時系列データ」を用いて、次の期間のデータがどのように変化するのかを予測する分析方法です。
時系列分析の特徴
時系列分析と回帰分析の違い
予測のための分析方法といえば、代表的なものに重回帰分析などの「回帰分析」があります。回帰分析は、複数の変数を使って予測を行う多変量解析です。
これに対し「時系列分析」は、変量が1つであることがほとんどです。1種類の変数の過去からのデータを基にして、その後のデータを予測します。
時系列分析でできること(活用シーン)
時系列分析は、予測が必要な分野において幅広く活用されています。主なシーンは以下の通りです。
●商品の需要予測、生産計画
●ビジネスにおける戦略策定や意思決定、業務効率化
●異常の発見(設備機器の異常検知、システム障害、不正取引の検出など)
時系列分析のデメリット
時系列分析による将来予測は、必ずしも正確とは限らない点がデメリットです。予測が誤っていると企業活動などに悪影響が出るリスクがあることから、他の分析や予測手法と組み合わせて利用することが一般的です。
また、データの蓄積量が少ない場合は予測の精度が低下することもあります。
デメリットも正しく理解し、上手な活かし方を身に付けることが大切です。
時系列データの変動
時系列データには様々な変動(要因)が含まれており、下記4つの種類があります。
・傾向変動:T(Trend)
・循環変動:C(Cycle)
・季節変動:S(Seasonal)
・不規則変動:I(Irregular)
■傾向変動:T(Trend)
傾向変動とは、技術革新や人口増加による市場拡大などにより、少しずつ生産が増加・減少していくなど、長期(例えば20年以上)にわたって、一定の方向性で少しずつ変化する動きのことです。
例)下のグラフは、1956年から2018年まで62年間の「実質経済成長率の推移」です。
■循環変動:C(Cycle)
循環変動とは、3~10年間の周期性で規則的に変動する動きのことです。
設備投資の更新等によって生じる「ジュグラーの波」(7~10年周期)などが代表的です。
例)下のグラフは、1985年から2023年までの「CI一致指数 各拡張局面の上昇率」です。
■季節変動:S(Seasonal)
季節変動とは、1年単位の周期変動で、季節や社会風習等を起因とした変動のことです。
身近な例としては、夏の需要が高いアイスクリームの販売量・金額などが挙げられます。
例)下のグラフは、2010年から2019年までの 「家計調査(二人以上の世帯)の推移」です。
■不規則変動:I(Irregular)
不規則変動とは、規則性や周期性がなく発生する変動のことで、突発的な事象などに起因しています。
例)下のグラフは、2010年を100とした場合の2015年10月から2016年12月までの「鉱工業(生産・出荷)指数の推移」です。
時系列分析の予測モデル
時系列分析の予測モデルには、「自己回帰系モデル」、「状態空間モデル」、「機械学習モデル」の3つがあります。
これらは時系列データを基にデータの将来の推移を予測するためのモデル、言わばアルゴリズムや考え方のようなもので、それぞれ異なる特徴やメリットがあります。目的に応じて適切なモデルを選択しましょう。
1.自己回帰系予測モデル
予測モデルの中でも代表的なのが、自己回帰系モデルです。その特徴から、ARモデル、MAモデル、ARMAモデル、ARIMAモデル、SARIMAモデルの5つに分けられます。
自己回帰系予測5モデルの、データの特徴
各モデルの特徴を分かりやすく表にまとめました。
データの特徴 |
過去データ |
誤差データ |
定常性 |
非定常性 |
季節性 |
ARモデル |
○ |
○ |
|||
MAモデル |
○ |
○ |
|||
ARMAモデル |
○ |
○ |
○ |
||
ARIMAモデル |
○ |
○ |
○ |
○ |
|
SARIMAモデル |
○ |
○ |
○ |
○ |
○ |
次からは、順番に各モデルの詳細を説明していきます。
①ARモデル
(Auto Regressive/自己回帰モデル)
ARモデルとは、あるデータの過去の推移から、将来の推移を予測するモデルです。
※時系列データでは、ある時点のデータはそれ以前(過去)の同じデータから推定できることが基本です。
②MAモデル
(Moving Average/移動平均モデル)
MAモデルとは、時系列上の各データは、過去の誤差(実績値と予測値の差)であるランダムショックに影響されているというモデルです。
ARモデルはデータ自身の過去の特徴を基にしているのに対し、MAモデルは過去のデータのランダムな誤差に現在の誤差が加わったという、誤差(実績値と予測値の差)を中心に考えるモデルです。
③ARMAモデル
(Auto Regressive Moving Average/自己回帰移動平均モデル)
ARMAモデルとは、ARモデルにMAモデルを結合したモデルです。
実際に予測で用いるデータは、過去の特徴だけであったり(ARモデル)、誤差だけ(MAモデル)ということはまずないため、ARMAモデルは、ARモデルやMAモデルよりも一般性の高いモデルと言えます。
④ARIMAモデル
(Auto Regressive Integrated Moving Average/自己回帰和分移動平均モデル)
ARモデル、MAモデル、ARMAの3モデルは、データの性質が時間の推移によって変化しない(測定の時間が変化しても、そのデータの平均値や分散が一定である)いう定常性を前提としています。しかし実際には、時間とともに変動することがとてもよくあります。
「傾向変動:T (Trend)」の時系列データは変動するデータ、つまり非定常データであり、この非定常データにも適応できるのが、ARIMAモデルです。
なお、非定常データにARMAモデルを適用する際、データを定常化する必要が出てきます。その方法の一つとして、データの階差を取る方法があります。
階差を取って、その階差時系列に対しARMAモデルを適用するモデルのことを、ARIMAモデルといいます。
※非定常データは、時間の経過とともにデータの平均値や分散が変化していきます。
⑤SARIMAモデル
(Seasonal Auto Regressive Integrated Moving Average/季節変動自己回帰和分移動平均モデル)
SARIMAモデルとは、ARIMAモデルの拡張版であり、「季節変動:S(Seasonal)」を持つデータの予測に特化したモデルです。
2.状態空間モデル
状態空間モデルは、システムの「状態」と観測データの「関係性」を数式で表現します。
「状態」は、通常、観測できない隠れた変数として扱われ、時系列データの背後にあるダイナミクスや構造を捉えるために用いられます。
状態空間モデルの特長は、複雑な時系列データ※でもモデル化することが可能なことです。欠損データの取り扱いや、時変性(時間によって変わる特性)を持つデータの分析も容易になります。
※複雑な時系列データ:非線形や季節性、外部の説明変数を持つ時系列データのこと
3.機械学習モデル
時系列データ分析の分野で、近年急速に注目を集めているのが、この「機械学習モデル」です。特にディープラーニング技術の発展とともに、複雑な時系列データのモデル化や予測が可能になりました。
代表的な手法は「RNN(Recurrent Neural Network)」で、過去の情報を記憶しながら次の時点のデータを予測します。時系列データの連続性やパターンを捉えるのに適した手法です。
時系列分析の事例(予測モデル別)
主な予測モデルの事例(活用分野)は以下の通りです。
自己回帰系予測モデルでは、5つの中でも非定常系データに対応するARIMAモデル、さらに季節変動(S/Seasonal)データ にも対応するSARIMAモデルが、実務でよく使われています。
状態空間モデルと機械学習モデルも、生活に身近な分野で幅広く活用されています。
●ARIMAモデルの事例:金融市場の予測や気象予報、在庫の最適化など、時系列データの予測が必要な場面で多く利用されています。
●SARIMAモデルの事例:商品の需要予測や在庫管理、広告戦略の策定など、ビジネスのさまざまなシーンで役立てられています。
●状態空間モデルの事例:商品の需要予測や株価の動向分析、気候変動の予測など、多岐にわたる分野で活用されています。
●機械学習モデルの事例:トレンドや季節性、休日などの特別なイベントを考慮した未来予測で使われています。
時系列分析の事例(企業・事業者別)
一般的な時系列分析の活用事例(概要)をまとめました。
大和ハウス工業
時系列予測にAIを活用し、不動産価値の将来予測と投資プランのシミュレーションが行えるサービス「VALUE AI」を提供、不動産オーナーの経営をサポート。
NEC
株式取引において時系列予測を導入し、不公正取引の審査業務を支援するクラウドツール「AI売買審査支援サービス」を提供。
高速道路と大手通信事業者
高速道路の渋滞を、AIを用いて予測分析する実証実験。
大手通信業者
タクシーの需要を予測するサービスを提供。
自動車販売系列
ビッグデータを活用したディーラー向け予測分析サービスを導入。
パン販売事業者
販売履歴と来店客数を分析した上で、商品の売れ行きパターンを予測。
総合電機メーカー
健康診断結果から6年先の生活習慣病の発症リスクの予測を可能に。
セキュリティ企業
犯罪情報などの過去データから、犯罪の発生を予測するシステムの実証実験。
証券会社
AIによって顧客が希望するテーマに関連する銘柄を自動でピックアップし、1カ月後の株価が上昇するか下落するかを予測分析。
大手広告企業(米国)
「畳み込みニューラル・ネットワーク(CNN)」と呼ばれるアルゴリズムによる天気予報分析技術を開発。
時系列分析がエクセルで簡単にできる方法
時系列分析は、エクセルでおこなうことができます。Excelの「予測シート」を使えば、プログラミングの必要なく、ワンクリックでグラフと数表を作成できて、とても便利です。実務上で使っても何も問題ありません。
ここからは先述の「循環変動(C/Cycle)」の解説箇所で出てきたグラフ例《CI 一致指数 各拡張局面の上昇率》を例に解説していきます(以下に再掲)。
グラフ例では2023年までの数値となっていましたが、10年後の2033年までの予測値を算出してみましょう。
手順.1
Excelの「データ」タブで、まずAからC列の数表を範囲指定して、「予測シート」をクリックします。
手順.2
「予測シート」をクリックすると、予測グラフが表示されます(自動的に「移動平均」となっています)。
「予定終了(E)」のデフォルトは「2049」のままですが、まず「オプション(O)」をクリックします。
手順.3
「予定終了(E)」を2033年に変更します。「信頼区間(C)」はデフォルトの「95%」のままで大丈夫です。
手順.4
グラフの軸の最小値を「0.0」から「80.0」に調整するなど、グラフのデザインを調整します。
2024年から2033年までの予測値は、統計的に信頼できる下限と上限の予測値まで自動的に算出されます。
時系列分析にまつわる、よくある質問
Q:実務での時系列分析において、自己回帰系モデルでは「ARIMAモデル」と「SARIMAモデル」が使われている理由は何でしょうか。
時系列分析でよく扱われる”傾向変動の時系列データ”は、「非定常データ」のため、ARIMAモデルかSARIMAモデルでなければ分析できないことが、使われている理由です。
Q:時系列分析用の代表的なツールを教えてください。
Pythonをはじめとして、R、SAS、など数種類のソフトがあります。詳しくは以下の参考となる代表的なマニュアル書籍をご覧になってください。
●【おすすめ】機械学習エンジニア、データサイエンティスト、マーケター、データアナリスト
『Pythonによる時系列分析 予測モデル構築と企業事例』(高橋威知郎著、オーム社、2023年6月)
●【おすすめ】データ分析者、データサイエンティスト、Rユーザー
『基礎からわかる時系列分析―Rで実践するカルマンフィルタ・MCMC・粒子フィルタ―』(萩原淳一郎,瓜生真也,牧山幸史著、石田基広監修、技術評論社、2018年3月)
●【おすすめ】SASの企業ユーザーの社内研鑽用として、SAS のユーザー・導入検討者
『SAS Enterprise Guide 時系列分析編』(高柳良太著、オーム社、2017年2月)
●【おすすめ】企業の市場開発者・時系列分析の手法を知りたい社会人に対する統計学のサブテキスト
『Excelで学ぶ時系列分析―理論と事例による予測― [Excel2016/2013対応版]』(上田太一郎 監修、近藤宏 編著、高橋玲子著、村田真樹著、渕上美喜著、藤川貴司著、上田和明著、オーム社、2016年7月)
●【その他】
PythonとRで使えるオープンソースで、FacebookのMeta社が開発した時系列予測OSSライブラリ「Prophet」があります。統計の専門的な知識がなくとも使えるなどメリットは少なくありません。
Q:エクセルで時系列分析をおこなうメリットを教えてください。
メリットは、第一にデータが自動的に移動平均で表示されることです。第二に、予測値も「上限」「下限」を含めた3パターンが算出されることです。
必要があれば、PythonやSASやR、Prophetを使用することをお薦めしますが、その場合でもまずはExcelの「予測シート」で予測値を算出してみてはいかがでしょうか。
無料ダウンロード『時系列分析の解説~時系列データの種類と、多彩な予測モデル~ 』
本記事で解説した内容をまとめた資料「時系列分析の解説~時系列データの種類と、多彩な予測モデル~」は、下記よりダウンロードすることができます(無料)。
おわりに(まとめ)
最後に、ここまで解説してきた内容をまとめました。今一度の確認に活用してください。 |
時系列分析とは、時間単位や日単位、月単位、年単位など一定の時間おきに集めたデータを用いて、次の期間のデータがどのようになるのかを予測する分析です。
商品の需要予測をはじめとして、特定の業界・業種に限定されることなく、予測が必要な分野において幅広く活用されています。
回帰分析との違いは、変量が1つであることですが、何よりも時間軸での予測が最大の特徴です。時系列分析の対象となるデータは、傾向変動、循環変動、季節変動、不規則変動の4種類です。
時系列分析の予測モデルには、自己回帰系モデル、状態空間モデル、機械学習モデルの3つがあります。
自己回帰系モデルでは、非定常系データに対応しないARモデル、MAモデル、ARMAモデルよりも、非定常系データに対応するARIMAモデルと、季節変動データにも対応するSARIMAモデルが実務でよく活用されています。
代表的なツールは、Pythonをはじめとして、R、SAS、Excelなどのソフトで時系列分析が行えます。PythonとRで使えるオープンソースで、FacebookのMeta社が開発した時系列予測OSSライブラリ「Prophet」が、現在注目されています。
【参考文献】
『SAS Enterprise Guide 時系列分析編』(高柳良太著、オーム社、2017年2月)
【参考ウェブサイト】
『経済産業省「季節調整とは何か?;経済統計の周期性を考える」』(https://www.meti.go.jp/statistics/toppage/report/minikaisetsu/hitokoto_kako/20211126hitokoto.html)/『(株)PrimeNumber 「trocco」データエンジニアリング用語集 時系列データとは』(https://blog.trocco.io/glossary/timeseries-data#zi_ji_hui_gui_ximoderu)/『(株)電算システム「時系列予測とは?代表的な手法や活用事例を解説!」』(https://www.dsk-cloud.com/blog/what-is-time-series-forecasting)/『(株)MatrixFlow「AI活用事例・AI導入事例」』(https://www.matrixflow.net/case-study/89)