格兰杰因果关系

格兰杰因果关系检验（英语：Granger causality test）是一种假设检验的统计方法，检验一组时间序列 $x$ 是否为另一组时间序列 $y$ 的原因。它的基础是回归分析当中的自回归模型。回归分析通常只能得出不同变量间的同期相关性；自回归模型只能得出同一变量前后期 的相关性；但诺贝尔经济学奖得主克莱夫·格兰杰（Clive Granger）于1969年论证^[1] ，在自回归模型中透过一系列的检验进而揭示不同变量之间的时间落差相关性是可行的。

格兰杰本人在其2003年获奖演说中强调了其引用的局限性，以及“很多荒谬论文的出现”（Of course, many ridiculous papers appeared）。格兰杰因果关系检验的结论只是一种统计估计，不是真正意义上的因果关系，不能作为肯定或否定因果关系的根据。同时，格兰杰因果关系检验也有一些不足之处，如并未考虑干扰因素的影响，也未考虑时间序列间非线性的相互关系。一些基于格兰杰因果关系检验的方法一定程度上解决了这些问题^[2]。

核心概念

过去值（lag value，或称落後期）：同一变项比当期时间上更早的值。例如：当期为 $y_{10}$ ，它的落後期为 $y_{i<10}$ 。

格兰杰因果关系检验的基本观念在于：未来的事件不会对目前与过去产生因果影响，而过去的事件才可能对现在及未来产生影响。^[1]^[3] 也就是说，如果我们试图探讨变数 $x$ 是否对变数 $y$ 有因果影响，那么只需要估计 $x$ 的落後期是否会影响 $y$ 的现在值，因为 $x$ 的未来值不可能影响 $y$ 的现在值。假如在控制了 $y$ 变数的过去值以后， $x$ 变数的过去值仍能对Y 变数有显著的解释能力，我们就可以称 $x$ 能“Granger 影响”（Granger-cause） $y$ 。^[4]

局限性和改进

最初版的格兰杰因果测试，有时候无法发现真正的因果关系。因为虽然对于认定因果关系而言，理论上还必须控制其他可能的干扰因素，但在 Granger 最初提出这套因果测试的版本中，并未纳入干扰变数的分析，而是假设其他可能解释变数的信息包含在 $y$ 的落后值中。如果事实上带来因果关系的是第三变数（干扰变数），亦即若事实上操控 $x$ 并无法改变 $y$ ，格兰杰因果关系的零假设仍然可能被拒绝。因此标准版的格兰杰因果测试结果可能会产生误导性。

1980年代由其他的计量经济学家对Granger测试加以修改、扩充，将可能的第三（以上）变数纳入测试，成为使用面板資料（英语：panel data）的向量自回归模型（英语：panel data VAR model）。相较于最初版的 Granger 测试，扩充版可以产生更有效的估计结果。^[4]

步骤描述

准备工作：一开始要用几个落後期来建立模型，需要研究者的评估，通常使用赤池信息量准则（英语：Akaike information criterion、簡稱AIC）或贝氏讯息量准则（英语：Bayesian information criterion）（英语：Bayesian information criterion、簡稱BIC）来判断。
格兰杰因果关系检验的第一步是建立用 $y$ 的落後期来预测 $y$ 的自回归模型。此际，如果时间序列 $y$ 是广义平稳的，则可以直接使用落後期。如果不平稳，就必须对不平稳的时间序列先做（一阶或更多阶）差分，直到得出平稳时间数列。
如果发现 $y$ 的某期落後期 (1) 在回归分析中具有显著性（根据 t检验的p值来判断），且 (2) 这期落後期加入模型后可提高回归模型的解释力（根据回归分析的F检验），这个落後期便被留在模型中。
然后进一步加入 $x$ （或Δ $x$ ）的滞后期来扩充回归模型。关于平稳时间序列的要求、某期落後期留在模型中的条件，同上述 $y$ 的处理。
当且仅当（充分必要）没有任何解释变项 $x$ （或Δ $x$ ）的落後期被留在模型中，便无法拒绝无格兰杰因果关系的零假设。

研究人员希望发现明显的证据，比如 $x$ 是 $y$ 的格兰杰原因但反之不成立，便能做出因果关系的推论。然而在实际操作中也可能会发现没有变量是对方的格兰杰原因，或者 $x$ 和 $y$ 两个变量互为格兰杰原因。

数学定义

1. 令 $x$ 和 $y$ 为广义平稳序列。如要检测 $x$ 非 $y$ 的格兰杰原因之零假设，首先引入 $y$ 的落後期建立 $y$ 的自回归模型（AR model on $y$ ）：

y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+...+a_{m}y_{t-m}+residual_{t}.

所有的

y

落後期中：(1) 在回归分析中具有显著性（根据t-统计值的p值来判断）的，且 (2) 这期落後期加入模型后可提高回归模型的解释力（根据回归分析的F检验）的－－将被留在模型中。

m

表示的是

y

变量滞后期中检验为显著的时间上最早一个。

2. 接着，引入 $x$ 的落後期建立增广回归模型：

y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+...a_{m}y_{t-m}+b_{p}x_{t-p}+...+b_{q}x_{t-q}+residual_{t}.

所有的

x

落後期中：(1) 在回归分析中具有显著性（根据t检验的p值来判断）的，且 (2) 这期落後期加入模型后可提高回归模型的解释力（根据回归分析的F检验）的－－将被留在模型中。在以上增广回归模型中，

p

代表

x

变量落後期中检验为显著的时间上最早一个，

q

则是

x

变量落後期中检验为显著的时间上最近一个。

3. 如果没有任何 $x$ 的落後期被留在模型中，无格兰杰因果关系的零假设就成立。

软件运行

一些统计软件可以执行Granger causality test。例如：Stata、SPSS^[5]、EViews^[6]、R语言。

这里举个R语言中lmtest程序库里grangertest()指令的例子：

Granger causality test

Model 1: fii ~ Lags(fii, 1:5) + Lags(rM, 1:5)
Model 2: fii ~ Lags(fii, 1:5)
  Res.Df  Df      F  Pr(>F)
1    629
2    634   5 2.5115 0.02896 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Granger causality test

Model 1: rM ~ Lags(rM, 1:5) + Lags(fii, 1:5)
Model 2: rM ~ Lags(rM, 1:5)
  Res.Df  Df      F Pr(>F)
1    629
2    634   5 1.1804 0.3172

模型1检验将滞后的rM从解释FII的回归模型中移除是否可行，答案是不可行的（因为p值 = 0.02896）。但由模型1和模型2的组合可发现从解释rM的模型中移除FII的落後期是可能的。我们可以由此断定rM是FII的格兰杰原因，反之则不成立。

延伸

承继著回归模型的基本性质，格兰杰因果关系分析也假设实际值与预测值之间的误差呈正态分布，若实际现象不呈正态分布将严重影响推论的有效性。

Hacker & Hatemi-J (2006)发展出一种不必在乎误差项是否呈正态分布的格兰杰因果关系研究方法^[7]。这种方法在财金分析上特别实用，因为许多金融变量不服从正态分布。^[8]

近来，Hacker & Hatemi-J (2012)又进一步改善之，提出一种非对称的因果关系检验模型，据说可以区分正向与负向影响的因果影响。^[9]

时变格兰杰因果关系：将格兰杰因果关系扩展到动态的时变性质，可以更细致地了解时间序列数据中的因果关系是如何随时间演变的。^[10] 该方法使用递归技术，如前向展（FE）、滚动（RO）和递归演化（RE）窗口，以克服传统格兰杰因果检验的局限性，并理解不同时期因果关系的变化。^[11] 这一方法的核心是 Stata 中的 "tvgc "命令。^[10]经验应用，如涉及以太坊交易费用和经济子系统的数据，突出了经济关系随时间变化的动态性质。^[12]

注脚

^ ^1.0 ^1.1 Granger, Clive W. J. Investigating Causal Relations by Econometric Models and Cross-spectral Methods. Econometrica（英语：Econometrica） (The Econometric Society). 1969, 37 (3): 424–438 [2015-04-20]. （原始内容存档于2016-03-06）.
^ Bahadori, Mohammad Tahalast; Liu, Yan. An Examination of Practical Granger Causality Inference (Manuscript) (PDF). University of Southern California. 2014 [2015-04-20]. （原始内容存档 (PDF)于2015-04-27）.
^ Anil Seth. Granger causality. Scholarpedia. 2007, 2 (7): 1667 [2011-03-07]. doi:10.4249/scholarpedia.1667. （原始内容存档于2011-08-10）.
^ ^4.0 ^4.1 刘孟奇，张其禄，卢敬植. 警力增加能導致竊盜犯罪率降低嗎？ - 台灣縣市1998-2007 動態追蹤資料之Granger 因果分析 (PDF). 公共行政学报. 2010, (34): 1–27 [2015-04-20]. （原始内容存档 (PDF)于2016-03-04）.
^ Q: Granger causality test. Google Answers. [2013-03-08]. （原始内容存档于2013-05-27）.
^ Eviews. Granger. CAUSALITY BETWEEN MONEY AND INTEREST RATE IN CANADA. YouTube. [2013-03-08]. （原始内容存档于2016-09-24）.
^ Hacker R.S. and Hatemi-J A. (2006) "Tests for causality between integrated variables using asymptotic and bootstrap distributions: theory and application" （页面存档备份，存于互联网档案馆）, Applied Economics, Vol. 38(13), pp. 1489–1500.
^ Mandelbrot, Benoit. The variation of certain speculative prices. Journal of Business. 1963, 36 (1): 394–419. doi:10.1086/294632.
^ Hatemi-J, A. Asymmetric causality tests with an application. Empirical Economics. 2012, 42 (6): forthcoming. doi:10.1007/s00181-011-0484-x.
^ ^10.0 ^10.1 Baum, Christopher F.; Hurn, Stan; Otero, Jesús. Testing for time-varying Granger causality. The Stata Journal: Promoting communications on statistics and Stata. 2022-06, 22 (2) [2024-01-05]. ISSN 1536-867X. doi:10.1177/1536867X221106403. （原始内容存档于2024-01-05）（英语）.
^ Shojaie, Ali; Fox, Emily B. Granger Causality: A Review and Recent Advances. Annual Review of Statistics and Its Application. 2022-03-07, 9 (1) [2024-01-05]. ISSN 2326-8298. PMC 10571505  . PMID 37840549. doi:10.1146/annurev-statistics-040120-010930. （原始内容存档于2022-11-09）（英语）.
^ Ante, Lennart; Saggu, Aman. Time-Varying Bidirectional Causal Relationships between Transaction Fees and Economic Activity of Subsystems Utilizing the Ethereum Blockchain Network. Journal of Risk and Financial Management. 2024-01, 17 (1). ISSN 1911-8074. doi:10.3390/jrfm17010019 （英语）.