第 5 章 檢定


在計量或統計上,估計完畢後的問題就是檢定或診斷。本章整理出幾個實證研究使用的檢定。


5.1 固定效果模型之下個別效果的顯著性檢定


如果估計的模型設定是「固定效果」,我們就要檢定,用擴張的虛擬變數矩陣(LSDV)方法所估計出的個別效果,是否統計上不顯著(Statistical insignificance)?虛無假設如下:
\[ {{H}_{0}}:{{\mu }_{1}}={{\mu }_{2}}=\cdots {{\mu }_{N-1}}=0 \]
像上面的虛無假設,也隱含了橫斷面N的異質性是否可以統計上不顯著,或可忽略?
檢定的方法如標準的 \(F\) 統計量,類似ANOVA的概念,建立在殘差平方和(RSS=Residual Sum of Squares)。如下:

\[ Cross \;section\text{ }F=\frac{\frac{RRSS-URSS}{N-1}}{\frac{URSS}{NT-N-K}} \]
除了 \(F\) 檢定,另一個方是就是概似比率(Likelihood ratio, LR)檢定,\(LR\) 檢定量在漸進上是卡方分配,所以一般也稱為卡方檢定。
\[ Cross \;section\text{ }LR=2(\log {{L}_{U}}-\log {{L}_{R}}) \]
R 有兩個作法,第1個是pFtest,如下:

pFtest(gsp_fe, gsp_pool) 
## 
##  F test for individual effects
## 
## data:  EQ
## F = 76.705, df1 = 47, df2 = 762, p-value < 2.2e-16
## alternative hypothesis: significant effects

第1個是pFtest,如下:

pooltest(gsp_pool, gsp_fe)
## 
##  F statistic
## 
## data:  Eq
## F = 76.705, df1 = 47, df2 = 762, p-value < 2.2e-16
## alternative hypothesis: unstability


讀者將兩個結果比較一看,會發現兩個結果的F值都一樣,只是()內的物件次序不同。pooltest()的概念其實是Chow test for stability,但是所建構的檢定量和poolability 之pFtest()是一樣的。可以從兩個結果最後一行alternative hypothesis得知其虛無假設。


5.2 隨機效果模型之下的個別效果


這個檢定和上面一樣的,但是,是檢定由隨機效果估計後的模型。如果是單維模型,虛無假設為 \[ {{H}_{0}}:\sigma _{\mu }^{2}=0 \]
如果是雙維模型,則虛無假設為 \[ {{H}_{0}}:\sigma _{\mu }^{2}=\sigma _{\lambda}^{2}=0 \]
此虛無假設是說:橫斷面效果的變異數為0,也就是i沒有橫斷面差異,或是隨機效果產生的\(N\)個個別效果,統計上沒有顯著差異(Statistical insignificance)。對於檢定,最常用的是Breusch and Pagan (1980) 提出的LM檢定量。這個檢定量須要的一個重要資訊是殘差的常態分配概似函數,如下
\[ \tag{5.1} L(b,\theta )=\text{constant}-\frac{1}{2}\log |\Omega |-\frac{1}{2}{u}'{{\Omega }^{-1}}u \]
Eq.(5.1)中,b為解釋變數之估計係數,如果是雙維模型,參數向量\(\theta\)\({\theta }'=(\sigma _{\mu }^{2},\sigma _{\lambda }^{2},\sigma _{\varepsilon }^{2})\);如果是單維,則\({\theta }'=(\sigma _{\mu }^{2},\sigma _{\varepsilon }^{2})\)


Breusch and Pagan (1980) 建構之檢定計量,須要對Eq.(5.1)做偏微分取出資訊矩陣(information matrix)。處理後如下:
第2個檢定量LM1針對單獨的個別效果,如下:
\[ {{H}_{0}}:\sigma _{\mu }^{2}=0 \] \[ \tag{5.2A} LM_1=A^2 \]
\(A=\sqrt{\frac{NT}{2(T-1)}}\left[ \frac{{\tilde{u}}'({{\mathbf{I}}_{\mathbf{N}}}\otimes {{\mathbf{\tau }}_{\mathbf{T}}})\tilde{u}}{{\tilde{u}}'\tilde{u}}-1 \right]\)


第2個檢定量LM2,則是針對單獨的期間效果,如下:
\[ {H_0}:\sigma _{\lambda }^{2}=0 \]
\[ \tag{5.2B} LM_2=B^2 \]
\(B=\sqrt{\frac{NT}{2(N-1)}}\left[ 1-\frac{{\tilde{u}}'({{\mathbf{\tau }}_{\mathbf{N}}}\otimes {{\mathbf{I}}_{\mathbf{T}}})\tilde{u}}{{\tilde{u}}'\tilde{u}} \right]\)
Breusch-Pagan的 LM統計量十分簡便,只須要OLS之下的殘差 即可,這也是這個檢定很普及的原因。Panel Data 大師 Baltagi (1981a) 對Breusch-Pagan的 LM的性質作了模擬測試,發現Breusch-Pagan的LM檢定力(Power)和型一誤差(Size)的表現都相當好。只有當被檢定的變異數趨近0時,會產生變異數估計為負的狀況,而有不好的表現。


以LM為基礎,學者們紛紛提出LM的修正檢定量。Breusch-Pagan 的LM檢定量假設了對立假設是雙尾,但是,變異數不會有負值,因此,更準的檢定須要對立假設為單尾才正確。 Honda (1985) 對此提出了修正的uniformly most powerful 統計量,他的統計量honda是對LM1開根號的簡單變化,檢定如下:
\[ {{H}_{0}}:\sigma _{\mu }^{2}=0 \]
\[ \tag{5.3} \text{honda}=\sqrt{\frac{NT}{2(T-1)}}\left[ \frac{{\tilde{u}}'({{\mathbf{I}}_{\mathbf{N}}}\otimes {{\mathbf{\tau }}_{\mathbf{T}}})\tilde{u}}{{\tilde{u}}'\tilde{u}}-1 \right]\sim N(0,1) \]
Honda (1985) 的統計量證明為標準常態分配,其實也是LM1的A之翻版,然而他主要的貢獻為證明了honda檢定量,在非常分配時的穩健性(robustness)。對於這個檢定量標準常態分配性質,如果解釋變數很多時或解釋變數之間有高度線性重和時,檢定表現會不好,詳細的理論,讀者可以參考 Moulton and Randolph (1989)

在Honda的架構, King and Wu (1997) 提出locally mean most powerful的單邊檢定,這個檢定量和Honda 的honda 統計量一致,漸進上也是標準常態分配。
\[ {{H}_{0}}:\sigma _{\mu }^{2}=0 \]
\[ \tag{5.4} KW=\sqrt{\frac{NT}{2(N-1)}}\left[ \frac{{\tilde{u}}'({{\mathbf{\tau }}_{\mathbf{N}}}\otimes {{\mathbf{I}}_{\mathbf{T}}})\tilde{u}}{{\tilde{u}}'\tilde{u}}-1 \right]\sim N(0,1) \]
KW其實也是LM2的B之翻版。如果要檢定兩者,也就是結合檢定
\[ {{H}_{0}}:\sigma _{\mu }^{2}=\sigma _{\lambda }^{2}=0 \]
Breusch-Pagan的雙尾檢定LM,就是 \(LM_{1}+LM_{2} \sim \chi^2(2)\)
\[ \tag{5.5} \begin{align} LM &=\frac{NT}{2(T-1)}{{\left[ 1-\frac{{\tilde{u}}'({{\mathbf{I}}_{\mathbf{N}}}\otimes {{\mathbf{\tau }}_{\mathbf{T}}})\tilde{u}}{{\tilde{u}}'\tilde{u}} \right]}^{2}} \\ & +\frac{NT}{2(N-1)}{{\left[ 1-\frac{{\tilde{u}}'({{\mathbf{\tau }}_{\mathbf{N}}}\otimes {{\mathbf{I}}_{\mathbf{T}}})\tilde{u}}{{\tilde{u}}'\tilde{u}} \right]}^{2}} \\ \end{align} \]
Honda (1985) 論文沒有直接在理論上處理這個結合檢定虛無假設,只是建議了一個很方便的做法,就是(5.3)+(5.4)再除根號2。
\[ \tag{5.6} honda2:\frac{honda+KW}{\sqrt{2}}\sim N(0,1) \] Eq.(5.6)的漸進性質,也是標準常態分配。
Baltagi and Li (1992) 修正KW型的locally mean most powerful檢定,來處理這個結合檢定。
\[ KW2=\frac{\sqrt{T-1}}{\sqrt{N+T-2}}honda+\frac{\sqrt{N-1}}{\sqrt{N+T-2}}KW\sim N(0,1) \]
這個檢定量的漸進性質,也是標準常態分配。
最後,我們介紹 Gouriéroux, Holly, and Monfort (1982) 的卡方檢定量。LM的問題是當變異數很小時,容易在估計時估成負值,在結合檢定中,只要任一個變異數成分為婦的檢定就會出現問題,就算兩者相加後抵銷了負值,這個問題也持續的干擾了檢定量的表現。GHM的檢定量則利用了賦予條件的方式,建構統計量。 Baltagi and Li (1992) 進一步的修正為混和卡方分配,更為完整易解,我們用下標 \(m\) 代表混和(mixed)一詞。概念如下:
\[ \chi _{m}^{2}=\left\{ \begin{matrix} L{{M}_{1}}+L{{M}_{2}} \\ L{{M}_{1}} \\ L{{M}_{2}} \\ 0 \\ \end{matrix} \right.\begin{matrix} {} \\ {} \\ {} \\ {} \\ \end{matrix}\begin{matrix} {} \\ {} \\ {} \\ {} \\ \end{matrix}\begin{matrix} \text{if A}>\text{0,B}>\text{0} \\ \text{if A}>\text{0,B}\le \text{0} \\ \text{if A}\le \text{0,B}>\text{0} \\ \text{if A}\le \text{0,B}\le \text{0} \\ \end{matrix} \] GHM的檢定量也是卡方分配。
執行這四個檢定量時,要注意,這四個檢定量,執行GHM 和KW時,必須估計「雙維」模型。另外兩者,單維雙維模式皆可。R實做如下:


R Code: Honda統計量,檢定「單維」隨機效果之個別效果是否為0。

plmtest(gsp_pool, effect="individual", type="honda")
## 
##  Lagrange Multiplier Test - (Honda)
## 
## data:  Eq
## normal = 63.708, p-value < 2.2e-16
## alternative hypothesis: significant effects


R Code: Breusch-Pagan統計量,檢定「單維」隨機效果之個別效果是否為0。

plmtest(gsp_pool, effect="individual", type="bp")
## 
##  Lagrange Multiplier Test - (Breusch-Pagan)
## 
## data:  Eq
## chisq = 4058.7, df = 1, p-value < 2.2e-16
## alternative hypothesis: significant effects

R Code: GHM統計量,檢定「雙維」隨機效果之個別效果是否為0

plmtest(gsp_pool, effect="twoways", type="ghm")
## 
##  Lagrange Multiplier Test - two-ways effects (Gourieroux, Holly and
##  Monfort)
## 
## data:  Eq
## chibarsq = 4060.3, df0 = 0.00, df1 = 1.00, df2 = 2.00, w0 = 0.25, w1 =
## 0.50, w2 = 0.25, p-value < 2.2e-16
## alternative hypothesis: significant effects

R Code: KW統計量,檢定「雙維」隨機效果之個別效果是否為0

plmtest(gsp_pool, effect="twoways", type="kw") 
## 
##  Lagrange Multiplier Test - two-ways effects (King and Wu)
## 
## data:  Eq
## normal = 33.219, p-value < 2.2e-16
## alternative hypothesis: significant effects


由 p-value可知,橫斷面 \(N\) 具有隨機形式的差異性,估計時必須納入考慮。R 的這個檢定,彈性蠻多。
plmtest()是檢定隨機效果設定下的個別效果是否皆相等(無差異),effect 和 type都有多種選項:

effect: 有3種
 “individual”
 “time”
 “twoways”

type: 有4種。
 honda = Honda (1985) , 是內定檢定量;
 bp = Breusch and Pagan (1980) Random Effects LM test;
 ghm = Gouriéroux, Holly, and Monfort (1982) 檢定量;
 kw = King and Wu (1997) 檢定量

5.3 隨機效果vs.固定效果


隨機效果較好還是固定效果較好,是一個須要檢定的問題。在計量上我們使用著名的 Hausman (1978) Test for random effect。虛無假設表示如下:
\[ H_{0}:E(u_{it}|X_{it})=0 \]
此虛無假設檢定的是解釋變數和殘差無關,也就是無內生性。其檢定量為
\[ \tag{5.8} hausman=\frac{({{{\hat{b}}}_{RE}}-{{{\hat{b}}}_{FE}}{)}'({{{\hat{b}}}_{RE}}-{{{\hat{b}}}_{FE}})}{{\hat{\Sigma }}} \]
Eq.(5.8)中,\(\hat{\Sigma }=\operatorname{var}({{\hat{b}}_{FE}})-\operatorname{var}({{\hat{b}}_{RE}})\) ;下標符號 RE 代表隨機效果,FE 代表固定效果。 虛無假設的條件期望值其實就是一個線性迴歸。在虛無假設之下,個別效果、殘差和解釋變數間統計上無關。因為\({{u}_{it}}={{\mu }_{i}}+{{v}_{it}}\) ,所以個別效果是殘差的一部份,與殘差無關,也就是與殘差內的成分無關。如之前所說,隨機效果是橫斷面個別項和解釋變數之間的關係是隨機的,也就是說這關係的期望值是0,也就是統計上無關。
因此,這個虛無假設其實就是內生性檢定:在虛無假設正確的前提,代表殘差,或個別效果項,和解釋變數無關,或無內生性。這樣的情形,隨機效果GLS估計的結果,比固定效果的固定效果的LSDV要好。 所以,接受虛無假設,是說隨機效果「比較好」,而不是說隨機效果是「正確」的設定,固定效果不正確。Hausman 檢定是一種推論,建立在內生性存在與否的推論。用「正確」與否看待 Hausman檢定 檢定的結果,過於沈重。
Hausman Test 的精神是內生性檢定,解說摘要如下:
 第1.當虛無假設H0被接受。
  A. 隨機效果GLS和固定效果LSDV估計的參數都是一致(consistent)的。
  B. 隨機效果比固定效果設定的估計的變異數要有效率(efficient)。
 第2. 當虛無假設H0被拒絕。
  A. 隨機效果GLS估計式則不一致(inconsistent)。
  B. 固定效果LSDV的估計參數,仍然是一致的。

接下來說明一下Hausman檢定的代數結構。令\(q={{\hat{b}}_{RE}}-{{\hat{b}}_{FE}}\) ,如果H0是正確的,則滿足兩項條件:
\(\text{p}\lim \text{ }q=0\)\(\operatorname{cov}(q,{{\hat{b}}_{RE}})=0\)
因為 \({{\hat{b}}_{RE}}-\beta ={{({X}'{{\Omega }^{-1}}X)}^{-1}}{X}'{{\Omega }^{-1}}u\)\({{\hat{b}}_{FE}}-\beta ={{({X}'{{Q}^{-1}}X)}^{-1}}{X}'{{Q}^{-1}}u\)
所以,E(q)=0 且
\[ \begin{align} \operatorname{cov}({{{\hat{b}}}_{RE}},q)&=\operatorname{var}({{{\hat{b}}}_{RE}})-\operatorname{cov}({{{\hat{b}}}_{RE}},{{{\hat{b}}}_{FE}}) \\ & ={{({X}'{{\Omega }^{-1}}X)}^{-1}}-{{({X}'{{\Omega }^{-1}}X)}^{-1}}{X}'{{\Omega }^{-1}}E(u{u}')QX{{({X}'QX)}^{-1}} \\ & ={{({X}'{{\Omega }^{-1}}X)}^{-1}}-{{({X}'{{\Omega }^{-1}}X)}^{-1}} \\ &=0 \end{align} \]
又由\({{\hat{b}}_{FE}}={{\hat{b}}_{RE}}-q\) ,可得 \[ \begin{align} \operatorname{var}({{{\hat{b}}}_{FE}})&=\operatorname{var}({{{\hat{b}}}_{RE}})-2\operatorname{cov}({{{\hat{b}}}_{RE}},q)+\operatorname{var}(q)\text{ } \\ & = \operatorname{var}({{{\hat{b}}}_{RE}})+\operatorname{var}(q) \\ & \because \operatorname{cov}({{{\hat{b}}}_{RE}},q)=0 \\ \end{align} \]
\[ \tag{5.9} \begin{align} \operatorname{var}(q) &= \operatorname{var}({{{\hat{b}}}_{FE}})-\operatorname{var}({{{\hat{b}}}_{RE}}) \\ &=\sigma _{\varepsilon }^{2}{{({X}'QX)}^{-1}}-{{({X}'{{\Omega }^{-1}}X)}^{-1}} \\ \end{align} \]
因此,我們可以得到Eq.(5.8)檢定量的分母 \(\Sigma\) 。執行Hausman test判斷 「隨機效果vs.固定效果」的R程式如下:

phtest(gsp_re, gsp_fe)
## 
##  Hausman Test
## 
## data:  Eq
## chisq = 25.628, df = 6, p-value = 0.0002611
## alternative hypothesis: one model is inconsistent

使用phtest()必須注意:第1個物件必須是隨機效果估計結果之物件(gsp_re),第2個是固定效果估計結果的物件(gsp_fe)。次序不可以換。
根據 p-value 拒絕無內生性之虛無假設,這個模型的個別效果和解釋變數之間有內生性。因此,固定效果設定估計的參數,會比隨機效果的結果較好。
在進行實證研究的時候,有些時候會困惑於固定效果和隨機效果的選擇。計量學者對此的看法相當一致,並不會以統計檢定當作上帝。可以摘要如下:
 第1.依據統計條件判斷,好比特定檢定量如Hausman test,Likelihood ratio test等等,或其他有關內生性問題以及配適度比較的統計檢定。
 第2.依照資料的屬性。如果您模型的解釋變數有一些是特徵啞變數,例如,「男性=1, 女性=0」或「產業代號」等等數據。這些數據使用固定效果時,因為 \(Q-transform\) 的移除平均數動作,將這些資料都移除了。如果這些資料前的係數,對研究是重要的,研究者,自然須要使用隨機效果。

5.4 序列相關檢定


追蹤資料的時間維度這麼小,和時間有關的序列相關檢定重要嗎?要解釋它的重要性,我們這樣來看問題。
綜合前面的寫法,我們先重述一下重要的基本觀念。如一個panel data迴歸方程式:
\[ \tag{5.10A} {{y}_{it}}=a+b{{x}_{it}}+{{u}_{it}} \]
\(u_{it}\) 是複合殘差成分(composite errors),因此可以寫成
\[ {{u}_{it}}={{\mu }_{i}}+{{\varepsilon }_{it}} \]
所以,也可以寫成 Eq.(5.10A)
\[ \tag{5.10B} {{y}_{it}}=a+b{{x}_{it}}+{{\mu }_{i}}+{{\varepsilon }_{it}} \]
\(Q-transform\) 後的固定效果方程式可以寫成
\[ y_{it} - \bar{y}_{i}=b(x_{it}-\bar{x}_{1i})+(\varepsilon_{it}-\bar{\varepsilon}_{i}) \]
在固定效果之下, \(Q-transform\) 就是對資料作time-demean。time-demean 之後,就是一個pooled OLS regression。對於pooled regression 相對有效率的要件,就是殘差也是「同質變異」且「無序列相關」,也就是 也是「同質變異」且「無序列相關」,也就是 \((\varepsilon_{it}-\bar{\varepsilon}_{i})\) 也是「同質變異」且「無序列相關」,也就是
\(\operatorname{var}\left( {{\varepsilon }_{it}}-{{{\bar{\varepsilon }}}_{i}} \right)=E{{({{\varepsilon }_{it}}-{{\bar{\varepsilon }}_{i}})}^{2}}-{{\left[ E({{\varepsilon }_{it}}-{{{\bar{\varepsilon }}}_{i}}) \right]}^{2}}\)
因為 \(E({{\varepsilon }_{it}}-{{\bar{\varepsilon }}_{i}})={{\bar{\varepsilon }}_{i}}-{{\bar{\varepsilon }}_{i}}=0\)

\[ \tag{5.12} \begin{align} \operatorname{var}\left( {{\varepsilon }_{it}}-{{{\bar{\varepsilon }}}_{i}} \right)&=E{{({{\varepsilon }_{it}}-{{{\bar{\varepsilon }}}_{i}})}^{2}}=E(\varepsilon _{it}^{2}-2{{\varepsilon }_{it}}{{{\bar{\varepsilon }}}_{i}}+\bar{\varepsilon }_{it}^{2}) \\ & =E(\varepsilon _{it}^{2})-2E({{\varepsilon }_{it}}{{{\bar{\varepsilon }}}_{i}})+E(\bar{\varepsilon }_{it}^{2}) \\ & =\sigma _{\varepsilon }^{2}-2E({{\varepsilon }_{it}}\frac{\sum{{{\varepsilon }_{it}}}}{T})+E{{(\frac{\sum{{{\varepsilon }_{it}}}}{T})}^{2}} \\ & =\sigma _{\varepsilon }^{2}-\frac{2\sigma _{\varepsilon }^{2}}{T}+\frac{T\sigma _{\varepsilon }^{2}}{{{T}^{2}}} \\ & =\sigma _{\varepsilon }^{2}-\frac{2\sigma _{\varepsilon }^{2}}{T}+\frac{\sigma _{\varepsilon }^{2}}{T} \\ & =\sigma _{\varepsilon }^{2}(\frac{T-1}{T}) \\ \end{align} \]
Eq.(5.12)的得出是基於\({{\varepsilon }_{it}}\sim iid(0,\sigma _{\varepsilon }^{2})\),故
\(E{{\varepsilon }_{it}}{{\varepsilon }_{is}}=0,s\ne t\)

\(E{{\varepsilon }_{it}}{{\varepsilon }_{is}}=\sigma _{\varepsilon }^{2},s=t\)
所以大多數的交叉乘積都可以消除。Eq.(5.12)的結果,確認了time-demean的殘差 \((\varepsilon_{it}-\bar{\varepsilon}_{i})\) 的非條件(unconditional)同質變異為
\(\sigma_{\varepsilon }^{2}(\frac{T-1}{T})\)

再來就是 \((\varepsilon_{it}-\bar{\varepsilon}_{i})\) 的序列相關,可由不同期 \(s \ne t\) 共變異數導出來

\[ \begin{align} & E[({{\varepsilon }_{it}}-{{{\bar{\varepsilon }}}_{i}})({{\varepsilon }_{is}}-{{{\bar{\varepsilon }}}_{i}})] \\ & =E[{{\varepsilon }_{it}}{{\varepsilon }_{is}}]-E[{{\varepsilon }_{it}}{{{\bar{\varepsilon }}}_{i}}]-E[{{\varepsilon }_{is}}{{{\bar{\varepsilon }}}_{i}}]+E[\bar{\varepsilon }_{i}^{2}] \\ & =0-\frac{\sigma _{\varepsilon }^{2}}{T}-\frac{\sigma _{\varepsilon }^{2}}{T}+-\frac{\sigma _{\varepsilon }^{2}}{T} \\ & =-\frac{\sigma _{\varepsilon }^{2}}{T}<0 \\ \end{align} \tag{5.14} \]
Eq.(5.14)的相關係數就是固定效果設定下(5.11)的序列相關,這個式子,有2個含意:  (1)固定效果設定之下的殘差項,具有負的序列相關。  (2)隨著時間增加序列相關會遞減,\(T \to \infty\) 時,序列相關的影響就會消失。 估計隨機效果時,不是將方程式想成 Eq.(5.10B)的樣子,隨機效果是共變異數矩陣,就是如下Eq.(3.9),
\({{\Omega }_{\mu ,\varepsilon }}={{\text{I}}_{\text{N}}}\otimes {{\Sigma }_{\mu ,\varepsilon }}=\sigma _{\mu }^{2}\left( {{\text{I}}_{\text{N}}}\otimes {{\text{J}}_{\text{N}}} \right)+\sigma _{\varepsilon }^{2}\left( {{\text{I}}_{\text{N}}}\otimes {{\text{I}}_{\text{T}}} \right)\)
只和個別效果的變異數 \(\sigma^2_{\mu}\) 和殘差變異數 \(\sigma^2_{\varepsilon}\) 有關。故,
\[ \operatorname{cov}({{u}_{it}},{{u}_{is}})=\left\{ \begin{align} & \sigma _{\mu }^{2}+\sigma _{\varepsilon }^{2} \begin{matrix} \end{matrix} & t=s \\ & \sigma _{\mu }^{2} \begin{matrix} \end{matrix} & t\ne s \\ \end{align} \right. \tag{5.15} \]
根據Eq. (5.15),隨機效果之下,複合殘差成分的序列相關( \(t \ne s\) )
\[ \tag{5.16} \rho ({{u}_{it}},{{u}_{is}})=\frac{\sigma _{\mu }^{2}}{\sigma _{\mu }^{2}+\sigma _{\varepsilon }^{2}}>0 \]
因此,隨機效果設定之下的殘差是有序列相關的,且這個序列相關恆正,且不會因時間增長消失。因此,不論是固定效果或個別效果,只要個別效果存在,序列相關和模型之間,就存在密切關係。例如,對一個pooling regression的殘差做序列相關檢定,可以推論出固定效果還是隨機效果設定比較好。另外,因為兩種效果的設定,皆有序列相關,因此,序列相關的程度,影響了估計時是否要進行序列相關修正。所以,序列相關檢定就很重要。
接下來,我們介紹幾種檢定。
 第1種針對pooling OLS迴歸殘差的序列相關檢定,檢定觀察不到效果 (Unobserved effect test)。這類檢定是對pooled OLS 殘差的序列相關檢定,意義有二:
  (1) 如果沒有序列相關,則pooled OLS估計的條件期望值,是一個完整估計值。
  (2) 檢視是否須要對pooled OLS執行穩健變異數。

虛無假設如下
\[ H_{0}: \sigma^2_{\mu}=0 \]
這個虛無假設和前面介紹的Breusch and Pagan檢定之虛無假設一樣, 但是, 這是建立在Eq.(5.16)的序列相關性。因此,其推論意義,有所不同,如下:
  (1) 如果虛無假設是正確的,代表資料沒有個別異質性\(\mu_i\) ,因此,複合殘差就只剩下 \(\varepsilon\) ,因此Pooled OLS 就是一個好的設定。簡單的說,就是不須要考慮 Panel Data諸多問題。
  (2) 但是,Wooldridge (2010) 指出,拒絕此虛無假設時,並不能推論隨機效果設定為真(True)。因為拒絕虛無假設,往往是因為會因為複合殘差有序列相關所導致。
Wooldridge (2010) 的檢定量是半參數式(semi-parametric)檢定,定義如下:
\[ \tag{5.17} W=\frac{\sum\limits_{i=1}^{n}{\sum\limits_{t=1}^{T-1}{\sum\limits_{s=t+1}^{T}{{{u}_{it}}{{u}_{is}}}}}}{\sqrt{\sum\limits_{i=1}^{n}{{{\left( \sum\limits_{t=1}^{T-1}{\sum\limits_{s=t+1}^{T}{{{u}_{it}}{{u}_{is}}}} \right)}^{2}}}}} \]
 第2種是對固定效果的time-demean殘差\(\varepsilon_{it}-\bar \varepsilon_{i}\) 檢定其同質變異和無序列相關。這個檢定使用的是傳統的系列相關檢定,例如,Durbin-Watson 和Breusch-Godfrey LM檢定。但是,如Eq.(5.14) 指出。此序列相關當T很大時,會越來越小;因此,T要大,不然使用這種檢定時,會有檢定力太小的問題。
 第3種則是針對上述問題,Wooldridge (2010) 建議:如果固定校果的時間較短,則直接對固定效果殘差執行AR(1)迴歸,
\[ \begin{align} & ({{\varepsilon }_{it}}-{{{\bar{\varepsilon }}}_{i}})=b({{\varepsilon }_{it-1}}-{{{\bar{\varepsilon }}}_{i}})+{{\nu }_{it}} \\ & {{\varepsilon }_{it}}=a+\delta {{\varepsilon }_{it-1}}+{{\eta }_{it}} \\ \end{align} \] \[ \tag{5.18} {H_0}:\delta =-\frac{1}{T-1} \]
應用標準的 \(t\) 檢定,如果接受虛無假設,代表有序列相關,拒絕的話,就是無序列相關。
 第4種稱為局部穩健檢定(locally robust test)。

綜合上面所談到的狀況,隨機效果的存在會影響殘差序列相關的檢定,反之亦然。所以,解決方案就是使用結合檢定(joint test):同時檢定序列相關和隨機效果。針對這個問題, Baltagi and Li (1991)Baltagi and Li (1995) 假設了殘差 \(\varepsilon\) 為常態分配和同質變異,導出了LM檢定量。這個檢定的數學細節,請參閱 Baltagi (2013) 第5章。
前述LM結合檢定的問題是:如果接受了虛無假設(無隨機效果且無序列相關),那就單純多了。但是,一旦拒絕此虛無假設,那就不知道是誰造成的。隨機效果?序列相關?還是兩者? Bera, Sosa-Escudero, and Yoon (2001) 提出了修正前面問題的 locally robust tests。雖然依賴常態分配和同質變異, 但是檢定的結果,對於偏離虛無假設的方向,具有局部穩健特性。這個檢定量,隨然是次佳,但有助於辨認是何種原因,導致拒絕虛無假設;而且,數值演算的難度較低。
綜合說來,如果沒有序列相關,則Breusch-Pagan的家族,是隨機效果檢定的最佳檢定量。如果沒有隨機效果,則Breusch-Godfrey’s 的序列相關檢定,是最佳檢定。如果有隨機效果,則 LM test of Baltagi and Li (1995) 的LM是最佳序列相關檢定。
 第5種也是最後一種的,是檢定是在隨機效果之下,檢定序列相關的條件LM(Conditional LM)檢定 (Baltagi and Li, 1991,1995)。虛無假設是無序列相關,拒絕虛無假設之後,有序列相關時的形式,可能是AR結構,也可能是MA結構。Baltagi and Li (1991, 1995)的檢定,對於拒絕虛無假設時,對立假設不論是AR(1)或 MA(1),都一樣。這個檢定依然假設殘差 \(\varepsilon\) 為常態分配及具有同質變異。

套件plm提供多種方式檢定序列相關:
Wooldridge’s test for unobserved individual effects

plm::pwtest(gsp_pool)
## 
##  Wooldridge's test for unobserved individual effects
## 
## data:  formula
## z = 3.8963, p-value = 9.767e-05
## alternative hypothesis: unobserved effect


再來就是Durbin-Watson 追蹤資料版的序列相關檢定

plm::pdwtest(gsp_re)
## 
##  Durbin-Watson test for serial correlation in panel models
## 
## data:  Eq
## DW = 0.59303, p-value < 2.2e-16
## alternative hypothesis: serial correlation in idiosyncratic errors


再來執行 Bera, Sosa-Escudero, and Yoon (2001) 的locally robust test

plm::pbsytest(gsp_pool, alternative = c("twosided","onesided")[2])
## 
##  Bera, Sosa-Escudero and Yoon locally robust test
## 
## data:  formula
## chisq = 55.698, df = 1, p-value = 8.45e-14
## alternative hypothesis: AR(1) errors sub random effects


上述檢定pbsytest()的對立假設有兩種:“twosided”和”onesided”.
讀者可以試試另一個的結果。
最後一個檢定pwartest()需要呼叫模組car內的檢定函數 linearHypothesis(),所以前一行要載入 library(car)


最後一個就是固定效果下的Wooldridge 序列相關檢定

#library(car)
plm::pwartest(gsp_fe)
## 
##  Wooldridge's test for serial correlation in FE panels
## 
## data:  gsp_fe
## F = 702.98, df1 = 1, df2 = 766, p-value < 2.2e-16
## alternative hypothesis: serial correlation

References

Baltagi, Badi H. 1981a. “Pooling: An Experimental Study of Alternative Testing and Estimation Procedures in a Two-Way Error Component Model.” Journal of Econometrics 17 (1): 21–49. https://EconPapers.repec.org/RePEc:eee:econom:v:17:y:1981:i:1:p:21-49.
———. 2013. Econometric Analysis of Panel Data. Fifth Edition. Chichester, West Sussex: John Wiley & Sons, Inc.
Baltagi, Badi H., and Qi Li. 1991. “A Joint Test for Serial Correlation and Random Individual Effects.” Statistics & Probability Letters 11 (3): 277–80. https://doi.org/https://doi.org/10.1016/0167-7152(91)90156-L.
———. 1992. “Prediction in the One-Way Error Component Model with Serial Correlation.” Journal of Forecasting 11 (6): 561–67. https://doi.org/https://doi.org/10.1002/for.3980110605.
———. 1995. “Testing AR(1) Against MA(1) Disturbances in an Error Component Model.” Journal of Econometrics 68 (1): 133–51. https://doi.org/https://doi.org/10.1016/0304-4076(94)01646-H.
Bera, Anil K., Walter Sosa-Escudero, and Mann Yoon. 2001. “Tests for the Error Component Model in the Presence of Local Misspecification.” Journal of Econometrics 101 (1): 1–23. https://doi.org/https://doi.org/10.1016/S0304-4076(00)00071-3.
———. 1980. “The Lagrange Multiplier Test and Its Applications to Model Specification in Econometrics.” The Review of Economic Studies 47 (1): 239–53. https://doi.org/10.2307/2297111.
Gouriéroux, Christian, Alberto Holly, and Alain Monfort. 1982. “Likelihood Ratio Test, Wald Test, and Kuhn-Tucker Test in Linear Models with Inequality Constraints on the Regression Parameters.” Econometrica 50 (1): 63–80. https://doi.org/10.2307/1912529.
Hausman, Jerry A. 1978. “Specification Tests in Econometrics.” Econometrica 46 (6): 1251–71. https://doi.org/10.2307/1913827.
Honda, Yuzo. 1985. “Testing the Error Components Model with Non-Normal Disturbances.” The Review of Economic Studies 52 (4): 681–90. https://doi.org/10.2307/2297739.
King, Maxwell L., and Ping X. Wu. 1997. “Locally Optimal One-Sided Tests for Multiparameter Hypotheses.” Econometric Reviews 16 (2): 131–56. https://doi.org/10.1080/07474939708800379.
Moulton, Brent R., and William C. Randolph. 1989. “Alternative Tests of the Error Components Model.” Econometrica 57 (3): 685–93. https://doi.org/10.2307/1911059.
Wooldridge, Jeffrey M. 2010. Econometric Analysis of Cross Section and Panel Data. 2nd ed. Cambridge, Mass.: MIT Press.