本書全面介紹計量經濟學的主要理論和方法, 在數學描述方面適當淡化, 以講清楚方法、思路為目標, 不做大量的推導和證明, 重點放在如何運用各種計量經濟方法對實際的經濟問題進行分析、建模、預測、模擬等實際操作上。本書中的實際案例大多數是作者在實踐中運用的實例和國內外的經典實例, 并基于EViews軟件來介紹實際應用, 具有很強的可操作性。
第3版前言
本書第3版得到國家社會科學基金重大項目“新常態下我國宏觀經濟監測和預測研究”(15ZDA011)、國家自然科學基金項目“中國經濟周期波動的轉折點識別、階段轉換及預警研究”(71573105)的資助。
近年來隨著大數據的發展,在經濟領域涌現出各類數據庫,包含了國內外大量的宏觀數據、各層次的面板數據、定期的微觀調查數據(企業或個人)、越來越廣泛和細分的產業數據等數據信息,這些豐富的數據信息極大地推動了計量經濟學的快速發展,拓展了計量經濟學的研究范圍,增加了計量經濟學研究的實用性,給計量經濟學研究提供了更大的空間、更新的視角,注入了新的動力。目前,計量經濟學和微觀經濟學與宏觀經濟學一起構成了中國經濟類、管理類本科生和研究生必修的三門經濟學核心課程,同時計量經濟模型在經濟理論研究和經濟問題分析中已經被廣泛應用,并取得了豐碩的成果。
為了追蹤和反映大數據背景下計量經濟學的新發展,本書的第3版增加了一些計量經濟學的新理論、方法與應用實例,對本書第2版做了較大的修改。第3版增加和修改的主要內容如下。
(1) 第2章增加了兩個內容: ①介紹了幾種經濟數據類型的概念和處理方法,以及多種數據頻率的轉換方法,在做經濟計量分析時,對于收集到的原始經濟數據往往經過處理才能使用,因此建模前需對所獲得指標進行處理,并且還要對不同數據頻率(如年度、季度或月度)進行數據頻率轉換,使其具有可信性、合理性和一致性; ②X13ARIMASEATS季節調整方法和TRAMO/SEATS季節調整方法的基本原理和功能,這節是對第2版中季節調整方法的修改。
(2) 第4章增加了兩個內容: ①穩健*小二乘法(robust least squares),當估計回歸模型時,普通*小二乘估計量對異常值(奇異值)的存在是敏感的。這些異常觀測值的敏感性可能會破壞變量之間的潛在統計關系,而穩健*小二乘法是針對異常值而設計的,書中包括3種穩健*小二乘估計: M估計、S估計和MM估計; ②有限信息極大似然估計(LIML)和K類估計方法,它們優于傳統的二階段*小二乘估計。
(3) 第5章增加了4個內容: ①突變點單位根檢驗(breakpoint unit root test),介紹了具有突變點的時間序列的基本概念、突變點單位根檢驗的基本原理以及幾種常用的檢驗方法; ②ARFIMA模型,又稱自回歸分整動平均模型,在自回歸和動平均模型的基礎上,允許非整數階的序列差分; ③自回歸分布滯后模型(ARDL),可以通過建立包含多期因變量和自變量滯后的ARDL進行建模; ④介紹了基于殘差的協整檢驗的兩種方法: EngleGranger檢驗和PhillipsOuliaris檢驗方法的基本原理和檢驗步驟。
(4) 第7章改動較大,增加了兩個內容、8個實例: ①赫克曼(Heckman)以微觀經濟理論來解釋個體數據而提出的Heckman樣本選擇模型; ②廣義線性模型(generalized linear models, GLMs)是常見的普通線性模型的直接推廣,它可適用于因變量為連續型數據和離散型數據兩種情況,在實際應用中離散型因變量的情形更加常見; ③經濟分析中經常會遇到大量的個體和企業的調查數據,這些數據具有很多與時間序列數據不同的特點,常存在離散選擇性問題、數據審查(截斷)、選擇性樣本等問題,一般來說需要采用微觀計量經濟學方法進行定量分析。因此本章增加了8個微觀經濟實例來說明如何運用微觀計量經濟學方法進行建模分析。
(5) 本書新增了第9章: 具有結構變化特征的回歸模型。這章包含3個內容: ①間斷點回歸模型(breakpoints regression); ②門限回歸模型(threshold regression,TR),以嚴格的統計推斷方法對門限值進行參數估計與假設檢驗; ③區制轉換模型,包含馬爾可夫區制轉換模型(Markov Regime Switching Model, MS)。標準的線性回歸模型假定模型參數在樣本區間中是不變的,但是,在時間序列分析領域,樣本區間中參數出現變化(結構變化,structural change)的經驗分析是非常重要的。從間斷點回歸模型,到門限回歸模型,再到區制轉換回歸模型,是依次遞進的。實際上,間斷點回歸模型是結構變化回歸模型的*初形式,其將時間作為一種“門限”,找出間斷點后進行分段回歸; 門限回歸以被解釋變量的滯后項、解釋變量或者其他變量作為門限,不僅對于區制的劃分更為科學,而且對于不同區制內被解釋變量差異化影響因素的解釋更為合理,*重要的是打破了間斷點回歸模型中僅以時間作為門限變量的限制; 在門限回歸模型的基礎上,區制轉換回歸模型研究了不同區制之間的轉換概率等特征,這對于預測而言是一種重要的參考。
(6) 第10章增加了貝葉斯VAR(Bayesian Vector Autoregression,BVAR)模型。VAR模型的主要缺點在于需要估計的參數過多,這將導致模型的過度擬合問題: 盡管模型的樣本內擬合效果良好,但所估計的系數大多不顯著,而且隨著預測期間的延長,樣本外預測效果會迅速惡化。解決過度擬合問題的一種方法是SVAR模型,通過對參數空間施加短期約束和長期約束來減少待估參數; 另一種施加參數約束的方法是基于貝葉斯方法估計VAR模型,本章介紹了BVAR模型的基本思想、方法和應用。
(7) 隨著使用跨國時間序列數據研究購買力平價、經濟增長收斂和國際研發溢出等問題的廣泛開展,面板數據計量經濟學的一個領域開始向宏觀面板數據的研究拓展,同時隨著定期進行微觀調查的各類數據庫的不斷涌現,面板數據計量經濟學的另一個領域也在向微觀面板數據的研究深入開展。由于面板數據模型包含的內容較多,本書將面板數據模型分為兩章,即第11章和第12章。其中,第12章的第3、4節為新增內容。第3節為面板數據的廣義矩方法(PGMM)。面板GMM方法允許隨機誤差項存在異方差和序列相關,所得到的參數估計量比其他參數估計方法更合乎實際。第4節為動態面板模型的估計及檢驗。很多經濟關系本質上都具有動態性,面板數據的優勢之一就在于它可以使研究者更好地理解動態調整過程。刻畫這些動態關系的面板數據回歸模型,即動態面板數據回歸模型具有的共同特征是回歸變量中含有滯后的被解釋變量。本書第12章第4節介紹了兩種動態面板數據模型估計方法: Difference GMM(差分GMM)和Orthogonal Deviations GMM(正交GMM)。
由于計量經濟學課程的課時有限,教師通常沒有足夠的課時幫助學生將所學的模型方法應用于實際的經濟問題中,并通過計算機軟件進行建模、分析和模擬訓練,進而提高運用計量模型進行分析的實際能力,導致了理論教學和實際應用之間的脫節,因此,需要再開設一門應用計量經濟學或計量經濟方法建模的課程。為此,本書寫作的一個重要特色就是注重計量經濟學的理論和實際經濟問題相結合,通過全面介紹計量經濟學的主要理論和方法,將它們納入一個完整、清晰的體系之中。并在此基礎上,提供了大量的基于經濟問題的模型實例,協助教師提高教學效率,增強學生的學習興趣和實際建模能力。本書的作者們都是多年從事計量經濟學教學和研究的教師,融入了作者們教學和科研的體會,書中大多數實際案例是作者們在實踐中運用的實例和國內外的經典實例。同時基于EViews軟件來介紹實際應用技巧,具有很強的可操作性,可以作為應用計量經濟學課程的教材。對于在經濟、統計、金融等領域從事定量分析的工作人員,本書也是一本很好的參考書。
本書的適用范圍: 對于學過初級計量經濟學課程的本科生可以講授本書的第1章、第2章(2.1節、2.2節)、第3章、第4章(4.1節、4.2節)、第5章的部分內容,以及多方程部分的第11章和第14章的簡單內容; 對于學過中高級計量經濟學課程的碩士和博士研究生可以講授第2章、第4章(4.3節~4.10節)、第5章、擴展的單方程分析的第6~9章、多方程部分的第10章、第12~15章。
美國IHS公司2015年推出EViews 9版本軟件,我們購買了該版本軟件。本書的EViews軟件操作部分都采用EViews 9版本軟件。
本書相關實例的原始數據(Excel表)、EViews工作文件和各章課件由于篇幅的原因,第2版中附錄A(EViews軟件基礎)和附錄B(EViews程序設計)被刪除,網上的課件中將保留相應的內容。可以在清華大學出版社網站下載。
本書由下列人員編寫完成本書第1版和第2版的主要作者梁云芳教授不幸因病于2013年10月去世,她所承擔章節(第1版前言和第2版前言已列出)的修改、補充、增加等工作由其他作者來完成,不再標出。: 第1、3、4章,王金明; 第2、10章,陳飛; 第5章,康書隆; 第6、8、14章和附錄A,劉玉紅; 第7、15章,王亞芬; 第9章,張同斌; 第11、12章,孔憲麗; 第13章: 高鐵梅。*后由高鐵梅對全書進行了審閱、修改和定稿。
在本書第3版出版之際,特別感謝清華大學出版社的張偉編輯,在她的熱情鼓勵和大力支持下,本書第3版得以順利出版。還有許多同行專家、碩士和博士研究生對本書給予了幫助,在這里一并表示感謝。我們把這本書奉獻給所有給予我們支持和幫助的人。
由于我們水平有限,錯誤或不當之處在所難免,誠懇地歡迎同行專家和讀者批評指正,并提出寶貴的意見和建議。
高鐵梅
2016年11月5日
第1章概率與統計基礎
1.1隨機變量
1.1.1概率分布
1.1.2隨機變量的數字特征
1.1.3隨機變量的聯合分布
1.2從總體到樣本
1.2.1基本統計量
1.2.2估計量性質
1.3一些重要的概率分布
1.3.1正態分布
1.3.2χ2分布
1.3.3t分布
1.3.4F分布
1.4統計推斷
1.4.1參數估計
1.4.2假設檢驗
1.5EViews軟件的相關操作
1.5.1單序列的統計量、檢驗和分布
1.5.2多序列的顯示和統計量
第2章經濟時間序列的處理、季節調整與分解
2.1經濟時間序列的處理和頻率轉換方法
2.1.1經濟指標幾種數據類型的概念
2.1.2頻率轉換
2.2季節調整
2.2.1移動平均公式
2.2.2Census X13ARIMASEATS季節調整方法
2.2.3TRAMO/SEATS方法
2.3趨勢分解
2.3.1HodrickPrescott濾波方法
2.3.2頻譜濾波(BP濾波)方法
2.4EViews軟件的相關操作
2.4.1頻率轉換
2.4.2X13ARIMASEATS季節調整
2.4.3TRAMO/SEATS季節調整
2.4.4HodrickPrescott濾波
2.4.5BP濾波
第Ⅱ部分基本的單方程分析
第3章基本回歸模型
3.1古典線性回歸模型
3.1.1一元線性回歸模型
3.1.2*小二乘法
3.1.3多元線性回歸模型
3.1.4系數估計量的性質
3.1.5線性回歸模型的檢驗
3.1.6AIC準則和Schwarz準則
3.2回歸方程的函數形式
3.2.1雙對數線性模型
3.2.2半對數模型
3.2.3雙曲函數模型
3.2.4多項式回歸模型
3.2.5BoxCox轉換
3.3包含虛擬變量的回歸模型
3.3.1回歸中的虛擬變量
3.3.2季節調整的虛擬變量方法
3.4模型設定和假設檢驗
3.4.1系數檢驗
3.4.2殘差檢驗
第Ⅰ部分數據分析基礎
第1章概率與統計基礎
第2章經濟時間序列的處理、季節調整與分解
第1章概率與統計基礎
本章回顧一些概率知識和基本的統計概念。大多數結論只敘述而不證明,讀者可以很容易找到相關書籍參考學習和理解。這些概念極為重要,是繼續學習的基礎、通往其他部分不可或缺的鑰匙。
1.1隨 機 變 量
隨機變量(random variable)是取值具有隨機性的變量。隨機變量按其取值情況可以分為離散型和連續型兩種類型,離散型隨機變量只能取有限或可數的多個數值,連續型隨機變量的取值充滿一個或若干有限或無限區間。
1.1.1概率分布
1. 概率分布的含義
隨機變量X取各個值xi的概率稱為X的概率分布。對一個離散型隨機變量X,可以給出如下概率分布:
P(X=xi)=pi,i=1,2,3,…(1.1.1)
例如,X代表宏觀經濟所處的狀態,假定只有經濟增長率較高的繁榮和增長率較低的衰退兩種狀態,X相應地取1和2兩個值(圖1.1.1),并假定概率分別為p,q,即
P(X=1)=p,P(X=2)=q
圖1.1.1離散型概率分布
(經濟狀態概率分布: p=0.8,q=0.2)
由概率的性質可知,概率分布滿足以下兩個條件:
pi≥0,i=1,2,…
∑∞i=1pi=1(1.1.2)
可以知道,對于上面例子中的p和q,存在約束: p≥0 , q≥0 , p+q=1。
2. 累積分布函數
對于隨機變量X(無論連續還是離散)可以確定實值函數F(x),稱為累積分布函數(cumulative distribution function, CDF),定義如下:
F(x)=P(X≤x)(1.1.3)
表示隨機變量X小于或等于x的概率。顯然,F(-∞)=0, F(+∞)=1。對于離散隨機變量,累積分布函數的形式為
F(x)=∑xi≤xpi(1.1.4)
3. 連續型隨機變量的分布函數及概率密度函數
對于連續型隨機變量,取任何特定數值的概率都是0,因此度量該隨機變量在某一特定范圍或區間內的概率才有實際意義。設F(x)是隨機變量X的分布函數,如果對任意實數x,存在非負函數f(x)≥0,使
F(x)=∫x-∞f(t)dt(1.1.5)
就稱f(x)為X的概率密度函數(PDF),且f(x)具有性質:
f(x)≥0,∫∞-∞f(x)dx=1(1.1.6)
P(a
令X代表身高,用厘米來度量,那么人的身高在某一區間內(比如160~170cm)的概率,由這兩個值之間的密度函數之下的面積決定(圖1.1.2)。
圖1.1.2連續型(身高)概率分布
例1.1離散隨機變量的CDF
拋幣4次,求隨機變量(正面朝上的次數)的概率密度函數和累積分布函數(圖1.1.3和圖1.1.4)。
正面朝上的次數
(X=xi )
PDFCDF
X值piX值F(x)
0
0≤X<1
1/16
X≤0
1/16
1
1≤X<2
4/16
X≤1
5/16
2
2≤X<3
6/16
X≤2
11/16
3
3≤X<4
4/16
X≤3
15/16
4
4≤X<5
1/16
X≤4
1
圖1.1.3離散型隨機變量的累積分布函數
圖1.1.4連續型隨機變量的累積分布函數
1.1.2隨機變量的數字特征
有多種數值指標分別從不同角度描述隨機變量分布的特征,其中*重要的是數學期望(也稱均值)和方差。期望是隨機變量的平均值,它度量了集中趨勢; 方差是隨機變量偏離期望的離散程度的度量。
1. 數學期望
假設我們研究一個離散型隨機變量X,設x1,x2,…,xN為該變量的N個取值,則均值或數學期望值是所有可能結果的加權平均值,權重為各個可能結果的發生概率,用μX代表X的數學期望,定義為
μX=E(X)=p1x1+p2x2+…+pNxN=∑Ni=1pixi(1.1.8)
式中: pi為Xi發生的概率,∑pi=1。
如果X是連續型隨機變量,則數學期望為
μX=E(X)=∫∞-∞xf(x)dx(1.1.9)
數學期望有一個重要的性質:
E(a+bX)=a+bE(X)(1.1.10)
式中: a,b都是常數。
除了期望之外,用來描述隨機變量集中趨勢的還有中位數。中位數是滿足P(X≤m)≥0.5和P(X≥m)≤0.5的m的值。粗略地說,中位數比均值更接近分布的中點,它不受極端值影響。
2. 方差
對于經濟變量,我們經常關心其波動性,尤其證券市場中人們十分關心投資的風險大小,這可以通過變量的方差來描述。隨機變量的方差刻畫了隨機變量偏離均值的程度,將方差記為σ2X,對于離散的情形,方差為
σ2X=var(X)=E[X-E(X)]2=∑Ni=1pi(xi-μX)2(1.1.11)
對于連續情形,方差為
σ2X=var(X)=∫∞-∞(x-μX)2f(x)dx(1.1.12)
方差不能為負值,如果X偏離均值幅度很大,則方差就較大; 相反,則方差較小; 如果X所有的值都等于E(X),則方差為0。這意味著隨機變量是常數。
……