(i)利用WAGE PRC.RAW中的数据,估计习题11.5中的分布滞后模型。用回归(12.14)来检验AR(1)序列相
关。
(ii)用迭代的科克伦-奥卡特方法重新估计这个模型。长期倾向的新估计值是多少?
(iii)用迭代C0求出LRP的标准误。(这要求你估计一个修正方程。) 判断LRP估计值在5%的水平上是否统计显著异于1?
关。
(ii)用迭代的科克伦-奥卡特方法重新估计这个模型。长期倾向的新估计值是多少?
(iii)用迭代C0求出LRP的标准误。(这要求你估计一个修正方程。) 判断LRP估计值在5%的水平上是否统计显著异于1?
第1题
(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)
(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?
(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?
第2题
e232是232部门中平均工资的月增长率(以对数形式变化) , gemp232是232部门中的就业增长率, gmwage是联邦最低工资的增长率, gcpi是(城市) 消费者价格指数的增长率。
(i)求gwage232中的一阶自相关。这个序列看起来是弱相关的吗?
第3题
利用SLEEP75.RAW中的数据
变量sleep是每周晚上睡眠的总分钟数,totwork是每周花在工作上的总分钟数,educ和age则以年为单位,而male是一个性别虚拟变量。
(i)所有其他因素不变,有没有男性比女性睡眠更多的证据?这个证据有多强?
(ii)工作与睡眠之间有统计显著的取舍关系吗?所估计的取舍关系是什么样的?
(iii)为了检验年龄在其他因素不变的情况下对睡眠没有影响这个原假设,你还需要另外做什么回归?
第4题
本题需要使用ELEM 94-95中的数据, 也可参见计算机习题C 4.10。
(i) 利用所有数据, 将lavg sal对bs, lenrol, Istaff和lunch进行回归。报告bs的系数及其常用标准误和异方差-稳健标准误。你对的经济显著性和统计显著性得到什么结论?
(ii)现在去掉四个bs>0.5的观测,即平均福利(假设)占平均薪水50%以上的观测。bs的系数又是多少?利用异方差-稳健标准误来判断,它在统计上显著吗?
(iii)验证bs>0.5的四个观测分别为68、1127、1508和1670。为它们各定义一个虚拟变量。(你可以称它们为d68、d1127、d 1508和d 1670.) 把它们添加到第(i) 部分的回归中, 验证其他变量的OLS系数及其标准
误与第(ii)部分中的结果相同。在5%的显著性水平上,这四个虚拟变量中哪个变量的t统计量在统计上显著不等于0?
(iv)在这个数据集中,验证第(iii)部分回归中具有最大学生化残差(该虚拟变量的t统计量最大)的数据点对OLS估计值具有很大的影响。(即利用除去具有最大学生化残差的数据点之外的所有观测进行OLS回归。)依次去掉bs>0.5的每个观测都具有重要影响吗?
(v) 即便在大样本中, 就OLS对单个观测的敏感性而言, 你有何结论?
(vi) 在第(iji) 部分, 验证LAD估计量对包含这些观测不是很敏感。
第5题
利用FERTIL2.RAW中的数据。解释存活儿童数的一个简单模型是:
其中,解释变量是女性接受教育的年限,年龄(以年表示)及分别表示女性家是否有电和电视机的二元变量。
(i)用OLS估计该方程并用通常的形式报告结果。讨论变量eletric和tv的系数和统计显著性。
(ii)城市居民和非城市居民在生育率上有区别吗?请解释。
(ii)现在对城市居民和非城市居民分别估计方程(当然,解释变量要去掉urban)。除了截距以外,其他系数有明显区别吗?
(iV)允许城市居民和非城市居民截距项不同,在原假设下得到邹至庄统计量。你能得到什么结论?[提示:你在检验5个限制条件,SSR从第(ii)部分和第(iii)部分中很容易得到。]
第6题
利用TRAFFIC2.RAW中的月度数据估计如下方程::
prcfat是事故导致的死亡率,spdlaw是一个虚拟变量,当车速增大到每小时65英里时取1,而beltlaw是另一个虚拟变量,当强制性的安全带政策被履行时取1。由于数据是月度数据,因此回归中还包括一系列月度的虚拟变量(未写出)以及失业率和一个月中的周末数(也未写出)。方程中的标准差是OLS估计中得到的标准差。
(i)通过上面的静态模型,安全带政策对于事故导致的死亡率有什么长期影响?影响是否显著?如果要得到更小的标准差,你应该怎么做?
(ii)通过动态模型,安全带政策对于事故导致的死亡率有什么长期影响?这个结果与静态模型中得到的结果相比有什么不同?
(iii)当二阶滞后项prcfat-2和一阶滞后项prcfat-1同时加入到模型中时,prcfat-2的系数是0.098,而标准差是0.110。在这种情况下,prcfat-2是否需要加入到模型中?
第8题
设a1,a2,...,an是n个不同的数,而F(x)=(x-a1)(x-a2)...(x-an),b1,b2,...,bn是任意n个数,显然适合条件L(ai)=bi,i=1,2,...,n。这称为拉格朗日(Lagrange)插值公式。
利用上面的公式求:
1)一个次数<4的多项式f(x),它适合条件:f(2)=3,f(3)=-1,f(4)=0,f(5)=2。
2)一个二次多项式f(x),它在x=0,2/π,π处与函数sinx有相同的值。
3)一个次数尽可能低的多项式f(x),使f(0)=1,f(1)=2,f(2)=5,f(3)=10。
第10题
设有三对角矩阵Aa×n,将其三条对角线上的元素逐行存储到数纸B[0:3n-3]中,使得B[k]=a[i][j],求:
(1)用i,j表示k的下标变换公式;
(2)用k表示i,j的下标变换公式。
第11题
薪水信息和职业统计。
(i)估计一个将每场得分(points)与加入联盟年数(exper)、年龄(age)、大学期间打球年数(coll)相联系的模型。包含一个exper的二次项,其他变量都应该以水平值形式加入模型。按照通常的格式报告结果。
(ii)保持大学打球年数和年龄不变,从加入联盟的第几个年份开始,在NBA打球的经历实际上将降低每场得分?这讲得通吗?
(iii)你为什么认为coll具有负系数,而且统计显著?(提示:NBA运动员在读完大学之前被选拔出,甚至直接从高中选出。)
(iv)有必要在方程中增加age的二次项吗?一旦控制了exper和coll之后,这对年龄效应意味着什么?
(v)现在将log(wage)对points,exper,exper2,age和coll回归。以通常的格式报告结论。
(vi)在第(v)部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历,这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义?