本题利用数据集401KSUBS.RAW。(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大
本题利用数据集401KSUBS.RAW。
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
本题利用数据集401KSUBS.RAW。
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
第1题
利用数据集401KSUBS.RAW,仅考虑无子女的已婚夫妇(marr=1,fsize=2)。
第2题
利用数据集401KSUBS.RAW。
(i)利用OLS估计e401k的一个线性概率模型,解释变量为inc,inc²,age,age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗?
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
第3题
数据集401KSUBS.RAW包含了净金融财富(nenfa)、被调查者年龄(age)、家庭年收入(inc)、家庭规模(fsize)方面的信息,以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题,只使用无子女已婚者数据(marr=1,fsize=2)。
(i)数据集中有多少无子女已婚夫妇?
(ii)利用OLS估计模型
nettfa=β0+β1inc+β2age+u;
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H0:β2>1检验H0: β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(ii)部分的估计值有很大不同吗?为什么?
第4题
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
第5题
本题利用HPRICE1.RAW中的数据。
(i)估计模型
并以通常的OLS格式报告结论。
(ii)当lotsize=20000,scrft=2500和bdrms=4时,求出log(price) 的预测值。利用6.4节中的方法,在同样的解释变量值的情况下,求出price的预测值。
(iii)就解释price中的变异而言,决定你是偏好第(i)部分中的模型,还是偏好模型
第6题
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机练习C8。)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧备择假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告的双侧p值。
(iv)在第(ii)部分的回归中,log(income)和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个地区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
第7题
本题要用到TRAFFIC2.RAW中的数据。加州1981年至1989年交通事故的这些月度观测在第10章计算机习题11中曾被使用过。
(i)利用标准的迪基-富勒回归, 检验Itotacc, 是否具有单位根。在2.5%的显著性水平上, 你能拒绝单位根的存在吗?
(ii)现在,在第(i)部分的检验中增加两个滞后变化,并计算增广迪基-富勒检验。你得到什么结论?
(iii)在第(ii) 部分的ADF回归中增加一个线性时间趋势变量。现在情况又将如何?
(iv)根据第(i) 部分至第(ii) 部分的结论, 你认为对I to tacc, 的最好刻画是:一个Ⅰ(1)过程还是一个含有线性时间趋势的Ⅰ(O)过程?
(v)在一个ADF回归中, 利用两个滞后项来检验致死交通事故百分数pre fat是否存在单位根。在此情形中,包含一个线性时间趋势与否是否有关系?
第8题
A.中国一东盟信息港的服务范围越来越宽泛,集政府、企业和社会大众之需求
B.建设内容从简单的通信基础设施逐步发展到信息数据资源的共享和深层次的挖掘及利用
C.涵盖中国与东盟信息化、数字化合作的诸多方面,涉及的范围广、领域宽,其建设内容种类繁多
D.构建形成以广东为支点的中国一东盟信息枢纽,加快大数据、数字经济、智慧城市等新业态、新模式集聚,推动中国与东盟国家经贸服务、人文交流、技术合作
第9题
(i)将lavgsal对bs进行简单回归。斜率估计值在统计上显著异于0吗?它在统计上显著地异于-1吗?
(ii)在第(i)部分的回归中增加变量lenrol和istaff。bs的系数有何变化?这种情形与教材表4-1中的情形相比如何?
(iii)第(ii)部分中bs系数的标准误为何比第(i)部分中的标准误更小?(提示:当增加变量lenrol和Istaff后,对误差方差和多重共线性会造成什么样的影响?)
(iv)Istaff的系数为何为负?它的绝对值算大吗?
(v)在回归中再添加变量lunch。保持其他条件不变,教师会因教育那些家庭条件不好的学生而得到补偿吗?请解释你的结论。
(vi)总之,你利用ELEM94_95.RAW得到的结论,与教材4-1在形式上一致吗?
第10题
(i)用混合OLS估计一个以学期GPA(trmgpa)为因变量的模型。解释变量是sprng,sat,hsperc,feale,black,white,frestsem,tothrs,crsgpa和season。试解释season的系数。它统计显著吗?
(ii)在仅参与秋季运动项目的运动员中,大多数是足球运动员。假定足球运动员的能力水平和其他运动员的能力水平有系统差异。如果SAT分数和中学成绩百分位数不能很好地反映一个人的能力水平,那么混合OLS估计量将是有偏误的。试解释。
(iii)现在,取两个学期数据的差分,问哪些变量将随之消失?现在检验赛季效应。
(iv)你能想象一个或多个有潜在重要性而又不随时间而变化的变量,在此分析中被我们忽略了吗?
第11题
本题要用到MLB1.RAW中的数据。
(i)从以下模型中去掉变量rbisyr。hrunsyr的统计显著性会如何变化?hrunsyr的系数大小又会如何变化?
(ii)在第(i)部分的模型中增加变量rusyr(每年垒得分),fldperc(防备率)和sbasesyr(每年盗垒数)。这些因素中,哪一个是个别显著的?
(ii)在第(ii)部分的模型中,检验bavg,fldperc和sbasesyr的联合显著性。