关键词 > ECMT6002/6702

ECMT6002/6702: Econometric Applications

发布时间:2021-11-29

Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit




 

ECMT6002/6702: Econometric Applications

 

 

Sample Questions (for Final Exam)

❼ These sample questions here are not meant to be exhaustive, covering every aspects of the unit;

they rather illustrate the types of questions to expect in the exam.

❼ Please note that the final exam paper in semester 2 of 2021 have four questions, each containing

multiple parts; each part is randomized with 2 or 3 versions (similar questions), which means students may receive different versions for each part.

❼ The appendix contains the tables for the critical values of the t, F, and χ2  distributions, which

you may use for the final exam (in case you don’t have them).


1. Let save denote the fraction of annual family income devoted to savings.  We are interested in determining whether the rich save a larger fraction of their income, other things equal. A simple model is

ln(save) = β0 + β1 age + β2 children + β3 earnings + u       (1.1)

where age denotes the age of the family head, children is the number of dependent children in the household, and earning is the annual earnings of the family head (in ✩100,000). Based on a sample, the following OLS estimates are as follows:

 


ln(save) = 0.039 + 0.038age - 0.125 children + 0.025 earnings

(0 .004)       (0 .017)               (0 .051)                           (0 .001)

n = 366, R2  = 0.212


(1.2)


 

(a)  Based on the model (1.1), what is the interpretation of β 1 ?

(b)  Based on the estimates (1.2), what is the exact percentage effect of an extra child on the expected level of save?

(c)  Based on the estimates (1.2), test whether β2  is statistically significant at the 5% level, against a two-sided alternative?

(d)  Test whether model (1.2) has any explanatory power. Perform a test of the overall signif- icance of the regression using a 1% level of significance.  Note the F-test statistic is given by

F =       /Ru(2)r   Rr(2)/q       _ Fq,n − k − l

 

(e) We are concerned the model contains heteroskedasticity.   Outline the steps required to estimate the model by generalized least squares (GLS).


2.  The following time series regression model relates the growth in real per capita consumption (gcon) to the growth in real per capita income  (ginc), the real interest rate  (rint) and the expected inflation rate (infle ):

gcont  = β0 + δ0ginct + δ1ginct - 1 + β1 rintt + β2 inflet + ut           (2.1)

 

(a) What is the interpretation of δ0  and δ 1 ?

(b)  Briefly explain the reason for including the lagged term ginct_1 .

(c) What conditions must the time process gcont  satisfy for it to be weakly dependent? What are the consequences of estimating a time series model using OLS with data that are not weakly dependent?

(d) Why the time trend may not be necessary in (2.1)? Explain briefly.

(e) If the variables in (2.1) are measured quarterly, how the model (2.1) can be improved?


3. We are interested in analyzing the effect of the government building a new hospital on housing prices in the suburb of Sydenham.  Rumors that a new hospital would be built in Sydenham began after 2006, and the hospital was built and began operating in 2008. We have data on the prices of houses sold in Sydenham in 2006 and another sample on houses that sold in Sydenham in 2010. The hypothesis we wish to test is that the price of houses located near the site of new hospital would rise above the price of more distant houses. The data for each year includes the dummy variable near which is equal to one if the house is located within 2 kilometers of the new hospital. House prices, for both years of data, were measured in 2010 prices. The variable rprice denotes the real house price (scaled by ✩100,000). The following simple regression model was estimated using only the year 2010 sample of data

rp入rice   =   10.131 + 2.688near       (3.1)

(0.309)       (0.788)

n = 96, R2 = 0.199

 

while the following was estimated using only the 2006 sample of data

rp入rice   =   9.252 + 1.412near       (3.2)

(0.265)      (0.671)

n = 105, R2 = 0.106

 

(a) Explain one by one the interpretation of the estimates in model (3.2)?

(b)  Based on the estimates in (3.1) and (3.2), from 2006 to 2010, what is the average price change for all houses in Sydenham?

(c) Explain why we cannot infer from the estimates in (3.1) that the location of the hospital caused the price of houses located nearby to increase?  What evidence from model (3.2) supports this conclusion?

(d) Using the information from models (3.1) and (3.2), calculate the difference-in-differences estimate of the impact of the new hospital on the price of nearby houses?

(e)  Propose a linear regression model that can directly estimate the effect of new hospital on housing price.


4. An influential study tested for evidence of racial discrimination in the market for mortgages (home loans).  The dependent variable in the study was approve (an indicator variable =1 if the loan is approved) and the explanatory variables considered were white (=1 if the applicant is white), obrat (other financial obligations as a % of income), loanprc (the amount of loan / price of the property), unem (the unemployment rate in applicants industry of employment), male (=1 if the applicant is male), and cosign (=1 if there is a cosigner on the loan). The study estimated the equation

Pr(approve = 1) = G(β0 + β1 white + β2 obrat + . . . + β6 cosign)       (4.1)

 

using the Probit and Logit models.  The table below presents coefficient estimates for several specification.

Table 4.1.  Estimates of Binary Choice Models

 

Dependent Variable: employi

Probit (1)

Probit (2)

Logit

white

.714

( . 120)

.660

( . 123)

1.178

( .217)

obrat

 

-.082

( .005)

-.038

( .011)

loanprc

 

-1.345

( .315)

-2.414 ( .583)

unem

 

-.046

( .023)

-.083

( .040)

male

 

-.019

( .009)

-.024

( .010)

cosign

 

.081

( .355)

.156

( .659)

constant

.566

( . 105)

2.536

( .362)

4.570

( .679)

Observations (n)

1000

1000

1000

Log-Likelihood (LLF)

-369.29

-348.46

-348.29

(a)  The Probit and Logit models were estimated using the Maximum Likelihood Estimator (MLE). What is the basic idea of Maximum Likelihood Estimation for obtaining coefficient estimates?

(b)  Based on the estimates in Table 4.1, test the null hypothesis that the set of explanatory variables obrat,  loanprc, unem, male and cosign are jointly insignificant in the Probit model after controlling for white.  Use the Likelihood Ratio Test and a 1% significance level.  The Probit (1) contains the estimation results for the restricted model, and Probit (2) contains the unrestricted estimates.

(c) What is the interpretation of the coefficient β 1 in Probit (2)? Is the partial effect of white on the probability of loan approval comparable across the Probit (2) and Logit, respectively? Explain.

(d)  Based on the estimates in Table 4.1, would you conclude that there is strong evidence of racial discrimination in mortgage approvals? Explain briefly.


5. A recent survey of retirees asked individuals whether their overall happiness had changed follow- ing retirement from the labour force. We are interested understanding what are the important factors contributing to changes in well-being with retirement.  The survey included measures of individual’s Income (in ✩100), Wealth (in ✩10000), PoorHealth (which is an indicator of whether health has declined since retirement) and Married (an indicator of marital status). Let the change in overall happiness following retirement, Hi be a function of individual characteristics and an idiosyncratic error term ui:

H*i  = β 1 Marriedi + β2 Incomei + β3 Wealthi + β4 PoorHealthi + ui .

Although actual H*i is not observed, individuals report Hi which indicates that H*i falls into one of 3 ordered categories {worse off, the same, better off}:

 

Hi  = 1 if H*i  < c1

Hi  = 2 if c1  < H*i  < c2

Hi  = 3 if c2  < H*i

Using the Ordered Logit model for Hi, the estimates are presented below:

Table 5.1.  Ordered Logit Estimates.

 

Dependent Variable: Pr(Hi  = j), j = 1, 2, 3

(se)

 


Married


.306          (.080)


 


Income

Wealth   PoorHealth

1


.009

.118

-.314

-1.213


(.010)

(.103)

(.078)

(.198)


c1                                  .853          (.115)     

Observations (n)                     1344

2                                               0.078

Log-Likelihood (LLF)             -1031.09           

(a) What is the interpretation of 1 , the coefficient on the Married indicator variable? What do we learn from the estimated value of 0.306 about the effects of Married on happiness in retirement?

(b)  Based on the set of estimates in Table 5.1, what can we conclude about the relative impor- tance of the different explanatory variables (Married; Income;Wealth and PoorHealth) in determining post-retirement well-being? Explain.

(c) Using Stata to compute marginal effects, I found that the marginal effect of PoorHealth on the probability of being better-off in retirement was -1.105 (with a standard error of 0.026). Construct the 95% confidence interval for marginal effect of PoorHealth on the probability of being better-off in retirement. Is zero in the confidence interval? Hint:  E4 /se(E4 ) follows a tn_k _2  distribution (where -2 is for estimating the cutoff points).

(d) An alternative to the Ordered Logit model is the Multinomial Logit (MNL) model specifica- tion. What are the advantages of the MNL specification? What, if any, are the limitations of the MNL estimator for analyzing the determinants of changes in happiness with retire- ment, H* ?


6.  Suppose that annual earnings (earnings) and alcohol consumption (alcohol) are determined by the simultaneous equations models (SEM) below:

 


log(earnings) = β0 + β1 alcohol + β2 educ + u1

alcohol = γ0 + γ1 log(earnings) + γ2 educ + γ3 log(price) + u2


(6.1)

(6.2)


 

where educ is the year of schooling, and price is a local price index for alcohol (including state and local taxes).  Assume that educ and price are determined outside of the SEM, and that β 1 , β2 , γ1 , γ2 , and γ3  are all different from zero.  Both equations (6.1) and (6.2) are treated as structural equations.

(a) Explain briefly why the regressors alcohol in (6.1) and earnings in (6.2) are both endoge- nous.

(b) Is equation (6.1) identified? How would you estimate the equation if it is identified?

(c) Find the reduced form equation for log(earnings) and explain briefly why the OLS applied to this equation is consistent.

(d) How is the interpretation of β 1  in (6.1) on educ different from that of the coefficient on educ in the reduced form equation for log(earnings) in (c)? Explain briefly.

(e) Is equation (6.2) identified? How would you estimate the equation if it is identified?