Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON 2223B: Assignment 2

To complete this assignment, open the dataset included with the assignment on OWL (A2 data.xls).  This is a panel dataset containing information on the average wages and education level across U.S. states between 1950 and 1990. You are interested in estimating the returns to schooling, β 1 , in the following model:

lnwageit  = β0 + β1 educit + β2 ageit + β3 agei(2)t + uit                           (1)

The variables in the dataset are as follows (you will have to create agei(2)t )

• lnwageit  is the average (log) wage in state i at year t

• educit  is the average number of years of education for the population in state i and at t

• ageit  and agei(2)t  are the average age and squared of age for the population in state i at year t

• cait  is the compulsory number of years of education in state i at year t

• clit  is the minimum age required for a child to start working in state i at year t

• yeart  is the year of observation

• statei  is the state of observation

Problem 1

1.  Estimate βˆ1 , βˆ2 , βˆ3  using the OLS method.  Report the results.  What is interpretation of βˆ1 ?

2. What does the estimate of βˆ2  and βˆ3  suggest on the relationship between age and (log) wages?  Plot the estimated relationship between age and (log) wage. What happens as age increases?

3. You are concerned that some unobserved variables  (e.g.   ability) affect both education and wages, creating endogeneity.  Fortunately, you have access to two variables (cait  and clit ) that may be used as an instrument for education:

(a)  Explain why cait  may be a valid instrument.

(b)  Explain why clit  may be a valid instrument.

4.  Estimate βˆ1,IV  using cait  as an instrument.  Is it statistically significant at the 95% confidence level? Note:  you should follow the two-step method seen in class

first stage:   educit  = α0 + α 1 cait + α 1 ageit + α2 agei(2)t + ϵit            second stage:  lnwageit  = β0 + β1 educit + β2 ageit + β3 agei(2)t + uit

5.  Estimate βˆ1,IV  using cait  s an instrument. Is it statistically significant at the 95% confidence level?

6.  Explain your findings.   From the relationship between both  βˆ1,IV   and βˆ1,OLS, what can you conclude about the returns to schooling?

7.  Perform the Durbin-Wu-Hausman test.  Do you conclude that educit  is endogenous at the 95% confidence level? Note:  you should use the second way to perform the test in the lecture notes, which is much simpler

Problem 2

You now want to control for endogeneity by exploiting the time dimension of the dataset rather than using instrumental variables. You specify the following fixed-effect model:

lnwageit  = αi + β1 educit + β2 ageit + β3 agei(2)t + uit                           (2)

1.  Estimate βˆ1  using the First-Difference approach and report the results. (Note  you  must  create  new variables ∆Xit  = Xit  − Xi,t 1   and you  may drop the first year of observation.)

lnwageit  = β 1 educit + β2 ageit + ∆agei(2)t + ∆uit

2.  Estimate βˆ1  using the demeaning approach and report the results.  (Note you must create new variables it  = Xit − Xi )

lnwageit  = β 1 educit + β2 ageit + agei(2)t + it

3.  Compare the two estimates of βˆ1   from the fixed-effect model  and the estimates of βˆ1  in problem 1.  Are they more similar to the OLS or IV estimates? Assuming the IV estimates in problem 1 are consistent, do you think the fixed-effect model is a good approach at dealing with endogeneity in this context?