ECMT6002/6702: Problem Set 2022


ECMT6002/6702: Problem Set (10 marks)

Due September 4, 2022

The file PS4.dta contains male wage and characteristics data of individuals in the US. There are 2215 observations. Upload answers to the below questions in a single document, attaching a printout of your "Stata do" file. Each question is worth 1 mark.

(i) Data analysis. Chart the variable of interest, wages and ln(wages). Which variable is likely to satisfy the CLM assumptions better? Produce a table of the descriptive statistics of the data set and briefly describe the variables (include only variables in (ii) below).

ln(Wage) = β0 + β1Educ + β2Exper + β3Exper2 + β4South + β5Black + e       (1)

Report the results in the standard way. Interpret each parameter for its effect on wages (including the intercept).

(iii) Consider β 1 .  Explain how you can show β 1 is the effect on wages after partially out the effect of other variables. (i.e. describe how to implement the Frish-Waugh theorem)

(iv) Use (1) to predict the value of ln(Wages) when Educ = 11, Exp = 5, Black = f alse, and south = true.  Estimate a model which calculates this and use the model to construct a 95% confidence interval around the predicted value.  (this is a within sample conditional prediction)

(v) Construct a prediction and 95% confidence interval of ln(wages) for an "individual", with same details as question (iv).  (unconditional prediction).  Comment on the difference in width of the CI from the previous question. Use the unconditional CI to convert to a Wage CI. (An adjustment needs to occur for ln(e), assume e  (0, σ2)).

ln(Wage) = β˜0 + β˜1Educ + β˜2Exper + β˜4South + β˜5Black + e˜             (2)

Report in the usual way. Test the exclusion restriction implied by (2). Explain the implications of using model (2)?

(vii) For equation (1), solve for the critical level of Exper above which wages are expected to fall, holding everything else constant.

(viii) For model (1), conduct a test that β4= β5, clearly stating H0, Ha, test statistic, critical

level (for 5% significance), decision rule and result.

(ix) Add regions 1-9 as additional controls for (1), (just insert the stata output in your document). Conduct a joint test of significance (to 5%) of this group using an F-test.

(x) Model (1) contains an indicator for Southern states, south, test that this group has different slope coefficients to the pooled model (1) to 5% significance. Does this sug- gest the Southern states should be modelled separately, or not? Is the unrestricted model in this question superior to the model estimated in (ix)?

