Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit



Econ 184b

Solutions to the final exam

Part I:  Multiple choice (8 questions; 3 points each)

1.  e

2. b

3.  c

4. b

5.  a

6.  e

7.  c

8.  a

 

 

Part II:  True/False/Uncertain  (3 questions; 6 points each)

1.  False.  R-squared is ESS/TSS, or the fraction of the total variation in GDP explained by the X variables.  Taking the log of GDP changes TSS, since there is a different amount ofvariation in   log(GDP) than there is in GDP.  As a result, R-squared will change when the dependent variable  is put into log form.

2. True.  A sparse model is a model (with large k) in which many ofthe coefficients are zero or  close to zero.  Lasso is the best estimator to use for a sparse model because it sets many ofthe    coefficients exactly equal to zero, effectively discarding those predictors. This works well when the true regression model is sparse.

3.  True.  The conditional mean independence assumption is defined as follows:  E(u | X, W1, W2, W3) = E(u | W1, W2, W3).  This means that once W1, W2  and W3  are included in the regression,      the error term becomes uncorrelated with X because its conditional mean does not depend on X.   In other words, W1, W2, W3  can be correlated with u, but X is not when the control variables are   included in the regression.  As a result, the estimated â1 is not subject to omitted variable bias.

 

Part III.  Short answer problems (3 questions; 6 points for each part of each question)

 

1.  a.    Not near = $120,700

Near = $90,600

b.  The difference-in-differences equation is:

 

 

c.  The equation is:

 

D-in-D  =   (90,600 - 64,500) - (120,700 - 82,500)


=    26,100 - 38,200

 

=   -12,100

This indicates that the waste treatment plant reduced housing values near the plant by $12,100.

d.  The coefficient on year81 controls for the overall change in housing prices from 1978 to        1981, holding constant whether or not the house was near the waste treatment plant.  According to this estimate, housing prices rose by 45.7% between 1978 and 1981.

The coefficient on nearplant measures the location effect that is not due to the waste treatment  plant.  This shows that houses near the plant sold for 34.0% less than houses not near the plant. In other words, the plant was built in an area of lower housing values.

e.  The coefficient on the interaction term,year81 × nearplant, represents the difference-in-          difference estimator and shows that the ‘treatment’ of being located near the plant after the plant   was built reduces the price of a house by a further 6.3%.  Ifthe ‘treatment’ of building the plant    near a set of homes was as if randomly assigned (i.e., a house’s proximity to the plant is random), then the coefficient on the interaction term is a causal effect.  This is unlikely to be the case,          however, as clearly houses near the plant were not similar to houses not near the plant.  Even        though the nearplant variable controls for some of these differences, it may not control for all       differences between the two areas which are changing over time and are correlated with both        year81 × nearplant and rprice (e.g., pollution levels, crime rates).  Therefore the estimate is         likely to be affected by omitted variable bias and cannot be interpreted as a causal effect.

 

2. a.  An endogenous regressor is one that is correlated with the error term.  Here are two reasons why TV exposure could be correlated with the error term (one reason is sufficient for full credit): (1)  There may be reverse causality, with obesity (and therefore less mobility) causing children to engage in sedentary activities like TV watching; and (2) there could be an omitted variable, such  as outdoor activity, which is correlated with obesity (i.e. burns calories) and is correlated with      TV exposure (you watch TV inside) resulting in omitted variable bias.  To get full credit for an    answer discussing omitted variable bias, a specific omitted variable must be discussed as well as  its correlation with both obesity and TV exposure.

b.  The desired exogeneity condition is E(u | Z, W) = 0, where Z are the instruments, u is the error term in the BMI equation, and W are the additional regressors (included exogenous regressors) in the obesity equation.  For the price of TVadvertising to be exogenous, it must be uncorrelated       with factors that affect BMI that are not already controlled for in the regression.  While one could argue that there is no reason to think that the price of TV advertising is related to child BMI,         there are omitted variables that could violate the exogeneity condition.  For example, a richer        county would likely have a higher price of TV advertising, and possibly have higher child BMI.    So it is possible that the price of TV advertising is not exogenous.

It is likely that the average annual county temperature is not exogenous.  Because outdoor       activity is likely to be dependent on temperature, outdoor activity would be omitted (in u) and

correlated with both temperature and child BMI.

c.  If the instruments are weak, the TSLS estimator is poorly approximated by its large-sample     normal distribution.  Specifically, the TSLS coefficient will be biased (possibly very biased), and hypothesis tests unreliable.

The first-stage F-statistic testing the hypothesis that the coefficients on the instruments in the first-stage regression are weak is 41.92.  This exceeds the rule-of-thumb value of 10 so the     instruments can be treated as strong.

d.  The J-statistic tests the hypothesis that the overidentifying restrictions are valid, that is, that all ofthe instruments are exogenous.  Rejection by the J-statistic indicates that one or more ofthe      instruments are not exogenous.

d.  From regression (3) in Table 1, the J-statistic is .308, which is less than the critical value of 3.84.  Therefore the null hypothesis is not rejected at the 5% significance level; in other words  the instruments appear to be exogenous despite the possible problems with them discussed in   part (b).

e.  The criticism in part (a) implies that TV exposure is endogenous so the results in regression      (1) are not meaningful.  To evaluate the relationship between TV exposure and child BMI we        need to look at the IV estimates in regression (3).  The coefficient on TV exposure is .336 and is    statistically significant at the 5% level.  Based on the evidence presented, the instruments are        valid; specifically they are strong and they appear to be exogenous.  Although some doubts were   raised about the validity of the instruments, these appear to be not empirically important based on the J-statistic.  Because the instruments are valid, the results in regression (3) appear to be             internally valid and it seems that reducing exposure to fast food advertising on TV would reduce  child BMI.

One could instead argue that the instruments are not in fact valid, in particular that the J-statistic cannot test whether all of the instrument are exogenous; it can only test the exogeneity ofk-1      instruments, assuming that at least one instrument is exogenous.  If one ofthe instruments is       endogenous, which could be the case here (because it is correlated with access to outdoor            exercise opportunities and/or county income levels, as discussed previously) the estimate in        regression (3) is not a valid estimate ofthe causal effect of fast-food TV advertising on BMI.

 

3.  a.  (i)  If assignment is random, then there should be no relationship between the                     characteristics ofthe parents and the characteristics ofthe adoptee.  The regressions in Table 2    test this by regressing measures of the infant’s health on parental characteristics.  Ifthe                coefficients on these characteristics are zero, then we can conclude the assignment is random.     (ii)  We can test this hypothesis using an F-test for the joint significance of the parental               characteristics.  For both infant weight and height, the F-statistic is not significant (it is less than the critical value of 2.37) so we conclude that the assignment was in fact random.

b. The missing values are calculated as follows:

Case 1:   Ö[(.052 × 12) - (.022 × 12) - .239 - (.073 × 3) + .114] = Ö(.016) = .508

Case 2:   Ö[(.052 × 16) - (.022 × 12) - .239 - (.073 × 3) + .114] = Ö(.224) = .587                            Difference = .587 - .508 = .079                                                                                                          The difference indicates that a male adoptee whose mother has 16 years of education, whose         father has 12 years of education, and with 3 children in the family is 7.9 percentage points more    likely to graduate from college than is an adoptee with the same characteristics but whose mother only completed 12 years of education. Note that this must be entirely a ‘nurture’ effect of             mother’s education since there are no inherited effects for adoptees.                                                c.  Comparing Case 1 and Case 2 for non-adoptees (regression 2), non-adoptees whose mothers    completed 16 years of education were 15.8 percentage points more likely to graduate from            college than those whose mothers completed 12 years of education.  For non-adoptees this            combines both the ‘nature’ and the ‘nurture’ effect.  A rough idea ofthe pure ‘nature’ effect is      given by the difference in probabilities for adoptees vs non-adoptees:  15.8 - 7.9 = 7.9.  This         suggests that the ‘nature’ and ‘nurture’ effects are approximately equal.                                          One could also discuss that there is potential bias in these estimates.  For example, the previous    calculation assumes that the effect ofnurture is the same for both adoptees and non-adoptees.  if  the adopted children received less attention than the non-adopted children, then the difference in  probabilities between Case 1 and Case 2 would underestimate the nurture effect for non-               adoptees, so the difference-in differences would overestimate the nature effect.