Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Economics 122B

Spring 2014

Final Examination

You have two hours to complete this examination.  You may refer to one sheet of notes.  You may use a calculator. All necessary statistical tables are attached.

1.  (27 points, 9 each) Short Answer:  Give a brief answer, explanation, and/or mathematical deriva- tion to the questions below (“brief ” means one or two paragraphs).

(a)  “The estimated coefficients of every regression will always be subject to an omitted variables bias—so that they are always biased and inconsistent—because it is not possible to control for everything. In other words, omitted variable bias is always present.” Do you agree or disagree?

Answer:

Disagree.  An estimated coefficient is subject to omitted variable bias (so that it is biased and inconsistent) only if one (or more) of the omitted variables is correlated with the regressor. That is, only if cov(X, u)  0, where X is a regressor and u is the error term of the regression (which includes all the omitted variables).

(b) A researcher is studying the impact of beer taxes on traffic fatalities.  She has an observation for each of the 50 states in the country. The data includes traffic fatalities during the last year (DEATHS) and the amount of the beer tax in each state (TAX). She divides the country in EAST, MIDDLE, and WEST and creates three dummy variables, one for each zone (e.g. EAST is a dummy variable that takes a value of 1 if the state is in the East and a value of 0 otherwise). The dependent variable in the regression is DEATHS. Suppose you want to test whether the coefficient on TAX is different for workers in the West, and whether the intercept term shifts for workers in the East.  The null hypothesis is that none of the coefficients vary by location. Describe the regression you would run to do this test, state the null hypothesis, and give the critical value you would use for a 5% test.  Also describe the condition under which you reject the null hypothesis.

Answer:

DEATHS = βo + β1 EAST + β2 TAX + β3TAX × WEST + u

Null hypothesis: H0  : β 1 = β3 = 0. Critical value: F2,o (5%) = 3.

We reject H0  if and only if F _ statistic > 3.

(c) Evaluate the following statement:  “In the dummy variable representation of the xed-effects panel regression model, you should exclude one of the dummy variables for the entities when an intercept is present in the equation in order to reduce the number of coefficients to estimate.”

Answer:

False.  You should exclude one of the dummy variables for the entities when an intercept is present in order to avoid a perfect multicollinearity problem.

2.  (27 points, 9 each) Married women and labor force participation.  Using 753 observations of married women from Mroz (1987), we want estimate a probability model of labor force participation. Our dependent variable is the dummy inlf  (in labor force:  1 if working, 0 if not working) and the only explanatory variable is educ  (years of education).

(a) We rst t a linear probability model with the following result:

infl = 0.1 + 0.05educ

Interpret the equation. What is your prediction for a married women with 10 years of education? What about 20 years of education? Is there any problem?

Answer:

This regression is telling us that an extra year of education increases the probability of working for married women in 5%.

i一nfl (10) = 0.1 + 0.05 × 10 = 0.6, so that the predicted probability of working for a married woman with 10 years of education is 60%.

i一nfl (20) = 0.1 + 0.05 × 20 = 1.1, so that the predicted probability of working for a married woman with 20 years of education is 110%!.

The problem is that the linear probability model can generate predicted probabilities below 0 or above 1 (as we have just seen).

(b) You re-estimate the relationship using a Probit regression. You obtain:

Pr(infol=1|educ) = Φ(_1.4 + 0.2educ)

How do you interpret the coefficient on educ? Calculate the change in probability of an increase in educ from 5 to 10. Calculate also the change in probability of an increase in educ from 15 to 20. Why is there such a large difference between the changes in probability?

Answer:

We can only interpret the sign, which is positive and implies a positive relationship between education and labor force participation (just as we expected).

From 5 to 10: Φ(_1.4 + 0.2 × 10) _ Φ(_1.4 + 0.2 × 5) = Φ(0.6) _ Φ(_0.4) = 0.7257 _ 0.3446 = 0.3811.

From 15 to 20: Φ(_1.4 + 0.2 × 20) _ Φ(_1.4 + 0.2 × 15) = Φ(2.6) _ Φ(1.6) = 0.9953 _ 0.9452 = 0.0501.

There is a huge difference because this is a nonlinear model. The tted line is nonlinear and the changes in probability will depend on the initial value of educ.

(c) Now you use a Logit regression. You obtain:

Pr(infol=1|educ) = F (_1 + 0.33educ)

How do you interpret the coefficient on educ? Why is the educ coefficient in the logit model so different from the probit coefficient? Is there something wrong?

Answer:

As in the probit model, we can only interpret the sign of the educ coefficient, which implies a positive relationship between education and labor force participation. The coefficients are very different because they come from two different nonlinear functions,  F (.) and Φ(.).   There is nothing wrong about that.

3.  (36 points, 9 each) Return to education  for working  married women.  Using 426 observa- tions from Mroz (1987), we are interested in estimating the returns to education for working married women. We include educ  (years of education), exper  (years of labor market experience), and exper2 in an equation explaining log(wage). We believe that educ is endogenous because it is correlated with ability (an omitted variable), so we decide to estimate an IV regression with two instruments:  mothe- duc  (mother’s years of education) and fatheduc  (father’s years of education).  The TSLS estimation yields the following results:

Variable

Estimated coecient

Robust standard error

Constant

0 04

0 4

educ

0.06

0.03

exper

0.044

0.011

exper2

0.0009

0.0003

(a)  Determine which of the coefficient estimates are (individually) significantly different from zero at a 5% level.

Answer:

Constant : t _ stat = 0.1 < 1.96

educ : t _ stat = 2 > 1.96

exper : t _ stat = 4 > 1.96

exper2  : t _ stat = 3 > 1.96

Therefore, only the intercept is not statistically significant at a 5% level.

(b) If we do not use IV estimation, the coefficient on the return to education is about 0.11 (with a robust standard error of 0.02).  Compare this coefficient with the one obtained from TSLS. Why are they different? Are both coefficients reliable?

Answer:

The coefficient from  OLS  (0.11) is higher than the one from TSLS  (0.6) because the  OLS coefficient is overestimating the impact of education because it is including part of the positive ability effect. Then, the OLS coefficient is unreliable (biased and inconsistent). As long as our instruments are ne (relevant and exogenous), our TSLS coefficient is reliable.

(c) Now we want to test for the relevance of the instruments we are using. In the 1st stage of TSLS we estimate the following equation:

educ = π0 + π1motheduc + π2 fatheduc + π3 exper + π4 exper2 + ν .

State the null hypothesis to test for instruments’ relevance.  The F-statistic is 55.40. What do you conclude? What is the meaning of instrument relevance?

Answer:

H0  : π 1 = π2 = 0.

55.40 > 10 and therefore, the instruments are strong (not weak). That is, we have evidence that our instruments are strongly correlated with the endogenous variable (educ).

(d) Now you want to test if your instruments are indeed exogenous. You estimate the regression: TSLS  = δ0 + δ1motheduc + δ2 fatheduc + δ3 exper + δ4 exper2 + ε .

What is the null hypothesis?  The F-statistic is 0.2.  Obtain the critical value at a 5% level. Do you accept or reject the null?  Are our instruments exogenous?  What is the meaning of instrument exogeneity?

Answer:

H0  : δ 1 = δ2 = 0.

J _ statisitic = 2 × 0.2 = 0.4

χ1(2)(5%) = 3.84

Note that J _ statisitic < 3.84 and hence we cannot reject H0 .  That is, we cannot reject the null that our instruments are exogenous.  If our instrument are exogenous, it means that they are not correlated with the error.

4.  (10 points) Wages and education.  We include educ  (years of education),  exper  (years of labor market experience), and tenure (years with the current employer) in an equation explaining log(wage). That is, we have the following model:

log(wage) = β0 + β1 educ + β2 exper + β3tenure + ε .

You think that the impact of an extra year of education on wages is exactly 5 percentage points (or 0.05) higher than the impact of an extra year of tenure.  How would you transform the original regression in order to test this hypothesis (with a t-test)?

Answer:

The null hypothesis is H0  : β 1  = β3 + 0.05.  This is equivalent to testing H0  : β 1 _ β3  = 0.05.  If we subtract and add β3 educ in the right-hand side of the regression equation we get:

log(wage) = β0 + (β1 _ β3 )educ + β2 exper + β3 (educ + tenure) + ε .

Let γ = β 1 _ β3  and let Z = educ + tenure. Therefore, to test H0  : β 1 _ β3  = 0.05, we can run the regression

log(wage) = β0 + γeduc + β2 exper + β3Z + ε

and test, with a t-test, the null H0  : γ = 0.05.

(This is only one way to do it.   We can also, for example, modify the regression by adding and subtracting β1tenure, or by adding and subtracting (β3 + 0.05)educ, etc)