Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECONOMICS 522

Final Exam

Spring 2022

Instructions:

● You have 24 hours to do the following 6 problems.

● The total number of points is 200.

● The problems have not been ordered in terms of di¢ culty. There is huge variability in the di¢ culty of questions.

● Note that most of the questions within each problem can be answered independently of each other.

● To obtain full credit, write out numerical answers in decimal form. In the calculations please keep at least three significant figures.

● The test is open-book.

Problem 1 (40 points)

A researcher wants to study the e§ect of income on spending. She uses a dataset that contains information on spending by those who won a lottery last year.  The dataset contains the following variables for each individual:

S : (annual) spending (in thousands of dollars);

Lott : lottery winnings (in thousands of dollars);

Inc :  (annual) income (in thousands of dollars, does not include Lott);

TotInc : = Lott + Inc.

The researcher estimates the following regressions (assuming homoskedasticity):

Dependent Variable:

Regressors

S

(1)

S

(2)

S

(3)

S

(4)

ln(S)

(5)

ln(S)

(6)

TotInc

0.728***

0.698***

0.693***

0.0192***

(0.0580)

(0.0618)

(0.209)

(0.00260)

Lott

0.202

x1

(0 146)

Inc

x2

TotInc2

0.00226

(0.0129)

ln(TotInc)

1 200***

(0.164)

constant

1.282

-2.096

x3 2.424

2.323***      -1.312*

(4.232)

(4.874)

(7.777)

(0.190)        (0.678)

Observations R2

120

0.572

120

0.578

120

120

0.572

120

0.315

120

0.311

The dependent variable in regressions (1)-(4) is S, and it is ln(S) in regressions (5) and (6).

Standard errors in parentheses; *** p<0.01, ** p<0.05, * p<0.1.

Answer the following questions:

1.  (6  points)  Interpret  the  coe¢ cients  on  TotInc  in  regressions  (1)  and  (5),  and  the  coe¢ cient  on ln(TotInc) in regression (6).

2.  (4 points) Interpret the coe¢ cient on Lott in regression (2). (Hint: Remember the deÖnition of TotInc.)

3.  (4 points) Describe how you test the null hypothesis "neither lottery winnings nor other income has an e§ect on spending" using regression (2).

4.  (6 points) Consider an individual with TotInc = 50.  Compute the e§ect (in thousands of dollars) of increasing TotInc by 10% (other things being the same) according to the estimates of regressions (4) and (6).

5.  (10 points) Find x1, x2, x3 for regression (3).  (Hint:  Use regression (2) and the relation TotInc = Lott + Inc:)

6.  (10 points) What do you think is the advantage of using the data on individuals who won a lottery to estimate the e§ect of income on spending?  (Answer in 150 words or less, but please be precise).

Problem 2 (20 points)

The table below presents the results of estimating a Linear Regression (LR) model, a Logit model, and a Probit model for a binary dependent variable, y, using the explanatory variables x; m; m · x, and a constant. Here m is a dummy (binary) variable, and x is continuously distributed.

Regressors

(1)

LPM

(2)

Logit

(3)

Probit

x

0.468

(0.0369)

3.772

(0.612)

2.192

(0.325)

m

0.292

(0.0393)

2.467

(0.344)

1.436

(0.191)

m · x

-0.0172

0.0465

0.487

(0.817)

0.258

(0.434)

constant

0.412

(0.0322)

-0.645

(0.240)

-0.375

(0.137)

observations

380

380

380

The standard errors are provided in the parentheses.

1.  (5 points) Consider an individual with x = 0:5 and m = 0. What is the predicted probability of y = 1 according to the estimated Logit model? According to the Linear Regression model?

2.  (10 points) For this question use the estimated Probit model.  Suppose Ann has m = 0 and Bob has m = 1. For both of them, calculate the e§ect of changing x from 0 to 0:5.

3.  (5 points) Can you test the null hypothesis "x has no e§ect on y" in LPM using the information given in the table? If yes, perform the test; if not, clearly explain why.

Problem 3 (55 points)

Answer the following questions. The questions are not related to each other and can be answered indepen- dently of each other.  The questions do not require more than 100 words for a complete answer but please be sure to be precise.

1.  (10 points) Alice has a random sample of studentsítest scores (or GPA) and their Örst job salary. Suppose Alice chooses to study the e§ect of test scores on job salary by regressing the job salary on the test score. Would her regression analysis su§er from any bias? Explain.

2.  (10 points) You have a dataset with variables Y; X; Z in it. You want to run the instrumental variables regression of Y on X using Z as an instrument. However, you are concerned that the instruments may be weak. How would you check if the instruments are weak?

3.  (10 points) Consider the problem of estimation of the e§ect of number of children on womenís labor supply.  As we did in class, restrict attention to the subpopulation of women who had at least two children, and consider variables X = "the woman had more than two children" and Z = "the sex of her Örst two children was the same". Explain why Z is a good (valid) instrument for the endogenous variable X.

4.  (10 points) Suppose that

yi  = xi(*)8 + "i

where xi(*)  and "i  are independent and E ["i] = 0 (also assume that (xi(*); "i ) is independent of (xj(*); "j )  for all i j). Unfortunately, you do not observe xi(*) . Instead, you observe

xi  = xi(*) + vi

where E [vi] = 0 and the vs are independent of each other and of everything else.  (This is called the measurement error problem, where xi  contains the true observation and a contaminating error term vi .)  Suppose you regress yi  on xi  (that is, you run OLS without a constant).  Is the OLS estimator consistent in this case? Show your work.

5.  (15 points) Suppose you have another measure zi  = xi(*) + ui , where ui  is i.i.d.  and independent from all other variables.  Consider using zi  as the instrument variable and construct an IV estimator using the observations {yi ; xi ; zi }. Is the IV estimator consistent? Show your work.

Problem 4 (15 points)

Suppose that Yt  follows the stationary AR(2) model,

Yt  = _2 + 0:75Yt 1 _ 0:125Yt 2 + ut

where ut has E[ut] = 0 and V [ut] = 9 and is independent of (Yt 1 ; Yt 2 ; Yt 3 ; :::) (and of (ut 1 ; ut 2 ; ut 3 ; :::)). Note that the coe¢ cients -2, 0.75, -0.125 and 9 above are assumed to be known rather than estimated.

1.  (5 points) Suppose that you observe Yt  = 1 and Yt 1  = _1, what are your forecasts of Yt+1  and Yt+2  ?

2.  (5 points) Assume that this process is stationary. Compute the mean of Yt .

3.  (5 points) What is the root mean squared forecast errors of the forecasts in (a)?

Problem 5 (20 points)

Answer the following questions. The questions can be answered independently of each other. The questions do not require more than 100 words for a complete answer but please be precise.

1.  (10 points) Suppose we have a random sample of 1000 married couples. Some of the couples had been randomly chosen (by a coin áip) to receive a gift of free access to a very large library of electronic books for the whole year 2015.  (Having received the gift, husbands and wives can access and read the books from the library independently of each other.) We are interested in estimating the e§ect of the free access to the library on the total number of books (Yi ) the individual i has read in 2015.  Let Xi  = 1 if the individual i has received the gift and Xi  = 0 otherwise, i = 1; :::; 2000.

(a)  First consider the subsample of wives only (i.e., 1000 observations). James says that because Xi has been randomly assigned we can estimate the e§ect by the simple OLS regression Yi on Xi . Bob disagrees and says that the number of books read in 2015 will be closely related to the number of books the person reads in a typical year, regardless of having received the gift. Therefore, argues Bob, to estimate the e§ect we must include the number of books read by the person in a typical year into the regression. Who is right and why?

(b)  Now consider the full sample with 2000 observations.  Suppose we are not concerned about the omitted variable bias, and we estimate the e§ect of the gift on the number of books an individual read in 2015 by running an OLS regression of Yi  on Xi .  Amy says that we should use clustered standard errors for this regression, even though we do not use Öxed e§ects regression here. Helen disagrees, saying that the usual heteroskedasticity-robust standard errors are most appropriate, especially given that Xi  has been randomly assigned. Who is right and why?

2.  (4 points) Brieáy explain the advantages of Logit and Probit regressions over the Linear Probability Model regression.

3.  (3 points) Remember that in the CA school dataset we have used variable testscr is the average school district test score, and str is the student-to-teacher ratio. Suppose we try to run the command ìregress testscr testscr strî. Does this regression su§er from perfect multicollinearity?

4.  (3 points) What does the command ìxtsetîdo in Stata? Brieáy explain how and why it is used.

Problem 6 (50 points)

During the 1880s, a cartel known as the Joint Executive Committee (JEC) controlled the rail transport of grain from the Midwest to eastern cities in the United States. The cartel preceded the Sherman Antitrust Act of 1890, and it legally operated to increase the price of grain above what would have been the competitive price.  From time to time, cheating by members of the cartel brought about a temporary collapse of the collusive pricesetting agreement.   In this exercise,  you will use variations in supply associated with the cartelís collapses to estimate the elasticity of demand for rail transport of grain. The data Öle JEC contains weekly observations on the rail shipping price and other factors from 1880 to 1886.1 A detailed description of the data is contained in JEC_Description.

Suppose that the demand curve for rail transport of grain is speciÖed as

12

ln(Qi ) = 80 + 81 ln(Pi ) + 82 Icei +) 82+jSeasj;i + ui ,

j=1

where Qi  is the total tonnage of grain shipped in week i, Pi  is the price of shipping a ton of grain by rail, Icei  is a binary variable that is equal to 1 if the Great Lakes are not navigable because of ice, and Seaj  is a binary variable that captures seasonal (monthly) variation in demand (in total 12 of them). Ice is included because grain could also be transported by ship when the Great Lakes were navigable.

Answer the following questions by running appropriate regressions and explaining the results.  Be sure to attach your STATA output table in questions 1, 4, 5, which contains the code already.  (If you use some other software, please attach the code.)

1.   (10 points) Estimate the demand equation by OLS. What is the estimated value of the demand elasticity and its standard error?

2.  (10 points) Is the OLS estimator of the elasticity biased? If yes, why?

3.   (10 points)  Consider using the variable  cartel  as instrumental variable for ln(P).   Use economic reasoning to argue whether cartel plausibly satisÖes the two conditions for a valid instrument.

4.  (10 points) Estimate the Örst-stage regression. Is cartel a weak instrument?

5.  (10 points) Estimate the demand equation by instrumental variable regression. What is the estimated demand elasticity and its standard error?

6.    (Bonus  question,  10  points)  Does  the  evidence  suggest  that  the  cartel  was  charging  the  proÖt- maximizing monopoly price?  Explain.  (Hint:  What should a monopolist do if the price elasticity is less than 1?)