Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON 140  Econometrics

SPRING 2023

Problem Set 2

Total score of 100 points. Answer all questions.

(Submit via Gradescope and avoid hand-written answers if possible.)

Question 1 (on RCTs)

The Ministry of Health in a large country wants to know the causal effect of offering an additional training course to nurses in rural hospitals on patient health outcomes. The Ministry heard about several rural hospitals that have recently chosen to offer this course on their own accord. The Ministry now plans to estimate the causal effect of this training course by letting the Ministry’s staff compare the average health outcomes in the hospitals that implemented the training course relative to the average health outcomes in other rural hospitals that did not choose to implement the course.

A) Using notation from the Potential Outcomes Framework, briefly explain the concept of the Average Treatment Effect (ATE) to the Minister, and how what they plan to compute in the analysis above relates to this definition. (5 points)

B)  Referring to the expressions you use in your answer to A), explain why a randomized control trial (RCT) could be useful, and very briefly describe the basics of how the Ministry could set this up. (5 points)

C)  The Ministry mentions that it has no legal authority to force hospitals to either implement or to  not  implement  the  training  course.  Using  notation  from  the  Potential  Outcomes Framework, explain why this information could be important for the interpretation of the results from the RCT relative to the ATE, and how the Ministry should address this concern in the RCT analysis? (10 points)

D) After your conversation, the Ministry gets back to you to share its plan for the implementation of the RCT. It says it can save on costs by not sending any Ministry staff to the control hospitals. The Ministry says it gets the data on the health outcomes in all the hospitals automatically in any case, so that it only has to send its staff teams to the hospitals in the treatment group. Explain whether and why this could give rise to concerns? (5 points)

E)  The Ministry talked to other economists, and now it is worried about spillover effects on the control group. The staff don’t fully understand what the concern is, however. Briefly explain to them the intuition behind this concern, and explain how they could potentially address it when designing the RCT. (10 points)


Question 2 (on IV estimation)

This questions asks you to estimate the causal effect of tourism on local household incomes in Mexico. To answer this question, we will use R and the dataset Mexico_PS2.csv” that you can download from BCourses. The dataset contains 1153 Mexican municipalities that reported some amount of local tourism activity (measured by local hotel sales) in the year 2000. Write up the answers below in the same document as above. In addition, also attach the complete code that you used to answer the questions. You are not required to export results in LaTeX, it is enough to show your output in R (using either knitR/RMarkdown or just showing the output, e.g. with screenshots).

a)   Open the dataset. There are several packages which you need to install and load. Use the following commands for this:


install.packages(c('plotly','showtext','huxtable','jtools','ivreg'))

library('plotly')

library('huxtable')

library('showtext')

library('jtools')

library('ivreg')


Visualize a table that lists the number of observations, the mean, the standard deviation, the minimum value and the maximum value for each of the variables in the dataset (if you had difficulties with this in the previous problem set, use the summary() command). Briefly describe what we learn from the table about the sample of Mexican municipalities. (5 points)

b)  Use the data to obtain an OLS point estimate of the effect of local tourism activity (measured by the logarithm of local hotel sales) on the logarithm of local average monthly household incomes.  Show your result  in  a regression  table, using  the  command  export_summs(). Comment on the interpretation and statistical significance of your results. (5 points)

c)  List three plausible arguments why the point estimate in b) could be biased upwards or downwards relative to the true causal effect of local tourism activity on monthly household incomes. Be specific in signing the bias for each argument. (10 points)

d)  Now your GSI suggests that the kilometer distance between the center of the municipality and the nearest segment of the US-Mexico border could be a valid instrumental variable for your measure of local tourism activity. List the assumptions that need to hold true for this to be correct. (5 points)

e)  Verify if the assumption of instrument relevance is satisfied, and export the results into the same regression table that you used above (again using the export_summs() command). Comment on the interpretation and statistical significance of your result. (10 points)

f)   Now estimate the 2nd  stage IV (TSLS) point estimate as suggested by your GSI, and show your result in the same regression table you used before (again using the export_summs() command). Comment on the interpretation and statistical significance of your result. In reference to your answer to c), is the difference between the OLS and IV point estimates as you expected or rather not? (15 points)

g)  Now one of your friends suggests that the distance to the US border is likely correlated with other local characteristics that affect local incomes, such as the logarithm of the average temperature, the logarithm of the average precipitation, the average years of education and the proportion of indigenous population. Propose a way to verify whether these concerns are relevant and export your regression results in the same export_summs() table as before. Comment on the results and what they imply about the validity of the instrumental variable strategy. [Hint: remember how the Colonial Origins” paper assessed to what extent, for example,  a country’s latitude may be an omitted variable that could be correlated with the instrument.] (15 points)