Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

125785 Research and Analytics in Economics and Finance

Assignment 2

Manawatu¯ Internal and Distance

Due date: 20 May, 2024

Instruction

-  Submit your works on Assignment 2 in the Dropbox on the Stream  125785 course website: Assessment (Manawat¯u and Distance)  Assignment 2.

-  Submit  one  PDF  file  which  includes your answers to Part A and B, screenshots of the results in Stata, and your Stata do-file.

-  Use the filename fullname__A2.pdf. e.g. DongwanChoo_A2.pdf.

-  Write your Full Name and Student ID on top of every page.

-  Include headers (e.g. Part A, Part B, Results, Code).

Part I: Analytical Problem (80 points)

1.  (8 points)  Omitted  Variable Bias

The true regression is given by the following equation:

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + u

However, you omit X1 , X3 , and X4  and estimate the following regression model instead:

Y = β0(*) + β2(*)X2 + u*

The relationship between the omitted variables and X2  is given by the following equa- tions:

X1  = ω0 + ω1X2 + µ      X3  = γ0 + γ1X2 + η       X4  = θ0 + θ1X2 + ε

(a)  (4 points) Find the estimated values of β0(*)  and β2(*)  in terms of the true β’s. What is the omitted variable bias term for β0(*)? What is the omitted variable bias term β2(*)? Show your work.

(b)  (4  points) Suppose that the true effects of X1 , X3 , and X4  on Y are given by β1  = 0.6, β3  = −2.6, and β4  = 1.3.  You observe that the relationships between these three variables and X2  are given by ω1  = 0, γ1  = 0.5, and θ1  = 1.  What is the predicted bias for β2(*)? Explain your answer as clearly as possible.

2.  (16 points) Limited Dependent  Variable  Regression Models

This question examines the performance of alternate methods of estimating models with a binary outcome variable.  Use the data set “fertility.dta”.  The question examines the determinants of whether or not someone has had a child (which is a binary variable).

(a)  (4  points) Estimate the effect of a woman’s age, age squared, education level, and whether or not they are Catholic on whether or not they have had a child using a linear probability model.  Make sure to account for heteroskedastic errors. How do we interpret the coefficient on educ?  Which explanatory variables are statistically significant?

(b)  (4  points) Find the predicted values for each individual in the data based on the linear probability model in part a).  Are any of the predicted probabilities problematic? Explain.

(c)  (4 points) Re-estimate the equation using a logit model and present the marginal effects.  How do the estimates compare to those in part a)?  Find the predicted values for each individual. Are any of these problematic? Explain.

(d)  (4 points) Re-estimate the equation using a probit model and present the marginal effects. How do the estimates compare to those in part a) and c)? Find the pre-  dicted values for each individual. Are any of these problematic? Explain.

3.  (16 points) Difference-in-Difference

Suppose that New Zealand government intends to test if adding a $4.00 fee to each pack of cigarettes deters smoking.  They randomly select 20 of 53 districts in NZ to implement the fee in 2022.  Data is collected on whether or not each resident smokes (Smoker) in 2020 (Before) and 2024 (After).  The following table presents the frac- tion of residents who smoke before and after the policy is implemented in the treated districts and all other districts (the controls).

 

2008

2012

Treat

0.52

034

Control

0.45

0.41

(a)  (4  points)  We  wish  to estimate a single difference regression for the treated counties.  Write the regression equation using values β(ˆ)0  and β(ˆ)1  computed from the table of means above.

Smoke = β0 + β1 After + u

(b)  (4 points) We with to estimate a difference-in-differences regression.  Write the regression equation using values ofβ(ˆ)0 , β(ˆ)1 , β(ˆ)2 , and β(ˆ)3  computed from the table of means.

Smoke = β0 + β1Treat + β2 After + β3Treat × After + u

(c)  (4 points) What is the estimated effect of the policy using the single-difference

method? Using the difference-in-difference method? Explain why they differ.

(d)  (4 points) The table above uses all other districts in NZ as control counties.  We might get more accurate estimates if we carefully choose a smaller set of counties to act as the control counties.  Identify three characteristics that we might wish those counties to have.

4.  (20 points) Matching

In this question you will implement matching to choose a control group.  Continue to use the data set training.dta”.

(a)  (4 points) Use a probit model to generate a propensity for treatment in the pre- period for each individual in the data.  Explain what variables you are using to generate this score and why. What is the average propensity score for employees who were treated and who were not treated?

(b)  (4 points) Match each treated individual with the control individual who has the closest propensity score.  Match with replacement.  Do not use Stata shortcuts. Show  all  code.   What  is  the  average  propensity  score  for  employees who were treated? For matched control employees?

(c)  (4 points) Examine if there is balance in observables between treated and matched control individuals prior to the treatment (i.e.  in  1975).  Present empirical evi-  dence in the form of a balance table with means and p-values.

(d)  (4  points) Estimate the effect of the training on minutes of sleep, minutes of work, and good health using a difference-in-differences design, respectively.  Make sure to account for heteroscedasticity.  Compare these results to those in the prior question in which matching was not used.

(e)  (4  points) Estimate the effect of the training on minutes of sleep, minutes of work, and good health using a model that includes individual fixed effects,a year fixed effect,  and controls for having a young child.   Make  sure  to account for heteroscedasticity. Compare these results to those in the prior question in which matching was not used.

5.  (20 points) Instrumental  Variables

You are interested in estimating how the number of days of work missed affects the size of an employee’sannual raise:

raisei  = β0 + β1missedi + ui

You collect data on the size of the raise (raise) and the number of days of work missed (missed) for employees at a Palmy convenience store.   You  are  concerned that the estimated effect of days missed on the size of the raise may be biased by omitted variables.   So,  you  gather  data  on  the  distance  that  each  employee  lives  from  the convenience store. You intend to use this as an instrumental variable for days of work missed.

raise

missed

distance

1

8

6

6

0

2

3

3

3

1

9

12

5

2

3

9

0

4

(a) (4 points) Estimate β0  and β1  using ordinary least squares and write the resulting equation. Show your work for both stages.

(b) (4 points) Suppose that "hardworking" is an omitted variable. Carefully explain how omitting hard working from the regression is likely to bias the estimate of β1 .

(c) (4 points) You wish to use distance as an instrument for days missed. Explain the two conditions distance must satisfy in order to be a valid instrument.

(d) (4 points) Compute the instrumental variables estimate for β1  and compare it to the OLS estimate in part a). Show your work for both stages.

(e) (4 points) Repeat part d) using two stage least squares. Show your work for both stages. How does the estimate compare to the IV estimate?

Part II: Critical Reading and Presentation (20 points)

Select one research article published on or after 2020 (including forthcoming articles) in the top or the ABDC-A* journals (see the list in this link) in Economics and Finance. The paper should be in the area of your interest and contain empirical analysis. Carefully read the article and write a short report with your research proposal. The report should be around 1000 - 1800 words (2 - 4 pages) discussing the follows:

Write a short report.

–  Why this is an interesting research to you?

–  Summarize the article. (purpose, data, methods, key findings, etc.)

∗ Summarize the article (e.g., study’s purpose, data and methods used, key findings). (One or two paragraphs should be OK.)

∗ Describe the major tested question and expected result in theory. (You may identify the equation for regression and expected sign of the coefficient ex- pression the tested relationship.)

∗ Describe the specific testing details that provide the major conclusion of the tested relationship.

∗ What are the major robustness tests? And their supportive points?

∗ Discuss any special technical issues of the article, particularly in initial data treatment, descriptive statistics, testing methods, results analysis, and further discussion.

–  Critically discuss the methodological/econometrics challenges and solutions.

• Write a short research proposal (at least 2 paragraphs).

 What is your research question?

–  Choose your research design (data, methods, etc.).

–  Outline your expected results.

Format recommendation

. Word limits:  1000 - 1800 words, 1.5 spacing

. Font: 11 pt

. No title page required.

. For more information, please visit The Online Writing and Learning Link.

Paper examples (You can access these papers by connecting to Massey WiFi or using Massey VPN.)

* Aghion, Philippe, Antonin Bergeaud, and John Van Reenen.  2023.  "The Impact of Regulation on Innovation." American Economic Review, 113 (11): 2894-2936.

DOI: 10.1257/aer.20210107

* Akhtari, Mitra, Natalie Bau, and Jean-William Laliberté .  2024.  "Affirmative Action and Precollege Human Capital." American Economic Journal: Applied Economics, 16 (1):  1-32.

DOI: 10.1257/app.20210807

* Angelucci, Charles, and Andrea Prat.  2024.  "Is Journalistic Truth Dead?  Measuring How Informed Voters Are about Political News." American Economic Review, 114 (4): 887-925.

DOI: 10.1257/aer.20211003

* Arenberg,  Samuel,  Seth  Neller,  and  Sam  Stripling.    2024.   "The  Impact of Youth Medicaid Eligibility on Adult Incarceration." American Economic Journal:  Applied Economics, 16 (1):  121-56.

DOI: 10.1257/app.20200785

*  Baum-Snow,  Nathaniel, Nicolas Gendron-Carrier, and Ronni Pavan.   2024.   "Local Productivity Spillovers." American Economic Review, 114 (4): 1030-69.

DOI: 10.1257/aer.20211589

*  Corno, Lucia, Eliana La Ferrara, and Justine Burns.  2022.  "Interaction, Stereotypes, and Performance: Evidence from South Africa." American Economic Review, 112 (12): 3848-75. DOI: 10.1257/aer.20181805

*  Figlio, David, and Umut Ozek.  2024.  "The Unintended Consequences of Test-Based Remediation." American Economic Journal: Applied Economics, 16 (1): 60-89.

DOI: 10.1257/app.20210037

*  Holz, Justin, Rafael Jiménez-Durán, and Eduardo Laguna-Müggenburg.  2024.  "Esti- mating the Distaste for Price Gouging with Incentivized Consumer Reports." American Economic Journal: Applied Economics, 16 (1): 33-59.

DOI: 10.1257/app.20210428

* Korovkin, Vasily, and Alexey Makarin.  2023.   "Conflict and Intergroup Trade:  Ev- idence from the 2014 Russia-Ukraine Crisis." American Economic Review,  113  (1): 34-70. DOI: 10.1257/aer.20191701