关键词 > ECOM30002/ECOM90002

ECOM30002 / ECOM90002 Econometrics 2 Semester 2 Assessment, 2021

发布时间:2022-10-21

Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Semester 2 Assessment, 2021

ECOM30002 / ECOM90002

Econometrics 2

Question 1 (20 marks )

A country has been ravaged by a pest. The economy is struggling, with 3 of the country’s 6 equally large economic sectors set to end the nancial year with losses. The government is considering a reform package, but it would have heterogeneous effects on the economy.

The following table characterises the potential outcomes of the reform, where Y1i denotes sector i’s potential profits (for Y1i  > 0) or losses (for Y1i  < 0) if it were subjected to the reform, and Y0i denotes i’s potential profits or losses if it were not subjected to the reform:

Sector

Y0i

Y1i

a

7.0

16.0

b

-4.0

12.0

c

-8.0

-3.0

d

14.0

13.5

e

0.5

-0.5

f

-4.0

-10

Consider the following three dierent ways of assigning the treatment:

(i) the reform applies to every sector in the economy;

(ii)  adoption of the reform is voluntary (assume that each sector acts as a single prot-maximising

agent that has perfect information of the sectors potential outcomes);

(iii) the reform only applies to sectors set to post a loss without the reform.

1.  ( 6 marks) What is the average eect of the treatment on the treated (ATT) for each case

(i), (ii), and (iii)?

2.  (3 marks) Does any of the three ATTs above correspond to the average treatment effect (ATE)? Explain.

3.  ( 5 marks) Calculate the OLS coecients for the regression of Yi  on Xi  for case (iii).

4.  ( 6 marks) Calculate the selection bias for case (iii), and give an intuitive explanation of why the OLS regression does or does not estimate a causal effect in this case.

Question 2 (20 marks )

A researcher is interested in the eect of family size on mothersemployment.

Specifically, the researcher uses a sample of women with either two or more children to estimate the causal effect of a third birth (ThirdBirthi=1 if mother i has three or more children, 0 if she has two) on whether the mother is employed (Employedi=1 if i is employed, 0 otherwise).  The instrument used for third birth is an indicator of the second birth being twins (Twinsi=1 if mother i’s second and third children are twins, 0 otherwise).

The researcher reports the following results.

Employedi

ThirdBirthi

Employedi

OLS

OLS

IV

(1)

(2)

(3)

ThirdBirthi Twinsi

-0.167

(0.002)

0.625

(0.011)

-0.083

(0.017)

Notes: Cells contain coefficient estimates. Robust standard errors in parentheses. The mean of Employedi  is 0.528.  Column headers indicate dependent variable and estimator.

1.  (2 marks) Give an appropriate interpretation of the OLS estimate from Column (1).

2.  (4 marks) Explain why the OLS estimate is unlikely to represent the causal effect of hav- ing more than two children on employment for the population in question, giving concrete examples that apply to this setting.

3.  (4 marks) Interpret the estimated rst stage slope, and calculate the rst stage intercept.

4.  (4 marks) Do the results indicate that the instrument is relevant?  Explain your answer. Based on theory, is this result surprising? Explain your answer.

5.  (4 marks) Do you think the instrument is exogenous? Explain why or why not.

6.  (2 marks) Give an appropriate interpretation of the IV estimate from Column (3).

Question 3 (20 marks )

Consider the following system of equations:

Y2i = α21Y1i + β21Z1i + β22Z2i + U2i                                                                                                                      (2)

Y3i = β31Z1i + β32Z2i + U3i                                                                                                                                           (3)

where E(U1ilZ1i, Z2i) = 0, E(U2ilZ1i, Z2i) = 0, E(U3ilZ1i, Z2i) = 0.

1.  ( 7 marks) Let α 13  = 0, and α 12 0, α21 0.  Carefully explain under which conditions equations (1) and (2) are identified and how one could estimate the parameters.

2.  ( 7 marks) Let α21  = 0, and α 13 0, and α 12 0.  Explain under which conditions OLS estimation of (1) is inconsistent. Stating any necessary assumptions, explain if and how one could estimate the parameters of (1) in that case. Distinguish between the cases of β11  = 0 and β11 0.

3.  ( 6 marks) As in part 1 of this question, let α 13 = 0, and α 12 0, α21 0. Suppose i indexes cities, Y1i  represents the number of murders per capita, and Y2i  represents the number of police officers per capita. Explain if the simultaneous equations system (1)-(2) is well-defined in the sense of each equation having its own clear causal interpretation. What signs for α 12 and α21  do you expect and why?

Following a terror attack in a neighbouring country, the federal government announces it will strengthen national security by spending more on safeguarding big cities.  Which variable in the model do you think would best represent these extra funds?  Based on your answer, discuss whether this variable would help identify any (or all) of the equations in the system.

Question 4 (20 marks )

Consider the following panel data generating process (DGP), from which 10,000 repeated samples were drawn of n = 100 cross-sectional units i observed over T periods of time; i.e., t = 1, 2, . . . , T :

Yit = βXit + Uit ,    where   Uit = αi + Vit ,                                                                            (4)

where each Xit  and Vit  were drawn from two independent standard normal distributions, Xit  ~ N(0, 1) and Vit ~ N(0, 1); and αi = δ i + εi , with εi ~ N(0, 1) and i = Xit .

Throughout the simulation, β = 1. The simulation is repeated for the four different combina- tions of δ = {0, ^T} and T = {2, 8} (the four combinations are listed in the table below). In each repeated sample, model (4) is estimated by pooled OLS (“Pool”) and by the xed effects estimator (“FE”). For each estimate of βE  obtained with estimator E = {Pool, FE}, a t-test is conducted using the test statistic

tE  = βˆE - 1

where rse(βˆE ) denotes a heteroskedasticity-and-autocorrelation-consistent (HAC) standard error of βˆE . The following table summarises the results obtained from the simulation:

Case:

Pooled OLS, βˆPool

Fixed eects, βˆFE

Avg

SD

RF tPool

Avg

SD

RF tFE

δ = 0, T = 2

0.999

0.100

0.050

1.001

0.100

0059

δ = 0, T = 8 δ = ^T , T = 2

1.001 1.70

0.050 0.123

0.053

1.000

1.001 1.000

0.038 0.101

0.053

0.062

δ = ^T , T = 8

1.351

0.068

0.999

1.000

0.037

0.048

Notes:  “Avg” and“SD” indicate mean and standard deviation of the estimates of 8E  over repeated samples. “RF” indicates the proportion of repeated samples in which the p-value associated with the corresponding t-statistic was less than

0.05.

1.  (2 marks) Show that for both values of δ (0 and^T) the variance of αi  does not depend on the number of time periods T .

2.  ( 6 marks) Explain in which of the four cases pooled OLS and FE are unbiased for β, and in which they are biased.

3.  ( 6 marks) Discuss the estimated standard deviations of the estimators  (SDs), by linking observed differences in the SDs to features of the DGP and of the estimators.

4.  ( 6 marks) For all four cases, interpret the reported rejection frequencies and comment on whether they are consistent with your expectations regarding the size and/or power of the test.

Question 5 (20 marks )

In Australia, the government uses a number of nancial incentives to bolster the uptake of private health insurance (PHI). Rich individuals face a negative incentive payment (a tax penalty) called the Medicare Levy Surcharge (MLS) if they do not purchase PHI. Eligibility for the MLS is a function of the individual’s taxable income, with the threshold having changed a number of times in the past. Consider the following panel data model for the demand for PHI:

PHIit = ρPHIit-1 + βMLSMLSit + X tβ + αi + γt + Vit ,                                                  (5)

where PHIit  is a dummy indicating that individual i in year t had purchased PHI, and MLSit  is a dummy indicating that i in t was eligible for the MLS. Xit  is a vector containing individuals’ age, income and self-assessed health status.

1.  (4 marks) Explain which parts of Equation (5) can reflect persistence in the demand for PHI beyond that explained by Xit  and how the persistence induced by these parts differs from each other.

2.  ( 6 marks) A group of individuals becomes temporarily eligible for MLS in year t (they are ineligible in all other periods). What is the effect of this temporary eligibility on the demand for PHI in years t, t + 1 and t + 2 if (i) ρ = 0?  (ii) ρ 0?

Now consider the following table of estimation results for variants of (5):

Pooled OLS

(1)

FE

(2)

Dynamic model

(3)

MLSit

PHIit-1

0.120

(0.007)

0.007 (0.004)

0.025

(0.007)

0.858

(0.049)

Covariates Xit

and year FE

t

t

t

Individual FE

t

t

Observations

39,040

39,040

19,520

Notes:  FE denotes the xed effects estimator.  Dynamic model estimated by IV on the rst-differenced model using PHIit 2  as an instrument for APHIit 1 .

3.  (4 marks) Consider only the results in columns (1) and (2). What does the difference between the Pooled OLS and FE estimates of the coefficient on MLS reveal about the effect of omitted individual-specific variables on the demand for PHI and their relation to MLS?

4.  ( 6 marks) Is the FE estimator consistent if ρ 0?  Explain and discuss which of the three estimators in the table is your preferred estimator based on the reported results and why.

Question 6 (20 marks )

This question considers quarterly time series data from the rst quarter (q1) of 1987 to the fourth quarter (q4) of 2013 for Australian domestic beer sales (Beert, index value equal to 100 in the rst quarter of the year 2000) and domestic wine sales (Winet, also indexed to 100 in q1 of 2000). The real growth rates for the variables are gBeert  = 400∆ log Beert  and gWinet  = 400∆ log Winet , respectively. The table below contains estimation results for some autoregressive (AR) models for gBeert  with a maximum lag order of 4.