Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

SEMESTER 1 ASSESSMENT, 2022

ECOM30001: Basic Econometrics

Question 1 [20 marks]

a) [5 marks] Suppose you are investigating the effects of traffic congestion and traffic- related air pollution on infant health outcomes.  This research question is examined by analysing the impact of the introduction of an electronic toll collection system along an extended stretch of a local freeway.  This new electronic toll collection system reduced delays at toll collection booths, as well as air pollution caused by idling, accelerating, and decelerating.  This electronic toll collection system was implemented at different times along this extended stretch of freeway.   Consider the following timing of events for a particular section of the local freeway

period0 = Before: Observation of infant health outcomes

period1 = Introduction of electronic toll collection

period2 = After: Observation of infant health outcomes

A relevant treatment group would be mothers residing within  2 kilometres of a toll collection booth. Consider the following econometric model:

lowit  = a0 + a1 neari + a2 aftert + 81  Nneari * aftert } + 7 Xit + eit

with:

lowit  = 1 if child born to mother i has low birth weight (less the 2,500 grams), 0 otherwise neari  = 1 if mother i resides within a 2km radius of toll collection point, 0 otherwise

aftert  = 1 for the period after the introudction of electronic toll collection, 0 otherwise

Xit  = chararcteristics of mother i and child that are relevant to infant birth weight, such as, mother’s education, mother’s age, birth order, child gender,               whether mother smoked during pregnancy, and whether a multiple birth

This model was estimated using Ordinary Least Squares  (OLS) using panel data for births within 36 months before or after the introduction of electronic toll collection, for 98 toll collection points along the freeway. The results are presented below:

Variable                             Estimate   Std. Error   Pr(> |t|)

Near*After

_0.0093     0.0028          0.0009

Observations Additional Controls (X)

409,673

Yes

i) What is the interpretation of the population parameter 81 ?

ii) Test the hypothesis that the introduction of electronic toll collection had a (statis- tically) significant impact on infant birth weight. Your answer should clearly state the null and alternative hypotheses, the distribution of the test statistic, and your decision.

Note:  For this question, you may use the sample size as an approximation to the model degrees of freedom.

b) [5 marks] Consider the following econometric model:

audyent  = 80 + 81 audyent_1 + 82 audyent_1 + εt

is stationary or not. Your answer should clearly state the null and alternative hypotheses, the test statistic and its distribution. Using the results in Figure 1, what is the value of the Augmented Dickey-Fuller test statistic? At the 5% level of significance, explain whether the sample evidence is consistent with the null hypothesis.  Based upon the estimation results presented in Figure 1, the p-value associated with the Augmented Dickey-Fuller test (intercept, no trend) is 0.1212.

c) [5 marks] Let yi denote the number of doctor visits over a 12-month period by individual

i. The (probability) density of yi  follows a Poisson distribution

f (yi |i ) = exp(_i ) i(y)i                                i = 1, 2, . . . N

with E[yi] = 入i  and VAR[yi] = 入i .

Assume the conditional expectation of the number of doctor visits is given by:

E[docvisitsi |Xi] = exp N80 + 81 agei + 82 educi + 83 incomei + 84 chronici + 85 privatei } and:

yi  = docvisits = number of doctor visits over a 12-month period for individual i age = age of individual i, in years

educ = education of individual i, in years

income = annual income of individual i, in $000s of dollars

chronic = 1 if individual i reports having a chroninc condition, 0 otherwise private = 1 if individual i reports having private insurance, 0 otherwise

i) What is meant by the term count data? What are the important characteristics of count data?

ii) What is the interpretation of the estimate for 82 ?

iii) What is the interpretation of the estimate for 84 ?

d) [5 marks] Consider the following demand function for the quantity demanded of product Qt  as a function of its market price Pt

ln Qt  = a0 + a1 ln Pt + a2 xt + εDt

Consider also the following supply function for the quantity supplied of product Qt  as a function of its market price Pt

ln Qt  = 80 + 81 ln Pt + 82 zt + εSt

with:

COV(xt , εDt ) = 0        COV(xt , εSt ) = 0    COV(zt , εDt ) = 0        COV(zt , εSt ) = 0 and COV(εDt , εSt ) = 0.

Write out an expression for the reduced form for ln Pt . Does the supply equation satisfy the necessary condition for identification?  Briefly explain how you would test that the supply function satisfies the necessary condition(s) for identification. Your answer should clearly state the null and alternative hypotheses, the test statistic and its distribution.

Question 2 [20 marks]

In recent years workplace smoking policies have become increasingly prevalent and restric- tive. Consider the following econometric model to investigate whether these workplace policies reduce smoking:

smokei(*)  = 80 + 81 agei + 82 agei(2) + 83 incomei

+ 84 hsonlyi + 85 somepsi + 86 univi + 87 workbani + εi                                (1)

where εi |Xi  ~ Ⅳ (0, u2 ). Note that:

smokei(*)  = a latent variable determining whether individual i is a current smoker agei  = age of individual individual i, in years

incomei  = income of individual i, in $000s of dollars

nohs = 1 if individual i did not nish high school, 0 otherwise

hsonly = 1 if individual i nished high school, no further study, 0 otherwise       someps = 1 if individual i has completed some post-secondary study, 0 otherwise

univ = 1 if individual i has completed university level qualifications, 0 otherwise workban = 1 if workplace of individual i has a complete smoking ban, 0 otherwise

Note that nohs is the omitted education category.

Suppose you have a sample of observations for 16,258 employed individuals which also contains the following indicator variable:

smokei  = *i*i 0(0)

This suggests the following model:

smokei  = 80 + 81 agei + 82 agei(2) + 83 incomei +

+ 84 hsonlyi + 85 somepsi + 86 univi + 87 workbani + εi                                (2)

a) [1 mark] What is the interpretation of the population parameter 83  in the linear prob- ability model (2)?

b) [2 marks] Suppose model (2) is estimated by the method of Ordinary Least Squares (OLS) with smoke as the dependent variable. Outline an issue that might arise with the predicted values.  Do you think that the standard errors are valid?  Clearly explain why or why not.

c) The parameters of model (2) were estimated as a Probit model and the results are pre- sented in Figure 3

i) [2 marks] Let ˆpi  represent the predicted probability that an individual is a current smoker, based upon their observed characteristics.  Consider the following decision rule: if ˆpi  > 0.5 predict that s一mokei  = 1, otherwise s一mokei  = 0.

,s一moke(s一moke)

Based on the information in Table 1, calculate the percentage of outcomes that are correctly predicted?   Using Table  1, comment on the usefulness of the model in predicting smoke = 1 or smoke = 0.

true   predicted frequency    correctly

predicted

0

0

12,113

yes

1

0

4,024

no

0

1

54

no

1

1

67

yes

16,258

Table 1: Predicted Probability Threshold ˆpi  > 0.5

ii) [5 marks] Using the estimation results provided in Figure 3, calculate the marginal effect for the variable income for an individual who is currently 40 years of age, who has only completed high school, with an annual income of $38,000, employed at a workplace with a workplace smoking ban.  Provide a clear interpretation of your calculated marginal effect.

Note:  The probability density function for a standard normal random variable z is given by:

x(z) = exp

iii) [5 marks] Explain how you would calculate the average marginal effect (AME) for the variable workban (workplace smoking ban).  You have not been provided with enough information to actually calculate this marginal effect so do not attempt to calculate the marginal effect. Instead, your answer should clearly explain how you would calculate this marginal effect.

d)  Suppose you are considering estimating model (2) using the method of Ordinary Least Squares (OLS). However, it is suspected that the variable workban might be endogenous (that is, workban is potentially correlated with the random error).  The available data also contains the following variable:

sizei  =1 if the employer of indivdual i has at least 50 employees, 0 otherwise

Based on previous studies, there is some evidence that larger establishments are more likely to implement establishment wide smoking bans.

i) [2 marks] Provide an explanation as to why it might be suspected that the variable workban could be potentially correlated with the random error. Although there are several explanations here, you are only required to provide one of these.

ii) [3 marks] Clearly explain the two conditions that must be satisfied for the variable size to be a valid instrumental variable.  Do you think that these two conditions are likely to be satisfied? Why or why not?

Question 3 [20 marks]

Consider the following econometric model for the hourly wages for a group of workers:

ln wagesit  = 80 + 81 educi + 82 experit + 83 experit(2)

+ 84 weeksit + 85 disadvit + 86 unionit + 87 physicalit + εit where ln x denotes the natural logarithm of variable x and:

wageit  = hourly wage of individual i in year t

educi  = years of completed education of individual i

experit  = years of labour market experience of individual i in year t

weeksit  = weeks worked in the previous 12 months by individual i in year t          disadvit  = 1 if individual i resides in a disadvantaged region in year t, 0 otherwise

unionit  = 1 if individual i is a member of a union in year t, 0 otherwise

physicalit  = 1 if individual i works in an occupation requiring physical skills in year t, 0 otherwise

You have available a balanced panel data-set with observations on 528 workers who have worked continuously for 7 years, providing a total of 3,696 observations.

a) [1 mark] What is the interpretation of the population parameter 87 ?

b) [2 marks] Suppose you estimate the econometric model (3) by Ordinary Least Squares (OLS). Do you think that the standard errors are valid? Clearly explain why or why not.

c)  Consider the following alternative econometric model:

ln wagesit  = 80 + 81 educi + 82 experit + 83 experit(2)

(4)

VAR(oi |Xi ) = uυ(2)            COV(oi , oj ) = 0 for i j        COV(oi , εit ) = 0

and VAR(εit |Xit , oi ) = ue(2)

i) [4 marks] Consider the econometric model (4).  Do you think that the condition COV(xikt , oi ) = 0 for each xikt  is likely to be satisfied?  Clearly explain why or why not.  In the context of the present application, clearly explain and provide an example, whether you think COV(xikt , oi ) = 0 is a reasonable assumption.

ii) [3 marks] The estimation results for model (3) using the pooled OLS estimator (column 1) and the estimation results for model (4) using the Fixed Effects (FE) estimator (column 2) are presented in Figure 4.  Both models are estimated using a cluster-robust variance estimator. Compare and contrast the estimates for union and physical for the pooled OLS model (column 1) relative to those for model

(4) estimated using the Fixed Effects (FE) estimator (column 2).  Based on this comparison comment on the likely sign of any omitted variable bias in the pooled OLS model (3).

iii) [2 marks] Consider model (4).  Define =it  = (oi  + εit ).  For the Random Effects (RE) model, the intraclass correlation of the (composite) error is given by:

= corr(=it , =is ) =

for t s

Using the results in Figure 4 for the RE model (column 3), calculate the estimated value for this intraclass correlation 口ˆ.  Provide an interpretation for this estimated intraclass correlation 口ˆ.

iv) [4 marks] Clearly outline the important differences between the Random Effects (RE) estimator and the Fixed Effects (FE) estimator.  Your answer should clearly explain the variation in the data that is used to identify the parameters of interest.

d)  Consider the following Correlated Random Effects (CRE) model:

ln wagesit  = 80 + 81 educi + 82 experit + 83 experit(2)

+ 84 weeksit + 85 disadvit + 86 unionit + 87 physicalit

+ 88 experi + 89 exper2i + 810 weeksi

+ 811 disadvi + 812 unioni + 813 physicali + ni + εit                              (5)

where ni   represents an unobserved time-invariant random variable which satisfies the restriction COV(ni , Xit ) = 0 for each of the explanatory variables.

Note:

experi  = sample mean of exper for individual i over time

experi(2)  = sample mean of exper2  for individual i over time

weeksi  = sample mean of weeks for individual i over time

disadvi  = sample mean of disadv for individual i over time

unioni  = sample mean of union for individual i over time      physicali  = sample mean of physical for individual i over time

i) [1 mark] Briefly explain why the Correlated Random Effects (CRE) model (5) does not include a variable educi  representing the sample mean of completed education for individual i over time.

ii) [3 marks] The estimation results for the CRE model (5), using the cluster-robust variance estimator, are presented in Figure 5.  Using the results in either Figure 6 or Figure 7 test the hypothesis that the Random Effects (RE) estimator is the most appropriate model, at the 5% level of significance. Your answer should clearly state the null and alternative hypotheses, the distribution of the test statistic, and your decision.

Untitled

Linear hypothesis test

Hypothesis:

exper = 0

exper2 = 0

weeks = 0

disadv = 0

union = 0

physical = 0

Model 1: restricted model

Model 2: lnwage ~ educ + exper + exper2 + weeks + disadv + union + physical + meanexper + meanexper2 + meanweeks + meandisadv + meanunion + meanphysical

Note: Coefficient covariance matrix supplied.

Res.Df Df Chisq Pr(>Chisq)

1   3688

2 3682  6  2644 < 0.00000000000000022 ***

二二二

Signif . codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘ . ’0.1 ‘ ’ 1


Figure 6: H0  : 82  = 83  = 84  = 85  = 86  = 87  = 0 in CRE Model (5)


Untitled

Linear hypothesis test

Hypothesis:

meanexper = 0

meanexper2 = 0

meanweeks = 0

meandisadv = 0

meanunion = 0

meanphysical = 0

Model 1: restricted model

Model 2: lnwage ~ educ + exper + exper2 + weeks + disadv + union + physical + meanexper + meanexper2 + meanweeks + meandisadv + meanunion + meanphysical

Note: Coefficient covariance matrix supplied.

Res.Df Df Chisq Pr(>Chisq)

1   3688

2 3682  6  1706 < 0.00000000000000022 ***

二二二

Signif . codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘ . ’0.1 ‘ ’ 1


Figure 7: H0  : 88  = 89  = 810  = 811  = 812  = 813  = 0 in CRE Model (5)