Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON60622   Further Econometrics

2021/22

Semester 2 Mid-Term Exam

1. Consider the following regression model

y = xβ + u.                                                   (1)

Let βˆ denote the Ordinary Least Squares (OLS) estimator of β.  The so-called Gauss- Markov assumptions are:

❼  MLR.1: The true model in the population is given by (1).

❼  MLR.2:  We have a random sample of n observations {(xi,yi),i  =  1, 2,...,n}

following the population model in (1).

❼  MLR.3:  No one explanatory variable can be written as a linear combination of the

remaining explanatory variables that is, there is no perfectcollinearity.

❼  MLR.4: In the population, the error u has an expected value of zero given any values

of the explanatory variables, that is E[u|x] = 0.

❼  MLR.5: In the population, the error u has the same variance given any values of the

explanatory variables, that is Var[u|x] = σ2  , an unknown finite, positive constant. In the following scenarios, state whether βˆ is an unbiased and consistent estimator of β , and provide a brief justification for your answer in each case - but no formal mathematical derivations are required:

(a)  (4 points) Assumptions MLR.2, MLR.3, MLR.4 and MLR.5 hold but Assumption

MLR.1 does not.(Word limit: 50 words)

(b)  (7 points) Assumptions MLR.1, MLR.3, MLR.4 and MLR.5 hold but Assumption

MLR.2 does not. (Word limit: 100 words)

(c)  (4 points) Assumptions MLR.1, MLR.2, MLR.3 and MLR.5 hold but Assumption MLR.4 does not. (Word limit: 50 words)

2.  In 2015 the City of Berkeley (California) introduced a tax on sugar sweetened drinks. In order to establish whether the imposition of this tax actually resulted in increased prices for these drinks (as intended by the local government) the following data are available, where t = 0 indicates data from the year before the tax change and t = 1 indicates data from the year after the tax change.  i = 1,..., 72 indexes the 72 different products for which data are available. Of the 72 products 36 are taxed and 36 are not-taxed.

Pit, the price per deciliter (dl) of drink i at time t.  Tt  a dummy variable which equals 1 for the post policy period (t = 1) and 0 otherwise.  Taxi  is a dummy variable which equals 1 if the product i is taxed (as it is a sugary drink) and 0 otherwise.

(a)  (10 points)  Explain why the setup described above does fit a Difference-in-Difference

(DiD) framework. [max 200 words]

(b)  (10 points) What regression model would you need to estimate, in order to measure

the impact the tax policy had on the price of sugary drinks? Specify. Which param- eter in your model is the parameter which will help you to establish the effect of the policy? [max 100 words plus regression specification]

(c)  (15 points) Which crucial assumption is required in order to use the DiD method to evaluate the policy?  How would you go about arguing that this assumption is a sensible one in the case of the above sugar tax example?  Explain what data you would want to have to make such an argument. [max 200 words]

(d)  (10 points) Your resident data scientist gives you the following information. ❼ Average price (per dl) of a non-sugary drink pre-policy: UKP 0.6

❼ Average price (per dl) of a sugary drink pre-policy: UKP 0.7

❼ Average price (per dl) of a non-sugary drink post-policy: UKP 0.4 ❼ Average price (per dl) of a sugary drink post-policy: UKP 0.6

What is the DiD estimator for the effect of the policy on the price of sugary drinks? Given these average prices, what will be the sample estimates of the parameters in your regression model above? Explain your answer. [max 200 words]

(e)  (5 points) A colleague who sees the above data, says that you shouldn’t use non-

sugary drinks as the control group, as they were, before the policy, 50% more ex- pensive than the sugary drinks. Do you agree with your colleague? [max 100 words]

3. You are a health economist concerned about the impact of parental smoking on the birthweight of newborn babies.  You have observations for the birthweight of children (bwi), the baby’s gender (malei  = 1 if the baby is male, 0 otherwise) and the number of daily cigarettes smoked in the household during pregnancy (cigsi). In your preliminary research you identify the following additional, potentially important, covariates:  orderi indicates the child’s birth order (e.g. =2 if 2nd child) and yi  is the log family income of family i. The index i indexes the ith household in a random sample. The families in the random sample all live in the United States across different states.

You draft an initial model,

log(bwi) = α0 + α1malei + α2orderi + α3yi + α4cigsi + u                (3)

(a)  (15 points) An experienced colleague points you to the possibility of endogenous

regressors.  Discuss which regressors have the potential to being endogenous and why? [max 100 words]

(b)  (15 points) Another colleague suggests that the price of cigarettes varies across the

state of the US as different states implement different tobacco taxes. You therefore also obtain the variable cigpricei which captures the cigarette price as they apply to the ith family. Would you want to use this as an instrumental variable?  [max 150 words]

(c)  (20 points) You obtain the three regression outputs in Table 1. Evaluate the chosen strategy of using cigpricei  as an instrument in order to help establishing whether the amount of smoking in a household impacts on the birthweight of babies.  [max

200 words]

Table 1: Three regression models