Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

SUMMER TERM 2021

ECON0064:  Econometrics

All work must be submitted anonymously. Please ensure that you add your candidate number and the module code to the template answer sheet provided.  Note that the candidate number is a combination of four letters plus a number, e.g.  ABCD9.  You can find your candidate number in your PORTICO account, under My Studies then the Examinations container.  Please, note that the candidate number is NOT the same as your student number (8 digits), which is printed on your UCL ID card. Submitting with your student number will delay marking and when your results might be available.

Word count:  15 pages

The above word count is provided as guidance only on the expected total length of your submitted answer sheets. You will not be penalised if you exceed the word limit.

Answer ALL questions from Section A and TWO questions from Section B.

The total number of points is 100.  Section A contributes 60 points and Section B contributes 40 points.

In cases where a student answers more questions than requested by the examination rubric, the policy of the Economics Department is that the students first set of answers up to the required number will be the ones that count (not the best answers).   All remaining answers will be ignored.

Allow enough time to submit your work. Waiting until the deadline for submis- sion risks facing technical problems when submitting your work, due to limited network or systems capacity. You must submit your work within 8 hours of the moment you accessed the examination paper.

By submitting this assessment, you pledge your honour that you have not violated UCLs Assessment Regulations which are detailed in

https://www.ucl.ac.uk/academic- manual/chapters/chapter-6-student-casework- framework/section-9-student-academic-misconduct-procedure

which include (but are not limited to) plagiarism, self-plagiarism, unauthorised collab- oration between students, sharing my assessment with another student or third party, access another students assessment, falsification, contract cheating, and falsification of extenuating circumstances.

 

Section A

Answer ALL questions from this Section.

Question A1 (20 points)

Consider the linear regression model with a constant regressor and one additional regres- sor

yi  = β1 + wi β2 + ui .

Assume that all variables have finite second moments, and that the errors ui  have mean zero, are independent of wi , and have unknown variance σ 2  = ❊(ui(2)).  We observe a random sample (yi , wi ), i = 1, . . . , n, of n = 100 observations. For this observed sample we find

n

1

wi  = 3,

i=1

n

1

yi  = 1,

i=1

       wi(2)  = 10,

       yiwi  = 3,

       yi(2)  = 17.  (1)

(a)  Use the information in (1) to calculate the OLS estimates for β1  and β2 .

(b)  Use your result in (a) and the information in (1) to calculate 2  =       i(2) , where i  = yi 入 1 入 wi 2 .

In the following please use 2  as an estimator for σ 2 .

(c)  Use your result in (b) and the information in (1) to calculate estimators for the standard errors of 1  and 2 .

For the following subquestions assume that you calculated βˆ1  = 1.2, βˆ2  = 0.9, and

r() =  1   0 ,

so se(βˆ1 ) = 1.3, and se(βˆ2 ) = 0.5. Note that these are not the numbers that you should have actually obtained.

(d) Test the null hypothesis H0  : β2  = 0 vs.  Ha  : β2    0 using a two-sided t-test. Can you reject H0  at 90% confidence level?

(e)  Construct a 95% confidence interval for θ = β1 + 2β2 .

 

Question A2 (20 points)

Consider the model

yi     =   xi(*)β + ui ,

xi     =   xi(*) + εi ,

zi     =   xi(*)ρ + ηi ,

For simplicity assume that xi(*), ui , εi  and ηi  are independent scalar random variables with ❊[xi(*)] = ❊[ui] = ❊[εi] = ❊[ηi] = 0, Var [xi(*)] = Var [ui] = Var [εi] = Var [ηi] = 1. β and ρ are unknown parameters.

(a) Suppose that you have a random sample of size n from the distribution of (yi , xi(*)). Let βˆ*  denote the OLS estimator in the regression of yi on xi(*), i.e.,

*

i=1 xi     .

Find the asymptotic distribution of βˆ* .

(b) Suppose that you have a random sample of size n from the distribution of (yi , xi ) (so you observe xi  instead of xi(*)). Let βˆ denote the OLS estimator in the regression of yi on xi , i.e.,

βˆ =     1 xiy2i

(c) Suppose that you have a random sample of size n from the distribution of (yi , xi , zi ). Let βˆIV  denote the IV estimator for the regression of yi on xi  that uses zi  as in-

strument, i.e.,

βˆIV  =      ziyi

Find the probability limit of βˆIV  under the assumption that ρ  0. Is it consistent for β?

(d)  Find the asymptotic distribution of βˆIV  under the assumption that ρ  0. (e)  Discuss what happens to the asymptotic distribution of βˆIV  when ρ = 0.

 

Question A3 (20 points)

Suppose that you estimate a linear regression model using families from a (large) sample of villages

yij  = xij β + uij ,

where i = 1, . . . , n and j index villages and families within a village respectively.  For simplicity, assume that the sample consists of only two families per village, so j ì è1, 2;, and xij  and β are scalar. Also suppose that observations are independent and identically distributed across villages (so, (xi1, ui1, xi2, ui2) has the same distribution for all i, and (xi1, ui1, xi2, ui2) is independent of (xe1, ue1, xe2, ue2) provided that i   l.).   Finally, assume that within a village (ui1, ui2) is independent of (xi1, xi2), ❊[xi1] = ❊[xi2] = 0, ❊[ui1] = ❊[ui2] = 0, and

Var ┐  = κ(1)   1(κ),    Var ┐  = ρ(1)   1(ρ).

Let βˆ denote the OLS estimator in a regression of all the y’s on the x’s, i.e.,

βˆ =         j(2)2(=)1 xijy2ij  .

 

(a) Show that       xij(2)   ×p  A and       xij yij   ×p   B and provide

expressions for their non-stochastic limits A and B (as functions of the model’s parameters).

(b)  Use your result in (a) to find the probability limit of βˆ. Is it consistent for β?

(c) Show that 1í xij uij  体 |(0, V) and provide an expression for V .

(d)  Use your results in (a) and (c) to derive the asymptotic distribution of βˆ and provide an expression for its asymptotic variance Σ .

(e)  For simplicity, first assume that the value of ρ  0 is known.  Suggest an esti- mator β˜ more efficient than the OLS estimator βˆ and provide an expression for its asymptotic variance  (no derivation is required).  What would you do if ρ was unknown?  (Hint:  This is a harder question.  It might be useful to start with thinking about the conditional variances Var(βˆ|X) and Var(β˜|X), and the form of Var(u|X) = Var(u), which is a 2n – 2n matrix.)

 

Section B

Answer TWO questions from this Section.

Question B1 (20 points)

We observe an iid sample (yi , xi ), i = 1, . . . , n. We assume that the scalar outcome yi

is a binary variable taking values 0 and 1, and its conditional distribution is given by

P (yi  = 1|xi ; β) = xi β,    P (yi  = 0|xi ; β) = 1 入 xi β.

As usual, xi  ì RK  is a (row) vector of covariates, and β ì RK  is a (column) vector of the parameters of interest.  Additionally, we assume that xi  is bounded (so all relevant moments exist and are nite), xi β  ì (0, 1) with probability one, and all the relevant rank conditions are satisfied.

(a) Show that the studied model can be represented in the regression form

yi  = xi β + ui ,    [ui |xi] = 0,

and derive an expression for ❊[ui(2)|xi] = Var[ui |xi].

(b) What is the asymptotic distribution of the OLS estimator βˆOLS ? Use the result of Part (a) to simplify your expression for its asymptotic variance ΣOLS .

(c) Since the conditional distribution of yi  (given xi ) is fully parameterized, the studied model can also be estimated by maximum likelihood. Write down the log-likelihood for this model.

(d) What is the asymptotic distribution of the  MLE estimator βˆMLE ?   Provide an expression for its asymptotic variance ΣMLE . Would you prefer βˆMLE  or βˆOLS ?

(e)  Explain why the OLS estimator is not efficient in this context.  Provide an alter-

native least-squares type estimator, which overcomes this problem.   Provide an expression for its asymptotic variance and compare it with ΣMLE  (no derivation is required).

(f)  Consider an alternative estimator β˜ minimizing the following criterion function

β˜ = arg min  1   n     (yi   xi b)2  

b     n i=1  xi b(1  xi b) .

Is it a good idea to estimate β by β˜?  Explain.

 

Question B2 (20 points)

We observe an iid sample (yi , xi ), i = 1, . . . , n. Suppose

yi  = θ0(2) + θ0 xi + ui ,

where both xi  and θ0   > 0 are scalar.  Additionally, assume ❊[xi] = 0, ❊[xi(2)] = σx(2) , ❊[ui (1, xi , xi(2))] = (0, 0, 0), ❊[ui(2)(1, xi , xi(2))] = (σu(2) , 0, γσu(2)σx(2)).  Here (θ0 , σx , σu ) are un- known parameters but γ is a known number.  Also, assume that all relevant moments exist and are finite.

(a)  Find the asymptotic distribution of the Nonlinear Least Squares estimator

n

θ≥0  n

i=1

(b)  In a regression, we always need variation in covariates in order to identify and

estimate the associated coefficients. Is it also a concern in this model? Explain.

For the following subquestions, consider the moment condition ❊[g(yi , xi , θ)] = 0, where

g(yi , xi , θ) = (yi θ 2 θxi ) x(1)i .

(c)  Find the asymptotic distribution of the GMM estimator with the identity weighting matrix and provide an expression for its asymptotic variance.

(d)  Find the asymptotic distribution of the optimally weighted GMM estimator and provide an expression for its asymptotic variance.

(e) Suppose the dataset is very large, so naively computing Two-Step GMM or Con-

tinuously Updating GMM estimators could be computationally expensive. Can you suggest an estimator that is as efficient as the optimally weighted GMM estimator, but is easier to compute?  If you can find more than one such estimator, suggest the one that is computationally least expensive. Briefly explain why the estimator is as efficient as the optimally weighted GMM estimator.

 

Question B3 (20 points)

Suppose that yt  = xt β + ut , where ut  = ρut1 + εt , xt  = et + θet1 , where |ρ| < 1, εt and et are both iid with mean zero and variance σε(2) and σe(2), and εt and eτ  are independent for all t and τ .  Let βˆ denote the OLS estimator of β based on a sample of size T , and let t  denote the OLS residual.

(a)  Consider a process gt  = xtut  and let èγj ;  denote its autocovariances, i.e.,

γj  = Cov(gt , gtj ). Express γj  (for all integers j) in terms of the model’s param-

eters.

(b)  Use an appropriate CLT to argue that  1íT         gt   体 |(0, Ω) and provide an

expression for Ω .

(c)  Use your result in (b) to derive the asymptotic distribution of βˆ and provide an expression for its asymptotic variance Σ .

(d) Suppose that T  =  100,  βˆ  =  2.1,        xt(2)   =  5,   T 11        xt xt1   =  2.5,       t(2) = 4,   T 11        t t1   = 3.6.  Use your result in (c) to construct a 95% confidence interval for β .

(e)  Now suppose instead xt   = φxt1  + et , where  |φ| <  1.   Go over steps (a)-(c) again, to derive the asymptotic distribution of βˆ and provide an expression for its asymptotic variance Σ in this case.