Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECO 321 Summer 2022

Midterm

Questions:

1.  Consider the linear regression model for a random sample of size N :

yi  = β1 xi + vi                      i = 1, . . . , N,                             (1)

where v is a random error term.  Notice that this model is equivalent to the one seen in the classroom, but without the intercept β0 .

(a)  Construct the rst order condition to derive the estimator of equation (1) and obtain the expression of the ordinary least squares estimator of β1 . Call this estimator β˜1 .

(b)  Suppose now that the true population model is given by: Y = β0 + β1X + u,

where u is  an error term which satisfies  E(u)  =  0,  E(Xu)  =  0  and Var(u) = σ 2  (homoskedasticity). This implies that, in our sample,

yi  = β0 + β1 xi + ui                      i = 1, . . . , N.                     (2)

Show that, in general, β˜1 which is the estimator of equation (1) is a biased estimator of β1 , the parameter of true population model. When is the bias equal to 0?

(c) Find the variance of β˜1 .  Is 1  a consistent estimator of µY ? [Prove it is, or prove it is not].


2. What is the average salary offered to a Stony Brook college graduate? To study this question you and a friend interview N students that graduated last year, and ask them what they earn.  Student i’s response was recorded as Yi . You are interested in the average, µY . You assumed that the sample of Y s is iid. First you calculate the following estimate of µY :

N

1  = Yi .

i=1

You collected of the data and your friend collected of the data. Thus, you collected Y1 , . . . , Y and your friend collected Y+1 , . . . , YN . Unfortunately, it turns out that your friend collected the data at a wild alumnae party, and you suspect that these data may not be as precise as your data.  So whereas the variance of your data is,

var(Yi ) = σ 2 ,

i = 1, . . . , 2N

then your friends data have the variance,

var(Yi ) = σ2 (1 + 3c),        i = + 1, . . . , N,

for some constant c ≥ 0.

(a) Is 1  an unbiased estimator of µY ? [Prove it is, or prove it is not].

(b) What is the variance of 1 ?

(c) Is 1  a consistent estimator of µY ? [Prove it is, or prove it is not].

(d) Your friend is sorry that of the data are not as precise as they could have been, and suggest that you discard the noise data, and simply use 2   = Yi  as your estimator for µY . Which estimator is most efficient (has the smallest variance) 1  or 2 ?  Does your answer depend

on c?

(e)  Suppose now that c = 0 such that var(Yi ) = σ 2  for i = 1, . . . , N .  You

have N  =  100 observation and calculate s2   = >i - 12   =

50, 000, 000 and 1   = $45, 300.   Before collecting the data, your friend argues mean salary, µY , is $46, ZZZ, using a 5% significance level.  主n 』nsuer;ng t在e quest;on文 repl』母e ZZZ  u;t在 t在e l』st t在ree d;g;ts oj your student & numìer一  (If my id number is 123456789, I would have to suppose mean salary, µY , as $46, 789, and solve the problem based on that.) Write down the confidence interval at 5% significance level and decide whether you will accept your friend’s argument.


3.  Suppose a new standardized test is given to 100 randomly selected third-grade students in New Jersey. The sample average score, , on the test is 58 points, and the sample standard deviation, sY , is 8 points..

(a)  Construct a 95% confidence interval for the mean score of all New Jersey third graders,

(b)  Suppose the same test is given to 200 randomly selected third graders in Iowa, producing a sample average of 62 points and a sample standard deviation of 11 points. Derive the formula for the sample variance of the difference in the sample means between New Jersey and Iowa.

(c)  Construct a 90% confidence interval for the difference in mean scores between Iowa and New Jersey.   Can you conclude that the population means for Iowa and New Jersey students are different?

(d) You has two independent samples of observations on (yi , xi ).  To be spe- cific, for each individual i, suppose that yi  denotes test score, xi  denotes hours of self-study, and the independent samples are for New Jersey and Iowa. Write the regression for New Jersey as,

yj,i  = βj,0 + βj,1xj,i + uj,i

and the regression for Iowa as

yw,i  = βw,0 + βw,1xw,i + uw,i .

Let βˆj,1  denote the OLS estimator constructed using the sample of New Jersey, and βˆw,1  denote the OLS estimator constructed from the sample of Iowa, and SE(βˆj,1) and SE(βˆw,1) denote the corresponding standard errors. Show that the standard error of βˆj,1 - βˆw,1  is given by

SE(βˆj,1 - βˆw,1) = SE(βˆj,1)2 + SE(βˆw,1)2 .

You need to explain or prove step by step.


We compute the p-value from the table below using the computed statistic, say 1.96, and the coordinate in the table below from the 1.9 row and the 0.06000 column. This value is 0.9750. The p-value is then equal to twice one minus this value: 2x(1 - 0.9750)=2x0.0250=0.05.  Note that you have to multiply by two and the corre- sponding row and column stem from the t-statistic (1.9 row and 0.06 column)! Any t-statistic larger than 3 leads to a p-value which is less than 0.0027.

Table: Area under the Normal Curve from 0 to X= ~  normal pdf.