Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Problem Set 1, Econ 120C

Please follow the guidance below to submit all assignments:

(i) Please submit your answers, which can be either typed or handwritten on canvas.ucsd.edu.

(ii) Handwritten answers have to be scanned and saved in pdf (You can use your phone to take a picture and convert the picture into pdf)

(iii) Please submit only one pdf Öle for each assignment.  If you have multiple Öles, please combine them into one before submission.

(iv) For the questions that need Stata, please include your log and Ögures, if any. Please do not upload your log and Ögure Öles directly. Instead, convert them into pdf and include them in the pdf Öle you plan to submit.

(v) Again, please submit only one pdf Öle for each assignment.  Please do not use any other

Öle format. Please do not submit more than one Öle.

Question A. Multiple Choice

1. Let Y1; :::; Yn be iid with mean μY : Consistency for the sample average  can be deÖned as follows, with the exception of

(a)   is consistent for μY .

(b)   has the smallest variance of all estimators.

(c)   二(p) μY :

(d) the probability of  being in the range μY ± c becomes arbitrarily close to one as n increases for any constant c > 0.

2.  The OLS estimator is a random variable and

(a) is a single number and as a result cannot have a distribution.

(b) has a probability distribution called its sampling distribution.

(c) has a probability distribution called the standard normal distribution.

(d) has a probability distribution called normal distribution.

3.  To infer the political tendencies of the students at your college/university, you sample 150 of them. Only one of the following is a simple random sample: You

(a) make sure that the proportion of minorities are the same in your sample as in the entire student body.

(b) call every Öftieth person in the student directory at 9 a.m.  If the person does not answer the phone, you pick the next name listed, and so on.

(c) go to the main dining hall on campus and interview students randomly there.

(d) have your statistical package generate 150 random numbers in the range from 1 to the total number of students in your academic institution, and then choose the corre- sponding names in the student telephone directory.

4. Let Y1; :::; Yn  be iid with mean μY  and variance σY(2): The central limit theorem states that

(a) the distribution for  becomes arbitrarily well approximated by the standard normal

distribution.

(b)   二(p) μY .

(c) the probability that  is in the range μY  ± c becomes arbitrarily close to one as n increases for any constant c > 0.

(d)  ^n (a(Y-)Y(一)uY ) is approximately normal when n is large.

5.  The reason why estimators have a sampling distribution is that

(a) economics is not a precise science.

(b) individuals respond di§erently to incentives.

(c) in real life you typically get to sample many times.

(d) the values of the explanatory variable and the error term di§er across samples

Question B:   This yearís graduating class at Uniform University contains exactly 900 seniors. Each senior has a random number of parents (0, 1, or 2) who will attend the graduation cere- mony, and it happens that each of those three possibilities is equally likely, with probability 1/3 each, and the numbers of parents attending the ceremony for di§erent seniors are independent random variables.  The seating area for parents in the auditorium has 900 seats.  Use a Normal approximation to approximate the probability that all of the parents who attend will be able to be seated.   What if the seating area has 925 seats? What is the minimum number of seats that can ensure that with probability 0.95 all of the parents who attend will be able to be seated?

Question C:   Let Y = 1 + 2X + u where X = Z1 + Z2 , u = Z1 _ Z2; Z1 and Z2 are independent standard normals. We have iid observations (Xi; Yi) from this model.

(a) Suppose we run the following regression

Yi = α + Xiβ + error1i

to obtain the OLS estimator OLS : What would you expect the value of OLS    to be when n  o? Please give a numerical answer.

(b) Suppose we run the following regression

Xi = δ + Yi + error2i

to obtain the OLS estimator OLS : What would you expect the value of OLS   to be when n  o? Please give a numerical answer.

Part D:   Let X1  and X2  be iid random variables with

(  2;   with probability of 1/2

Xi  = 4 4;    with probability of 1/4

(  6;    with probability of 1/4

for i = 1 and 2:

1. What is the mean of Xi? What is the standard deviation of Xi?

2. What is the mean of 2 = (X1 + X2) /2? What is its standard deviation?

3. What is the distribution of 2 ? Graph the distributions of X1 and 2 : Is the distribution of 2  close to be normal?  (hint: 2  can be regarded as the mean of a simple random sample with replacement from the population of four persons with their X ís equal to 2; 2; 4; and 6, respectively)

Question E   Read the following Stata program

clear

cap  postclose  tempid

postfile  tempid  beta  reject1  reject2  ///

using mydata .dta,replace

forvalues  i  =  1(1)1000  {

drop  _all

quietly  set  obs  1000

gen  x  =  rnormal()

gen  e  =  rnormal()

gen  u  =  x  +  e

gen  y  =  3*x  +  u

quietly  reg  y  x,  r

scalar  beta  =  _b[x]

qui  test  x  =  3

sca  reject1=  (r(p)  <  0 .10)

qui  test  x  =  4

sca  reject2  =  (r(p)  <  0 .10)

post  tempid  (beta)  (reject1)  (reject2)

}

postclose  tempid

use mydata .dta,  clear

sum

Part of the output is given in the table below:

Variable

Mean

Std. Dev.

beta

μ

#

reject1

1

1

reject2

2

2

Answer the following questions with detailed arguments.

(a) What would you expect the value of μ to be?

(b) What would you expect the value of r1  to be?

(c) What would you expect the value of r2  to be?

(d) What would you expect the value of σ 1  to be?

(e) What would you expect the value of σ 2  to be?

Question F   Consider the linear regression model

Yi = α + Xiβ + Wi + ui

Given the sample (Xi; Wi; Yi) ; we run the following regressions

(i) Regress Y on X and an constant/intercept. Denote the OLS estimator of the slope on X as short :

(ii) Regress W on X and an constant/intercept.  Denote the OLS estimator of the slope on X as :

(iii) Regress Y on X and W and an constant/intercept. Denote the OLS estimators of α; β; 礻 by long ; long  and long  and deÖne

i = Yi _ (long + Xilong + Wilong):

By construction, we know that E^ () = 0; c一ov (X;) = 0 and c一ov (W;) = 0:

(a). Write down the formulae for short  and :

(b). Show that

short = long + long :

Hint: Plug the deÖnition Yi = long + Xilong + Wilong + i  into the formula for short  and then use the operating rules for sample covariances to simplify.

Question G   In a 1994 research paper, two economists examined the impact of looks on earn- ings using interviewersíratings of respondentsíphysical appearance.  They used data in which respondents reported their wages, and the interviewers rated the respondentís appearance, using Öve categories:  (1.  homely, 2.  quite plain, 3.  average, 4.  good looking and 5.  strikingly hand- some or beautiful). Download the Öle beauty.xls from the course web page. The Öle contains the following variables: hourly earning, looks, female (is equal to 1 if female, 0 otherwise) and years of education. Assume that a population consists of all individuals in the data set.

(a) Estimate the following regression

ernhr = α + β x looks + x yrseduc + u                                     (1)

using the  population  data  (i.e.,  use  all  data).  What is the value of (the estimated) β? Denote this value as β 0 :

(b) (i) Draw a simple random sample of size 100.

(ii) Estimate (1) using the sample you obtained.

(iii) Test the null hypothesis H0  : β = β 0  against H1  : β  β 0  using α = 10% as the size of the test. Let reject be a dummy variable indicating whether H0  is rejected (reject=1 if H0  is rejected).

(iv) Save OLS , its robust standard error, and the dummy variable reject to a Stata data set, say mydata .dta.  The data set contains three variables, say beta_hat,  se_hat,  reject (You can use your own favorite names for the data set and the variables).

(c) Repeat (b) 1000 times.

(d) Now load the Stata data set mydata .dta  into Stata and graph the histogram of beta_hat .

Is it close to be normal?

(e) Summarize all variables. Is the mean of reject  close to be 10%? Is your answer expected? Can you explain why or why not?

(f) Is the standard deviation of beta_hat close to the mean of  se_hat?   Is your answer expected? Can you explain why or why not?

Note:  A sample Stata program is posted on the course home page.  You are encouraged to write your own program.  The sample program focuses on  instead of β and so you have to modify it to accommodate this and other di§erences.

This question is designed to help you understand the sampling distribution of the OLS esti- mator. It is also a very good practice for Stata programming.