Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Econ 497 B1 B2 - Winter 2022

Homework 3

Exercise 1

Suppose that each observation xi  is generated by the density

f (xi ; θ) = θ exp−9z,    xi  > 0, θ > 0

This is the pdf of what is called the exponential distribution. This distribution is useful for analyzing dependent variables which must be positive, such as waiting times or the duration of unemployment. It is straightforward to show that E[x] = 1/θ and var[x] = 1/θ2 .

a. Let x1 , . . . , xN  be an iid sample of x. Derive the maximum likelihood estimator of θ .

b. Derive the variance of the maximum likelihood estimator of θ .

 

Exercise 2

Consider the simple regression model

yi  = β1 + β2 xi + εi ,    εi   iid N(0, σ2 )

with pdf for observation i is given by:

f (yi |xi ; β, σ 2 ) = exp ┌    (yi  β1σ2(一) β2 xi )2 ┐

a.  Given the iid sample (y1 , x1 ), . . . , (yN , xN ), derive the maximum likelihood estimator of β0  and β1 .

b. Derive the variance of the maximum likelihood estimator of β0  and β1 .

c.  Show that maximizing the log L(β, σ2 |y, x) corresponds to minimizing SSR.


Exercise 3

Consider the one variable linear regression model

yi  = βxi + εi ,    i = 1, ..., N

a.  Show that the OLS estimator of β is

βˆ =

 

b.  Compute the expected value of βˆ. Is βˆ an unbiased estimator of β?

c.  Compute the probability limit (plim) of βˆ. Is βˆ a consistent estimator of β? Make any assumptions you find necessary.

d.  Suppose that the true relationship involves also z such that yi  = βxi + δzi + εi , where economic theory predicts β < 0, and δ < 0. Show that βˆ is a biased estimator of β and that the bias is equal to

Bias(βˆ) = δ

 

e. The following sample model has been estimated: yˆi  = 0.16xi . The sign of the coefficient on xi  is the opposite of what economic theory predicts. Can this be explained by the omission of zi ? What is the implied sign for the correlation between xi  and zi ? Explain

your answer.

 

Exercise 4 (R)

Suppose that each observation xi  is generated by the density

f (xi ; θ) = exxi(p−)9!θz  ,    xi  ≥ 0, θ > 0

This is the pdf of what is called the Poisson distribution.  This distribution is useful for modeling counts or events that occur randomly over a fixed period of time, such as bank failures, doctor visits, or goals scored in a game.

It is straightforward to show that E [x]  = var [x]  =  θ .   As a result,  θ is the parameter describing the rate, eg, the average number of goals scored in a game.  Once you know θ , you know everything there is to know about this distribution. x! stands for x factorial, i.e., x! = 1 × 2 × 3 × . . . × x.

For example, if θ = 1 the probability that in a randomly chosen game 2 goals were scored is f (xi  = 2; θ = 1) = exp− 1.12 /2! = 0.184 or

  芒右乞a #

prob  =  dpois(2 ,  lambda=1)

prob


##  [1]  0.18394

In addition, consider the following data on the number of goals scored in a game in the 2018 Football World Cup (a total of 64 games).

 

Goals per game Observed

0

1

1

15

2

17

3

19

4

5

5

2

6

2

7

3

8

0

 

Answer the following questions.

a. Let x1 , . . . , xN  be an iid sample of x. Derive the maximum likelihood estimator of θ .

b. Derive the variance of the maximum likelihood estimator of θ .

c. Using the data from the 2018 Football World Cup, compute θˆ? What is the variance of θˆ? You need to provide a numerical answers.

d.  Calculate the expected frequencies for the number of goals scored in a randomly chosen game. You need to provide a numerical answer.

e. Plot the observed and expected frequencies versus the number of goals scored.

 

Exercise 5 (R)

Use the data in apple.csv for this exercise. These are telephone survey data attempting to elicit the demand for a (fictional) ecologically friendly apple.  Each family was (randomly) presented with a set of prices for regular apples and the eco-labeled apples. They were asked

how many pounds of each kind of apple they would buy. Variable names and descriptions are

provided in apple.txt.

a.  Of the 660 families in the sample, how many report wanting none of the eco-labeled apples at the set price?

b. Does the variable ecolbs seem to have a continuous distribution over strictly positive values? What implications does your answer have for the suitability of a Tobit model for ecolbs?

c. Estimate a probit model for ecolbs with ecoprc, regprc, faminc, and hhsize as explana- tory variables. Which variables are significant at the 1% level?

d. Estimate a Tobit model for ecolbs with ecoprc, regprc, faminc, and hhsize as explana- tory variables. Which variables are significant at the 1% level?

e. Are faminc and hhsize jointly significant?

f. Are the signs of the coefficients on the price variables from part (d) what you expect? Explain.

g. Let β1  be the coefficient on ecoprc and let β2  be the coefficient on regprc.  Test the hypothesis H0  : 一β1  = β2  against the two-sided alternative. Report the p-value of the test.

h.  Obtain the estimates of E(ecolbs|x) for all observations in the sample. Call these e一colbsi . What are the smallest and largest fitted values?

i.  Compute the squared correlation between ecolbsi  and ecolbsi .

j.  Now, estimate a linear model for ecolbs using the same explanatory variables from part

(d). Why are the OLS estimates so much smaller than the Tobit estimates? In terms of goodness-of-fit, is the Tobit model better than the linear model?