Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON120A: Problem Set 4

Exercise  1.  [5 points] Warming Up

Consider the following statement:  Suppose we obtain the sample X1 , X2 , . . . Xn , compute the sample mean  and obtain the 95% confidence interval for the mean.  Then, conditional on the particular sample drawn, the probability that the population is mean is NOT in the confidence interval constructed is 5%.

a) Do you agree with the statement above? (Hint: What is the random object in the event the population mean is not contained in the confidence interval”?)

Exercise  2.  [10 points] Confidence interval

You obtain data on the increase of home prices in a neighborhood that recently enjoyed the construction of new infrastructure. The sample has n = 107 observations. In the sample  = 11, 974.45$. The estimated standard deviation is given by σY  = 9, 765$.

a) Compute the 90%, 95% and 99% confidence interval for the population average increase in home prices.

Exercise  3.  [10 points] Three way of testing H

Suppose we draw a sample of n = 110. You compute the following quantities 2  = 246.49,   = 35.8.

a) Test the null hypothesis H′  : µ = 30 against H1  : µ  30 at the 95% level. Use the t-statistic approach.

b) Repeat the test by computing the p-value of the test.

c) Construct the 95% confidence interval for the population mean. Use it to test H′  against H1 .

Exercise  4.  [15 points] Population mean, two samples

Suppose we are trying to study whether there exist statistical discrimination based on gender in a com- pany’s employee salary policy. In the sample the average monthly employee salary for workers who identify as men is given by M  = 3764.07 while for workers who do not identify as men is given by NM  = 3287.23. Respectively nM  = 430, nNM  = 239 are the sample sizes. As measures of dispersion we obtain the following standard deviations: σM  = 208.34,  σNM  = 139.23.

a) Construct the 90%, 95% and 99% confidence interval for difference between population means.

b) Is there evidence of salary discrimination? Test the null hypthesis of no salary discrimination, choosing one the alpha levels you computed above.

Exercise  5.  [15 points] Test for porportion

Suppose that a researcher estimates the proportion of emergency calls that are classified as minor injuries using an i.i.d. sample of 987 people in Pennsylvania. They nd that the proportion of minor injuries in the sample is given by pˆ = 44.3%.

a)The local governor claims that among all emergency calls in Pennsylvania about 50% are related to minor injuries. Translate the governor’s claim into a statistical hypothesis for the value of p, the population

proportion of emergency call that are due to minor injuries, expressing it as H′  and Ha .

b) Test the null hypothesis you set in a) at the 90% confidemnce level.

c)  Compute the p-value for your test.   Would your answer change if you instead used 95% or 99% confidence? Explain why.

Exercise  6.  [20 points] Probability of Type 1 Error with Confidence Intervals

Suppose you obtain m = 200 distinct i.i.d samples drawn from a population of workers, each of which contains n  =  100 observations.   So the sample size is n  =  100.   The variable Di  in each sample repre- sents whether person i has been laid off in the past 3 months.  We know E[Di] = 0.3.  For each sample j = 1, 2, . . . 200, we construct the sample proportion pˆj  estimator.

a) Approximately, how many of the samples will feature a pˆ that is larger than 0.6?  Hint:  this is a state- ment about the distribution of pˆ. Use the central limit theorem to compute the approximate distribution of  .

b) Suppose now, in each sample, you construct the confidence interval CIj  for the popualtion proportion

p by taking:

CIj  =  pˆj  = 1.96 .  ; pˆj  + 1.96 .

Now for each sample j, you construct the random variable Rj  = 1 if the true population proportion p = 0.3 is NOT INCLUDED in CIj  and Rj  = 0 if p = 0.3 IS INCLUDED in CIj . What is E[R]?

c) If we compute the average across all the 200 samples, that is  :=      j(2)21(′′) Rj  do you expect its value to be close to the number in b)? If so why? Hint: use the Weak Law of Large Numbers.

Exercise  7.  [25 points] Power

Suppose we want to estimate the average income for the subgroup of workers who participated in a training program. Xi  is the income of worker i. We estimate the population mean µ using the usual sample mean estimator using a sample size of n = 100.  We set the test for H′  : µ k 0 choosing α = 0.05.  The alternative hypothesis is H1  : µ = µa  for some µa  > 0. The estimated sample standard deviation is given by  = 13.4.

a) Compute the power of the test at the alternative µa  = 3.

b) Compute the power of the test at the alternative µa  = 5 and compare it with your solution in a). Explain why it makes sense.

c) Compute the power of the test at µa  = 0. Does it make sense? Explain your ndings.

d) Compute the minimal detectable effect at power 0 .80, that is the smallest µa  for which you are able to reject H′  with power equal 0.80. Hint, in the power calculation you have to solve for the unknown µa .