Econ 322: Applied Econometrics


Assignment 2: Probability and Statistics II, Hypothesis Testing

Goals for the assignment:

● Additional practice with properties of expectation

● Apply the concepts of bias and variance to a new estimator that you have not worked with before. These are crucial concepts that will appear throughout the class.

● Learn how to conduct, and convincingly explain and interpret, a hypothesis test.

1. Show mathematically that the following statement is true, based on the properties of expec- tation. The random variable x has mean µ and standard deviation σ. Justify each step of your derivation. Hint: start with the formula stated first, and then expand it and apply properties of expectation until you reach the second formula.

(a) One formula for covariance is cov(x, y) = E ((x − µx)(y − µy)) . Show that this formula is equivalent to cov(x, y) = E(xy) − E(x)E(y).

2. Let x1, x2, ..., xn be n independent identically distributed (iid) random variables drawn from a population with mean µ and variance σ2 . Let represent the sample mean. An alternative estimator of the population mean is W  = γx1 + E2 (1 − γ)xi.  Assume that γ is a constant, and that 0 < γ < 1. (Hint: If the summation notation is confusing you, work out a simpler version of the problem first. For example, assume n = 3, and write out all of the terms in W. Then, move on to the case where the sample size is n for the questions below.)

(a) Show that is an unbiased estimator of the population mean.

(b) Find the variance of .

(c) Show whether or not W an unbiased estimator of the population mean. (d) Find the variance of W.

(e) Do you prefer to use W or as an estimator of µ? Why? Justify your answer.

3.  Consider the random variable

where is the sample mean of a random sample of n i.i.d observations from the distribution of x, and µ and σ are the mean and standard deviation of x.

(a) Find the variance of t.

(b) Find the expected value of t.

(c) Recall that the central limit theorem tells you that for large n, t is approximately dis- tributed N(0, 1). Are your answers to (a) and (b) consistent with the CLT? Hint: if not, you should re-do (a) and (b).

(d) Supposing that the central limit theorem holds, so t N(0, 1), what is the distribution of ? Hint: think carefully about the relationship between t and .

4. You are working at a government agency, and are assigned to study whether or not a pilot job training program increases the earnings of people who complete the training.  Based on your analysis, you must decide whether or not to implement the plan nationally.  For a random, independent sample of 1, 000 people who complete the training program, you obtain data on their change in earnings after the program (earnings after the program minus earnings before the program). The sample mean of the change in earnings is $430, and the sample standard deviation is $324. Do an appropriate statistical test at the 5% significance level, so that you can provide advice about whether or not it is a good idea to expand this program across the country.

(a) Formally state the null and alternative hypothesis for your test. Be sure to state whether or not you are performing a one or two tailed test.

(b) Test the null hypothesis that the training program has no effect on earnings.  Clearly show the following: what the test statistic is (the formula as well as the specific calcu- lation), the distribution of the test statistic under the null hypothesis, the justification for the distribution of the test statistic, what the cutoff value (or cutoff values) are, and why you reject (or not reject) the null hypothesis.

(c) Based on the results of your test, what is your opinion of the program?  Should you recommend that the pilot program be expanded across the country? Explain carefully, demonstrating knowledge of what a hypothesis test is.

(d) Your boss, who has never taken econometrics, does not understand the need for your statistical test.  He makes the following argument:  “based on our data, the program increases earnings by an average of $430. Based on this fact alone, clearly the program is beneficial, and there is no need for your statistical test.” Carefully evaluate this state- ment.

(e) Suppose that the sample standard deviation was $10,000, instead of $324. How would

this change your result from (d) and your answer from (c)?  Be specific - conduct a new hypothesis test. Explain intuitively, in words (not just using an equation), why the much larger standard deviation changes your conclusion about the program (if it does). (f) Suppose that the training program costs $300 per worker. Using this information, con- duct a statistical analysis that can be used to evaluate the effectiveness of the program.

5. Explain carefully, in words, why the Central Limit Theorem is useful for applied researchers in economics.

6. True or False, and explain: If a correctly conducted hypothesis test rejects a null hypothesis, then we know for certain that this null hypothesis cannot actually be true.