Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAT120B Practice Final

1. True or false (You do NOT need to justify your answer)

a)   The significance level of a test is equal to the probability that the null hypothesis is true.

b)   The probability that the null hypothesis is falsely rejected is equal to the power of the test.

c)   A type I error occurs when the test statistic falls in the rejection region of the test.

d)   The power of test is determined by the distribution of the test statistic under the null hypothesis.

e)   Let X1, …, Xn be a random sample from an arbitrary distribution. The central limit theorem indicates that for large n, the histogram of the sample is roughly bell-curved.

 

2. Suppose that n light bulbs are burning simultaneously to determine the lengths oftheir lives. We shall assume that the n bulbs burn independently and that the lifetime of each bulb has the exponential

distribution with parameter β . Let Xi denote the lifetime (in thousand hours) of bulb i, for i=1,…,n. You may refer to results in the following table when solving this question:

 

a)   Show that the maximum likelihood estimator of β is  ˆ =  1  , where X = (X1 + ... + Xn ) / n.

1

b)   Is      a consistent estimator of β? Explain the meaning of an estimator being consistent. X

c)   What does the central limit theorem say about the distribution of                         when n is large? 1/ 

d)   For n=30 and X =0.8 (thousand hours), find an approximate 95% confidence interval of the

mean lifetime (1/β). Interpret the confidence interval you obtain in context of the situation. (Note: the 0.975-quantile of a standard normal distribution is 1.96. You don’t have to calculate out the     final number (in terms of thousand hours) if you don’t have a calculator.)

 

3. Solve DeGroot Ch 9.5 ex. 4. Use the fact that the 0.95-quantile for t(7) distribution is 1.895.


 


4. Consider two independent random samples where

iid

X1 ,..., Xn  ~ N(X ,2 )

.

iid

Y1 ,..., Ym  ~ N(Y ,2 )

Let X = (X1 +... + Xn) / nY = (Y1 +... +Ym) / mS 1(Xi  − X)2 /(n − 1), S = 1(Yi  − Y)2 /(m − 1).

a)   What is the sampling distribution of X − Y ? You may use the fact that a linear function of independent normal random variables also follows a normal distribution.

b)   Construct a chi-square distributed random variable involving mnS , S and  2 .  Specify the degrees of freedom. (You do NOT need to prove this)

c)   Using the results in a) and b) and another necessary result (you do NOT need to prove it; just state it), prove that under the null hypothesis of H0  : X  = Y

        n    m

 

5. Suppose that X1, …, Xn is a random sample from the uniform distribution between 0 and  . We are interested in the parameter θ . The PDF of a uniform distribution is the following:

 

iid

a)   Let Yi () = e −Xi . Show that Y1 (), ..., Yn () ~ Uniform(0,1) .

Let

T() =  − 0.5] ,

 

where Y () = [Y1() + ... + Yn ()] / n .

b)   Use the central limit theorem to find the approximate distribution of T () when n is large. Is T ()  a statistic? Justify your answer.

c)   Consider H0  :  = 0 v.sH1  :  0 . Assume that the sample size n is large. Describe briefly how you would use the result in b) to obtain a test with a level of significance that is                approximately α . Be sure to provide the test statistic and the formula for the rejection region.


 


6. Let X1, …, X5 be a random sample from N(0,1). For each of the following variables, find its distribution. Be sure to show your work.

(X1 + X2 X3   X4 )2

a)    Y =

4

b)    Y = 5X2 , where X =    1            2

 

(X1 + X2 )2 / 2     

c)    Y =

 

(X + X) / 2     

d)    Y =

 

1. Answer:

a)   False. b) False. c) False. d) False. c) False.

2. Answer:

a)

L( | X) = 1f (Xi  | ) = 1[eXi  ] = n exp[ −Xi ].

It is easier to maximize the log-likelihood, which is

l( | X) = nlog( ) − Xi .

Take derivative and set it to 0,

 

d             Xi  = 0 .

ˆ     1

 

The mean ofthe exponential distribution           and we know that the sample mean is a consistent

estimator ofthe mean 1/ β . By the continuous mapping theorem, 1/ X is a consistent estimator of β . Consistency means convergence in probability.

c)   From the distribution table, the mean and variance of Exp(β) are 1/ β and 1/ β2, respectively. The central limit theorem indicates the approximate distribution of

n (X − 1/ )       n (X − 1/ ) 

1/ 2                              1/ 

sufficiently large. 

30(X − 1/ )                        X − 1/      1.96                   X              1             X

 

1/                 .                               1/          30           1+1.96 / 30        1 − 1.96 / 30

So an approximate 95% confidence interval is [0.589,1.246]. So we are 95% confident that the   mean lifetime is between 589 and 1246 hours. (You don’t have to calculate out the final number if you don’t have a calculator.)

3. Answer:

See the corresponding answer key in DeGroot’s solution manual on Canvas (p. 294). A screenshot ofthe solution is below:


 

 

4. Answer:

 

a)    X − Y is a linear function of independent normal random variables so it follows a normal

distribution. The mean is E[X − Y ] = X  − Y   and the variance is

Var[X − Y ] = Var[X] +Var[Y ] =2 / n +2 / m =2 [1/ n +1/ m].

 

b)                                            follows the chi-squared distribution with (n+m-2) degrees of freedom.

 

c)   We are two independent normal samples and we also know that the sample mean and sample

variance from a normal distribution are independent. Therefore, X − Y and

(n − 1)S + (m − 1)S   are independent.

By a)  ~ N(0,1) , by b)  ~ +m−2  , and by the

independence between the two, we have

[X − Y ]/ 

                 

Ifwe simplify the left hand side, we can easily see that it is the same as

X − Y

1     1        n    m

So we can conclude that T follows the t distribution with (n+m-2) degrees of freedom.

5. Answer:

 

a)   The CDF ofXi is Pr[Xi   x] = e − 0 = e . The CDF of Yi is

 

e

X1, …, Xn is a random sample, they are Y1, …, Yn  iid, indicating that are iid Uniform(0,1).



 

b)   In a) we showed that Y1, …, Yn  iid Uniform(0,1), where the mean and variance ofthe distribution are 0.5 and 1/12, respectively.  By the central limit theorem,

1/12

Since T ()  is a function of the unknown parameter θ, it is not a statistic.

c)   We can use T(0) =  − 0.5] =  − 0.5] as a test statistic. Under the null            hypothesis, is approximately N(0,1). Since the alternative is two-sided, both small T(0) and large T(0) are against the null hypothesis. We should reject the null when T(0) is greater than Z1-α/2 or   less than Zα/2 . So the rejection region is

R = {X :|  − 0.5] | Z1− / 2} .

6. Answer:

 

a)                                       is a linear function of independent normal random variables, si it follows a 2

normal distribution. In addition, it follows the standard normal distribution, as

E[X1 + X2   X3   X4 ] = 0 and = Var[X1 + X2   X3   X4 ] = 1+1+1+1 = 1. Since

 

Y =                                       =                                       , it follows the chi-squared distribution

with one degree of freedom.

b)    5X is a linear function of independent normal random variables, so it follows a normal

distribution. Since

E[5X] = 5(0 + ... + 0) / 5 = 0, Var[5X] = 5(1+ ... +1) / 25 = 1, 5X ~ N(0,1).  But        Y = 5X2  = (5X)2 , indicating that Y follows the chi-squared distribution with one-degree of freedom.

c)    Y =                                  =                                 . I claim that it follows the F distribution with

the numerator d.f. =1 and the denominator d.f.=3. This is because

i.      The numerator follows the chi-squared distribution with one degree of freedom:

(X1 + X2 ) /  follows a normal distribution as it is a linear function of independent normal random variables. Easy to show that its mean and variance are 0 and 1,             respectively. As a result, the numerator follows the chi-squared distribution with one   degree of freedom.

ii.      The denominator equals a chi-squared (with 3 d.f.) distributed random variable then        divided by 3. Since X3, X4, and X5 are iid N(0,1), the sum ofthe squared follows the chi- squared with 3 d.f.

iii.      The numerator and the denominator are independent. This is because the numerator is a function of X1 and X2, and the denominator is a function of X3, X4, and X5 . Since all the Xi’s are independent, the numerator and the denominator are independent.

By the definition of F-distribution, Y follows the F distribution with the numerator d.f. =1 and the denominator d.f.=3

d)   Similar to c) ii, the numerator equals a chi-square (2 d.f.) distributed random variable divided by

2 and the denominator equals a chi-square (3.d.f) distributed random variable divided by 3.       Similar to c) iii, the numerator and denominator are independent. By the definition of F-            distribution, Y follows the F distribution with the numerator d.f. =2 and the denominator d.f.=3