Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Term 2, 2019

MATH2801

THEORY OF STATISTICS

Use a separate book clearly marked Question 1

1.   [15  marks] Suppose we want to estimate p, the proportion of Australians preferring the Coalition Party on a two-party preferred basis.  To do so, we randomly sample n registered voters from the Australian population.

For i  =  1, . . . , n,  let Xi   =  1 if a registered voter chooses to vote for the Coalition Party for the ith person and Xi  = 0 otherwise.

The random variables Xi  are i.i.d.   Bernoulli(p) random variables for some 0 < p < 1 and for i = 1, . . . , n the probability function is given by

Pr(Xi  = x) = fXi(x) = ,1(p) p

or equivalently by

Pr(Xi  = x) = fXi(x) = px (1 p)1 x

for x = 1

for x = 0

for x = 0, 1.

Suppose we collect a random sample of n voters, resulting in observations x1 , x2 , . . . , xn . The sample proportion of the population voting for the Coali- tion Party can be computed by

pˆ =  = x.

i)   [1 mark] How is a census different from a sample?

ii)   [2 marks]  Determine the method of moments estimator of p.  Show that it is given by the sample proportion pˆ.

iii)   [3 marks]  Determine the maximum likelihood estimator of p. Show that it is given by the sample proportion pˆ.

iv)   [3 marks]  Determine the Fisher information for p.

v)   [2 marks]  Write down the large sample approximation to the distribu- tion of pˆ.

vi)   [4 marks]  Assume that n = 678 registered voters were sampled from the Australian population, and of these, 353 voters preferred the Coalition Party on a two-party preferred basis.

a)  Provide an estimate (to three decimal places) for p.

b)  Compute an (approximate) 95% confidence interval for p. You may use the fact that qnorm(0 .975)  =  1 .96.

Use a separate book clearly marked Question 2

2.   [15 marks]

i)   [3 marks]  A random variable X has density fX (x) = 2x for 0 < x < 1. Let Y = X3  and nd fY (y).

ii)   [12 marks]   For some λ > 0, let X  ~ Poisson(λ), so the probability function is given by

λx e λ

fX (x) = Pr(X = x) =     x!    ,    x = 0, 1, 2, . . .

a)  Show that      fX (x) = 1.

b)  For this part of the question, assume that the earth has experienced a long-term average of 16.25 major earthquakes per year.                 The Poisson random variable can be used to model the number of major earthquakes in a xed period of time.

.  Suggest a suitable value of λ that could be used to model the

number of major earthquakes in a random month (a month is  of a year).

.  Using your suggested λ, calculate (to three decimal places) the

probability that no earthquakes occur in a random month.

 There were three major earthquakes in just the rst month of

2018. Using your suggested λ, calculate (to three decimal places) a probability that measures how unusual it is to have three or more earthquakes in a random month.  In plain language, com- ment on whether you think this probability is unusual.

c)  Show that the moment generating function of X is: mX (u) = eλ(eu1) .

d)  Let X1 , X2 , X3 , . . . , Xk  be independent Poisson(λ) random variables. Set W = X1 +X2 +X3 +   +Xk . Using the moment generating func- tion of X (or otherwise) determine the moment generating function for W .

Use a separate book clearly marked Question 3

3.   [15 marks]

i)  [9 marks]   Let X and Y be random variables with the following joint density function

fX,Y (x, y) = (x+y)/10,    x > 0, y > 0.

a)  Determine the marginal density fY (y).

b)  Determine the conditional density function fY |X(y ) x).

c)  Are X and Y independent? (Give reasons).

d)  Calculate the expected value E ╱X + Y.

ii)  [6 marks]  Consider Yn  which has density function given by:

fYn(y) = (n + 1)(1 ← y)n ,    0 < y < 1.

a)  Find FYn (y).

b)  Show that

E(Yn ) =    1   

c)  For 0 < i < 1, show that

n/o


Use a separate book clearly marked Question 4

4.   [15 marks] A very costly experiment was conducted to evaluate a process for producing synthetic diamonds. The average weight of the diamonds produced by this process must be greater than 0.55 carats in order for the process to be considered successful.

Assume that the weights of diamonds produced by this process approximately follow a normal distribution.

In this experiment, 7 diamonds were made by the new procedure with recorded weights of 0.51, 0.71, 0.77, 0.64, 0.59, 0.57, 0.64 carats. The sample mean is  = 0.633 and the sample standard deviation is s = 0.087.

i)   [10 marks]  From this dataset, is there evidence that the average weight

of diamonds produced by this process is greater than 0.55 carats?          Carry out a hypothesis test to answer this question.   Include in your answer:

a)  Define the parameter(s) which are being tested.

b)  A statement of the null and alternative hypotheses.

c)  The formula for the test statistic and its distribution if H0  is true.

d)  The observed value of the test statistic (to three decimal places).

e)  An estimated P-value (to three decimal places).  Use the probabili- ties on the next page to answer this question.

f)  A relevant conclusion concerning the production of diamonds by this process.

ii)   [2  marks]   Apart from the normality assumption on the data, what other assumption or assumptions were required to carry out the hypoth- esis test?

iii)   [3 marks]   Making the same assumptions as were required for the hy- pothesis test, construct a 99% confidence interval for the true mean weight of the diamonds produced by this process. Use the quantiles on the next page to answer this question.