Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAC58H3:Statistical Inference

Assign 1


Note 1: You should submit your completed assignment through quercus.


Note 2:  In any question, if you are using R, all your R codes and outputs must be included in your answers.  You should assume that the reader is not familiar with R outputs and so explain all your findings, quoting necessary values from your outputs.

Note 3:  Please note that academic integrity is fundamental to learning and scholar- ship.  You may discuss questions with other students.  However, the work you submit should be your own.  If I feel suspicious of any assignment (e.g.  if your work doesn’t appear to be consistent with what we have discussed in class), I will not mark the assignment. Instead, I will ask you to present your work in in a Zoom session and your grade will be assigned based on your presentation.

Note 4:  In any question, you may use R unless otherwise I have added a note ask- ing not to use R. However, whenever you use R, you must provide the relevant R codes and the outputs and your comments. You mau use the R codes that we have discussed in class, if they help, but please also make sure that your R codes have sucient com- ments so that the reader can easily understand what you are doing.  If any of them is not provided,your answer, even though correct will be given ZERO credit.  Please make sure that sure that comments address all important findings. I consider answers with inadequate comments as poor answers and deduct points.

Note 5: All questions are in standard notation that we introduced in lectures.


Total points for this assignment: 70


1.  Suppose that Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} and the measurements X : Ω R and Y : Ω 二 R are defined by

X(1) = X(2) = X(3) = 1,

X(4) = X(5) = X(6) = X(7) = X(8) = 2,

X(9) = X(10) = X(11) = X(12) = 3 and

Y (1) = Y (2) = Y (3) = Y (4) = Y (5) = Y (6) = 1,

Y (7) = Y (8) = Y (9) = Y (10) = Y (11) = Y (12) = 2.

(a)  (3 points) Determine fX .

(b)  (2 points)  Calculate FX (2.5).

(c)  (2 points)  Calculate limx2 FX (x).

(d)  (3 points) Use the relative frequency distribution function fX  you calculated in part (a) above to calculate the value of     xex xfX (x).

(e)  (3 points)  Calculate     ωeΩ X(ω) and . Comment comparing this value

to your answer in part (d) above.

(f)  (3 points) Determine σX(2) .

(g)  (5 points) Are X and Y related? Prove your answer.

(h)  (4 points)  Calculate E(XlY = 1).

(i)  (4 points)  Calculate Var(XlY = 1).

2. A population Π and a measure X on Π produced the data set below: 67, 63, 54, 52, 62, 69, 62, 58

Let  hX   denote the  density histogram function of X  based on the four intervals: (51, 55.6], (55.6, 62.2], (62.2, 65.4] and (65.4, 70].

(a)  (3 points)  Calculate hX (64.4).

(b)  (3 points)  Calculate   62(70)2 hX (x)dx.

3. Let x = (1.56, 2.54, 1.08, 2.45, 0.39, 0.4, 2.56, 1.24, 1.03, 0.33) be an observed sample of size n = 10 from a distribution with probability density function given by:

f (x) = /

where θ > 0 is unknown.

(a)  (7 points) Determine the MLE of θ . Round your answer to two decimal places.

(b)  (5 points)  Calculate the relative likelihood (pθ0 (x)) for assessing the hypothesis

H0  : θ = 0.5.

4.  (3 points) Let x = (1.9, 1.7, 1.9, 2, 1.5) be an observed sample from Uniform[θ -0.5, θ+ 0.5], θ  e R model.   Find the likelihood function L(θlx) and calculate    and L(1.7|x)

L(1.8|x) .

5. In this question, we will look at an example of model checking.  When we have an observed data set from some distribution and we want to check if that is possibly from a Normal distribution, there are many discrepancy statistics that we can use. One of them is to calculate a skewness statistics and see that value is surprising if the

population from which the observed sample was selected is Normal.  Among others, one skewness statistic we can use is

n        3


←   (xi - )2 .

In this question we will use this skewness statistic to check if it is likely for a given observed sample to come from a Normal population.  We will do this a few steps (which we will put under parts of this question).

Note 1: Use set.seed(2022) at the begining of your R code

Note 2:  Your answer for this question should include all your R codes and outputs and appropriate comments based on the values you have calculated.

(a)  (5 points) Use R, to generate a sample of size n = 10 from a Normal distribution

with µ = 6 and σ = 2 and calculate the skewness statistic above.

(b)  (5 points) Repeat the above calculation with N = 20 samples, each of size n =

10. i.e.  Generate 20 samples , each from a Normal distribution with µ = 6 and σ = 2 and calculate (and print out) the skewness statistic for each sample.

(c)  (5 points) Repeat the above calculation with N = 2000 samples, each of size n = 10. i.e. Generate 2000 samples from a Normal distribution with µ = 6 and σ = 2 and calculate the skewness statistic for each sample. This time, You don’t have to print the 2000 values you calculated as you did in part (b) above. Instead, construct a frequency histogram of the 2000 values of the skewness statistic and comment on your plot.

(d)  (5 points) x = (6.3, 8.2, 11.37, 6.77, 9.5, 10.65, 11.44, 14.63, 6.38, 10.33) is a sam- ple that I generated from some distribution.

Calculate this skewness statistic (sk) for this sample. Do we have evidence (based on this skewness statistic) to conclude that this sample is not generated from a Normal distribution? Do the following calculations to instigate this.

In part (c), you calculated the skewness statistic for 2000 samples of size n = 10 generated from a Normal distribution.  How many of those 2000 values are as extreme as or more extreme than the value calculated for this sample (x)?  i.e. How many of those 2000 values have absolute value greater than or equal to the absolute value calculated for this sample (x)?

Also calculate the proportion of those 2000 samples having skewness statistic as extreme as or more extreme than the value calculated for this sample (x)? Comment on your value.