Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STA 104

Spring Quarter, 2021

Exam I

True/False

For each of the following questions indicate true or false, then fully explain your answer. You may use examples to illustrate

your answer.

(I)  (2.5 points) If we were to create R = 4000 random permutations for a two-sample dataset, where n = m = 5, we would be sure to have generated all possible permutations of this dataset.


(II)  (2.5 points) The permutation test using the median as a test-statistic (for example, the difference in medians) is not generally highly effected by outliers.


(III)  (2.5 points) The number of values in a dataset above the median is binomially distribution.


(IV)  (2.5 points) The larger the value of the Mann-Whitney test-statistic, the more evidence we have to suggest that the values in group 1 tend to be larger than the values


Full Detail

Work out the following problems. Show your work.

1. Your instructor has 8 chickens (all of which are hens), and is curious about how many eggs they laid per week, compared to other (independent) groups of chickens. They collected data from 20 independent coops with 8 hens, and found the following for the number of eggs laid per week:

10, 20, 21, 21, 21, 22, 24, 25, 26, 28, 31, 33, 34, 35, 36, 36, 36, 38, 40, 48

The claim is that the median for number of eggs laid is less than 37 (what your instructor measured in their coop).

(a)  (3 points) State the null and alternative, and calculate the approriate test-statistic for using the exact binomial test.


(b)  (4 points) Calcualte the p-value and interpret it in terms of the problem. If you cannot remember how to calculate the p-value, you may still interpret the value.


(c)  (4 points) Find the 95% confidence interval for the CDF of the dataset at the value 35, using the normal approxi- mation to binomial.


(d)  (3 points) What is the highest percentile that the value 35 is likely to be? Explain your answer.


2.  A researcher was interested in measuring the net amount of iron gained (positive numbers) or lost (negative numbers) for two independent groups. Group I is a high vitamin C diet group, and group II is a high calcuium diet group. The values follow:

Group I : >10.41,    >1.23,    0.51,    0.79,    1.06,    1.87,    1.98,    2.32,    2.75,    4.41

Group II : >3.15,    >1.68,    >0.62,    >0.38,    >0.25,    >0.21,    >0.18,    0.92,    1.56

The median for group 1 is: (1.465), the mean is: 0.405 The median for group II is : (-0.25) , the mean is: -0.4433. You may assume group I is group 1, and group II is group 2.

The goal is to assess if there is a significant difference between the distributions of the two groups. (a)  (3 points) State the null and alternative.


(b)  (4 points) Calculate the appropriate test-statistic, as either a difference in means for group I vs II, or a difference in medians for group I vs II. Explain your choice (mean or median).


(c)  (4 points) Assume the permutation distribution of all possible differences (no matter what you have chosen in (b)) is: