Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAT 2080

Practice Mid-term

2022

1.  (1 point)  Type II error is:

A.  A false negative

B.  Failure to reject a null hypothesis that is false

C.  A possible error in statistical hypothesis testing

D.  All of the above

2.  (1 point)  The p value is:

A.  The probability of our data occurring under H0

B.  The probability of making a Type I error

C.  The standard deviation of the sampling distribution

D.  The test statistic for ANOVA

3.  (1 point) If you were given data that does not follow the normal distribution, based on that alone which of the following tests might be the best to use?

A.  ANOVA

B.  matched pairs t-test

C.  Rank-Sum test

D.  Pooled SD t-test

4.  (1 point) You want to load data you’ve received as a CSV le from a friend into R to perform some statistical analysis on it.  Since the data is about your friend’s running times you want to name the variable where you will store the data as "running".  Write the line of R code needed to load the data into the variable.  Assume that the data is kept in a folder placed in your current R working directory called "runnDat" and the le your friend gave you is named "running.csv".

5.  A study was conducted with two groups.  The rst group has 5 observations and the second group has 7.

(a)  (1 point)  How many arrangements of the observations between the two groups are there?

(b)  (1 point)  The research scientists want to know whether the mean of rst group exceeds the mean of the second group. Write down the null and alternative hypothesis for their test.

(c)  (1 point)  A permutation test was conducted using all of the possible arrangements of the data. 39 of the permutations conducted resulted in a test statistic more extreme or equal to the observed permutation. Calculate the p value.

6.  Fisheries research scientist Divya wants to know whether trout in lake A are larger on average than trout found in Lake B. Divya caught 16 trout in lake A and found their average length to be 34.75 and

18 trout in lake B with an average length of 33.17.  The sample standard deviations for the two lakes are 5.57 and 4.76 for lakes A and B respectively. Divya assumes the two trout populations have lengths that are normally distributed with equal population variance.

(a)  (5 points)  Perform a hypothesis test with α = 0.1 to see if there is statistical evidence for Divya’s question.

(b)  (2 points)  Calculate the 90% Confidence Interval for the mean difference in length for trout in the two lakes.

(c)  (1 point)  Suppose Divya instead wanted to test if there was any difference in the mean trout lengths between the two lakes. At α = 0.1 would you reject H0  in this scenario? 

7.  (7 points)  Complete the one-way ANOVA table. The total sample standard devation of the data is 5.

p

Treatment Error        Total

4

124

1.99 

8.  (9 points)  A sabermetrician has counted the number of bases stolen in the last 7 baseball games played by three local teams, the Wildcats, Warriors and the Bulldogs.   The sabermetrician is interested in determining whether the average number of bases stolen per game the same or different among the three teams. Use the Kruskal-Wallis test to answer the sabermetricians question. Use α = 0.05.

Wildcats    Warriors    Bulldogs

1

1

2

1

1

2

4

2

4

5

1

0

2

0


4

4

6

1

3

3

4 

9.  A company is testing the drying time of four different formulas of paint (A,B,C and D) on their product. They are interested in determining if there is any difference in the mean drying time (in seconds) for the four paint formulas.  They have provided you with the following summary statistics and tell you that the data for each group appears to be normally distributed:

Paint Formula    ni             i           si

A                         15      990      82

B                         16    1097      71

C                         10      898      70

D                         16    1131    112

(a)  (10 points)  Test the companies hypothesis at α = 0.1:

(b)  (1 point) Write down the statistical model for the test you just used:

10.  A pharmaceutical company is testing two new cholestrol medications. The company conducted a study where 15 individuals were given formula 1, 17 individuals were given formula 2 and 20 individuals were instead given a placebo. The subjects mean cholestrol levels after 2 months in the study were 145 mg/dL for formula 1, 155 mg/dL for formula 2 and 185 mg/dL for the placebo group.  The sample variances were 100 for formula 1, 225 for formula 2 and 250 for the placebo group.

(a)  (5 points)  Construct the 90% confidence intervals for the difference of the means for the new for- mulas against the placebo:

(b)  (1 point) If the company was interested in testing whether or not there is any difference between the new formulas and the placebo at α = 0.1 would they reject H0 ?

(c)  (3 points)  Perform the hypothesis tests to determine whether there is evidence that the new for- mulas reduce cholestrol over a placebo. Use α = 0.1.