Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Semester 2 Final Examination

STA001-21-02

UTP Statistics-21-02

Question 1 (7 marks)

A biologist divided a sample of 414 fruit flies into red, white, and brown groups based on eye colour and two gender groups (male and female). The counts are shown below:

 

Male

Female

Totals

Red

52

96

148

White

30

172

202

Brown

26

38

64

Totals

108

306

414

Based on the counts shown in the table above, answer the following questions (please write your probabilities as fractions):

(i) What is the probability of randomly selecting a fruit fly that has brown eyes and is female? (1 mark)

(ii) What is the probability of randomly selecting a fruit fly that has brown eyes or is female? (1 mark)

(iii) If a randomly selected fruit fly has brown eyes, what is the probability that the fruit fly is a female? (1 mark)

(iv) Are the events “red-eyed fruit flies’’ and “brown-eyed fruit flies’’ collectively exhaustive? Explain your reasoning. (2 marks)

(v) Are the events “brown eyed fruit flies’’ and “female fruit flies” independent? Explain your reasoning. (2 marks)


Question 2 (6 marks)

A marketing manager at a large manufacturing company investigates the relationship between        product reviews and the customers’ decision to buy the product. The manager noticed that in the     past year, about 30% of target customers read the reviews on the company’s website, and of these 56% bought the product. Of the target customers who did not read any reviews, only 5% bought      the product.

(a) Create a tree diagram below by writing the relevant probabilities on each branch and the joint probabilities at the end of branches (please write your probabilities as fractions). (2 marks)

(b) Use the tree diagram to answer the following (please give answers to 3 decimal places).

(i)        What is the probability that the customer buys the product?  (1 mark)

(ii)       What is the probability that a customer who buys the product has not read the

reviews? (1 mark)

(iii)          Are the events ‘buying the product’ and ‘reading the reviews’  mutually

exclusive? Explain your reasoning. (2 marks)

 

Question 3 (14 marks)

a)  In a study, 1,000 men were asked the question “are you afraid of heights?” 15% of the respondents replied a ‘yes’ to that question.

(i)         Is construct 15% a parameter or a statistic? Justify your answer (1 mark)        (ii)        The standard error for the estimate for the true population parameter is 0.05.

Develop a 95% confidence interval (CI) for this parameter. (1 mark)

(iii)       Interpret your answer in part ii) in context. (1 mark)

(iv)       If the sample size is increased to 10,000 men, would you expect the width of

the 95% CI to increase or decrease? Justify your answer.  (2 marks)

b)              (i)  Describe one difference  between the sampling  distribution  and the  bootstrap distribution. (1 mark)

(ii) State one difference between the bootstrap distribution and the randomisation distribution. (1 mark)

c)  The Department of Transportation of a country reported that 80.2% of the country’s airline flights arrived on time. One researcher randomly selected 50 airline flights.   Let X = the number of flights arriving on time.

(i)   Does X meet the conditions of a Binomial random variable? Explain your choice

in two sentences.                                                                                             (2 Marks)

(ii)  Calculate the Z-score (to 2 d.p.) for 32 flights arriving on time if the mean is 40 flights and the standard deviation is 2.82. Would you be surprised to learn that 32 flights

arrived on time? Use one sentence to explain your answer.                (2 Marks)

d)  The quality controller at an appliance manufacturing company  inspects the number of defects in washing machines. The null hypothesis for this hypothesis test is stated as:

Ho: The average number of defects is not acceptable.

The alternative hypothesis is stated as:

Ha: The average number of defects is acceptable.

(i)        What is a Type I error in this setting? (1 mark)  (ii)       What is a Type II error in this setting? (1 mark)

(iii)       Describe  one  method  that  can  be  used  to  decrease  the  probability  of

committing a Type II error. (1 mark)

 

Question 4 (5 marks)

The latest survey at a university reveals that 60 of the 102 survey participants support the current president of the students’ association. One student wants to use this information to test the claim  that more than half of all students support the president.

(i)            State the null and alternative hypotheses. (1 mark)

The StatKey output below displays the randomisation distribution for this hypothesis test.

 

(ii)    Give the notation and value of the sample statistic (to 3 d.p.). (1 mark)

(iii)  Find the P-value of this test. (1 mark)

(iv)  Interpret the meaning of the P-value in part (iii). (1 mark)

(v)  Make a decision and conclusion for the hypothesis test in context.  Use a 5% significance level. (1 mark)

 

Question 5 (5 marks)

One study aims at examining whether the proportion of cat owners who have schizophrenia is

different from the proportion of non-cat-owners who have schizophrenia. The count for cat owners who had schizophrenia was 1365 with n = 4000. The count for non-cat-owners who had                 schizophrenia was 764 with n = 4125.  Statkey reports the standard error s.e = 0.009.

(i)     State the null and alternative hypothesis clearly. (1 mark)

(ii)    Give the notation and value of the sample statistic (3 d.p.) (1 mark)

(iii)   Give the notation and value of the test statistic (3 d.p.) (1 mark)

(iv)   The P-value for the test statistic from part (iii) is 0.000 (3 d.p.). Comment on the

strength of evidence against the null hypothesis. (1 mark)

(v)    Make a decision and conclusion for the hypothesis test in context.  Use a 1% significance level. (1 mark)

 

Question 6 (6 marks)

Lemis Sweets Company (LSC) makes a special candy called HAPPYGROW for children. The     company claims that 30% of HAPPYGROW candy are red, 60% are yellow, and 10% are green.

Suppose a random sample of HAPPYGROW candy has 50 red ones, 45 yellow ones, and 5 green ones. Is this consistent with LSC's claim? Conduct an appropriate hypothesis test using a 0.05       level of significance.

(i) What is the name of a hypothesis test that could be used to test LSC's claim? (1 mark)

(ii) Write down the null and alternative hypotheses for the test from part (i). (1 mark)

(iii)  How large do the expected counts need to be for the test in part (i) to be appropriate?

(1 mark)

(iv)  Calculate the expected frequencies. (1 mark)

(v)  Calculate the degrees of freedom for the test from part (i).  (1 mark)

(vi) The hypothesis test returned a P-value of 0.001. Make a decision and conclusion for the hypothesis test in context.  Use a 5% significance level. (1 mark)

 

Question 7 (8 marks)

A medical centre is curious to find out if there is a difference in blood pressure recordings depending on which arm is tested. The medical centre selected a random sample of 100 patients and recorded systolic blood pressure (mm Hg) on both the right arm and the left arm of each patient. The mean of the differences (Right Arm systolic blood pressure – Left Arm systolic blood pressure) was 0.05 mm Hg with a standard deviation of 3.295 mm Hg.

(i) Is this study based on paired data or separate samples? Explain your reasoning. (2 marks)

(ii) State the hypotheses for a test to determine if there is a difference in blood pressure recordings depending on which arm is used. (1 mark)

(iii) Give the notation and value of the sample statistic. (1 mark)

(iv) Calculate the standard error for the sample statistic. (to 3 d.p.) (1 mark)

(v) Calculate the test statistic (to 3 d.p.). (1 mark)

The StatKey output below displays the theoretical distribution for the hypothesis test.

(vi) Write the P-value (to 3 d.p.) of this test (1 mark)

(vii) Make a decision and conclusion for the hypothesis test in context.  Use a 5% significance level. (1 mark)

 

Question 8 (7 marks)

One consumer wants to know if the average number of chips is less than 45 in a bag of Red Bird potato chips. A random sample of 100 was selected and the sample statistics were  = 41.6 and s = 7.6.

(i)       What is the standard error of ഥ? (1 mark)

(ii)       Using one or two sentences, briefly describe the Central Limit Theorem (CLT) for the

sample mean. (1 mark)

(iii)       Does CLT hold for this test? Explain your reasoning. (1 mark)

(iv)      State the hypotheses for the test. (1 mark)

(v)       Give a 90% CI (3 d.p.) for the average amount of chips in each bag (The margin of error is 1.262) . (1 mark)

(vi)       Interpret your CI in part (iv) in context. (1 mark)

(vii)      Make a decision and conclusion based on your CI in part (v). (1 mark)

 

Question 9 (12 marks)

High livestock numbers and the distribution of livestock can affect the environment. A researcher decided to use the number of livestock (or Live stock in the screenshot below) to predict  net

greenhouse gas emissions (or Net_emis which is measured in one metric ton of carbon dioxide).

The following output is from StatKey.

 

(i) What type of graph is shown above? (1 mark)

(ii) Which variable is the explanatory variable? (1 mark)

(iii) Give the equation of the simple linear regression model in the context of the analysis i.e. not just using x and y. (Use 3 d.p. for the coefficients.) (1 mark)

(iv) Using one sentence, interpret the slope coefficient in context. (1 mark)

(v) Using one or two sentences, interpret the intercept of the simple linear regression model in part (iii) and is the intercept meaningful in the problem? (2 marks)

(vi)  Explain  in  one  sentence  how  you would  predict  the  expected  net  greenhouse  gas

emissions when the livestock number is 605,000. (1 mark)

(vii) Using the StatKey output, write down the correlation coefficient. Comment on the strength and direction of the relationship between net greenhouse gas emissions and the number of livestock. (1 mark)

(viii)  Calculate the coefficient of determination (to 3 d.p.) from the StatKey output. (1 mark)

(ix)  Interpret the coefficient of determination in part (viii) in the context. (1 mark)

A randomisation distribution for the correlation coefficient for the hypothesis test is displayed below.

 

(x)  Using the  randomisation  distribution  above,  make  a decision  and conclusion for the hypothesis test in context.  Use a 5% significance level. (1 mark)

(xi) The decision made in (x) will either be correct or wrong. Using one or two sentences, explain whether a Type I or Type II error could made. (1 mark)