MTH3003

STATISTICS FOR APPLIED SCIENCES

2021/2022

PART A (10 MARKS)

1.     You are given eight observations which are 3, 3, 5, 6, 9, 4, 3 and 2. Calculate the mean, median and mode.

A.     Mean = 4.375, median = 4, mode = 3

B.     Mean = 4.475, median = 3, mode = 3

C.     Mean = 4.375, median = 3.5, mode = 3

D.     Mean = 4.500, median = 3.5, mode = 3

Questions 2 and 3 are based on the following data.

The number of Family mart franchise in 15 different cities in Japan:

2       8       8       9       9       9       10     11     12     12     12     13     13     19     22

2.      Calculate the first quartile (Q1), third quartile (Q3) and interquartile range (IQR).

A.     Q1 = 9, Q3 = 12, IQR = 3

B.     Q1 = 9, Q3 = 13, IQR = 4

C.     Q1 = 8, Q3 = 13, IQR = 5

D.     Q1 = 8.25, Q3 = 12.75, IQR = 4.5

3.     A boxplot can be constructed based on the data above. Please verify is there any outlier in the data set? If yes, determine the outlier(s)?

A.     Yes, there are outliers in the data set which are 2 and 22.

B.     No, there is no outliers in the data set.

C.     Yes, there are outliers in the data set which are 2, 19 and 22.

D.     Yes, there is an outlier in the data set which is 22.

4.     40th percentile for a data set is 20 which implies that

I.       60% of the measurements in the data set are less than 20.

II.     40% of the measurements in the data set are less than 20.

III.     60% of the measurements in the data set are more than 20.

IV.    40% of the measurements in the data set are more than 20.

A.     I and II

B.     II and III

C.     I and IV

D.     III and IV

5.      Below is a histogram for a certain data set. Which of the following statement is TRUE regarding the histogram?

A.     The mean is less than the median.

B.     The data distribution is symmetric.

C.     The data distribution is skewed to the left.

D.     The mean is greater than the median.

6.     The set of all simple events of an experiment is called

A. a compound event.

B. a population.

C. a sample space.

D. a random sample.

7.     An experiment consists of three stages. There are three ways to accomplish the first stage, four ways to accomplish the second stage, and five to accomplish the third stage. Then, the number of ways to accomplish the experiment is

A.     60

B.     12

C.     15

D.     20

8.     A team of 5 people is chosen from 8 men and 7 women. How many different teams can be selected if the team must contain at least 3 men?

A.     28

B.     56

C.     112

D.     224

9.     Which of the following statements is FALSE?

A.     The set of all simple events of an experiment is called the sample space.

B.     An event that can be decomposed into two is called a simple event.

C.     The sum of the probabilities for all simple events in the sample space equals 1.

D.     The probability of an event A is equal to the sum of the probabilities of the simple events contained in A.

10.   Three randomly chosen fourteen-year-old junior high students who had not yet taken driver's education classes were given the written part of the driver's exam. Each student was graded as passing (P) or failing (F) the written exam. What is the probability at least one student passes the written test?

A.     1/4

B.     3/8

C.     5/8

D.     7/8

PART B (10 MARKS)

1.     A study is conducted to investigate the relationship between education level and depression among working women. The following events are defined and some of the associated probabilities are given for the participants of the study.

A = Woman is a graduate.

B = Woman has depression.

P(A) = 13/20         P(B|A) = 7/13         P(A B) = 4/5         P(Ac B) = 3/20

Find the probability that a randomly selected woman

a)     is NOT a graduate.                                                                     [1 mark]

b)     is a graduate AND has depression.                                            [1 mark]

c)      has depression.                                                                          [1 mark]

d)     is NOT a graduate, given that she has depression.                    [1 mark]

e)     is depression among working woman independent of their

education level?                                                                          [1 mark]

2.     A virus infection is known to cause up to 5 different symptoms on the infected patients. A study on a group of patients gives the following table of probability distribution where random variable X denotes the number of symptoms observed and p(x) is the associated probability.

 x 0 1 2 3 4 5 p(x) 0.35 0.21 0.09 0.18
a)      If the probability of having at least 4 symptoms is half of the probability of having at most 1 symptom, show that the probability of having exactly 5 symptoms is 0.1 (show your calculation). Then, complete the above table.

[3 marks]

b)     Compute the mean number of symptoms for an infected patient.      [1 mark]

c)      By looking at the probability distribution, is the distribution symmetric? Explain your answer.                                                                                       [1 mark]