Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAT 2120 - Homework 5

Instructions:

• Write out the Honor Pledge under your name and computing ID: “On my honor, I did not give nor receive aid on this assignment beyond the listed collaboration.”

•  List the names of students with whom you collaborated under the Honor Pledge.  If you did not collaborate, write‘None’.

•  Respond to each problem below thoroughly, showing all relevant work.

•  Use Python for all calculations. Include a screenshot showing relevant code and output for each part using Python.

•  Save your completed work as a PDF and upload it to Gradescope. Be sure to select the appropriate page(s) for each answer. Unselected work will not be graded.

Be sure to provide your full name and computing ID at the top of your work.

Problems:

1. Consider the following scenarios.  For each scenario, decide if it follows a Binomial or a Poisson

distribution, or neither and explain why. Then, calculate the corresponding probability if possible.

(a) In a particular online community, the ”leadership”of the community bans an average of eight users per day for various unpleasant behaviors. What is the probability that there will be more than 250 bans in the next four weeks?

(b) While walking to work, there is a probability of 0.0001 that a worker’s electric scooter will abruptly stop functioning. During a particularly long day in Oakland, about 36,000 workers take scooters to work. What is the probability that at least one worker’s scooter will abruptly stop functioning?

(c) A restaurant owner employs 4 chefs and 8 wait sta↵. She decides to randomly give a $50 bonus to each of two employees by using Python to randomly select names from a numpy array with the names of all twelve employees. What is the probability that she selects two chefs?

(d) A university’s Outdoor Resource Center rents out various equipment, including large tents (meant for up to 10 people to sleep in). The center keeps four such tents available for rent, as they find that three such tents are reserved per weekend on average. What is the probability that the center will receive more rental requests than they can fill?

2. This problem continues from the unit 5 lab activity and the same distributional assumptions will be made. This article from the Guardian in 2015 reports on two shark attacks in two days.

(a) The random variable Y was used to denote the number of shark attacks per year during the years 2012-2014. From the lab activity, what is μY  ?

(b) Let the random variable V denote the number of shark attacks in Australia in a two-day period in 2015. What is the mean of V , μV? Note: 2015 was a non-leap year.

(c) What is the probability that 3 shark attacks will occur in a two-day period in Australia in 2015?

(d) What is the probability that at least 3 shark attacks will occur in a two-day period in Australia in 2015?

(e) How many independent (non-overlapping) two-day periods are there in 2015?

(f) What is the probability that at least one of these two-day periods in 2015 sees at least 3 shark attacks in Australia?

(g) Given the result from the previous part, is observing 3 shark attacks in a two-day period in Australia in 2015 surprising?

3. For each situation below, determine whether the given percentage is a statistic or a parameter. Explain.

(a) In the ten most recent games of chess between my two kids, my son has won eight times.

(b) 75% of all students at a school are in favor of more bicycle parking spaces on campus.

(c) A customs inspector selected 10 out of several hundred asylum seekers for heightened security

screening at the border. Of these, 30% had at least one forged document with them.

4. Are the following statements true or false? If false, explain.

(a) The sample mean is an unbiased estimator of the population mean because the sample mean is always equal to the population mean.

(b) For a sample mean to be an unbiased estimator of the population mean, a large sample needs to be drawn.

(c) Sample means are less variable than individual observations (assuming a sample size of at least 2).

HW5

Jessica “Jianan” Xiong  (pqf6rd)

On my honor, I did not give nor receive aid on this assignment beyond the listed collaboration.

Problems:

1. Consider the following scenarios. For each scenario, decide if it follows a Binomial or a Poisson distribution, or neither and explain why. Then, calculate the corresponding probability if possible.

(a) In a particular online community, the ”leadership” of the community bans an average of eight users per day for various unpleasant behaviors. What is the probability that there will be more than 250 bans in the next four weeks?

It is a poisson distribution. The number of bans is independent for each day, and the probability of bans every day is the same for all units of equal size.

The probability that there will be more than 250 bans in the next four weeks is 0.0402.

 

(b) While walking to work, there is a probability of 0.0001 that a worker’s electric scooter will abruptly stop functioning. During a particularly long day in Oakland, about 36,000 workers take scooters to work. What is the probability that at least one worker’s scooter will abruptly stop functioning?

It is a binomial distribution. There are a fixed number of observations (n = 36000), which are all independent. In this case, the electric scooter's abrupt stoppage can be considered a "success", and the probability of this happening is p = 0.0001.

The probability that at least one worker’s scooter will abruptly stop functioning is 0.9727.

 

(c) A restaurant owner employs 4 chefs and 8 wait staff. She decides to randomly give a $50 bonus to each of two employees by using Python to randomly select names from a numpy array with the names of all twelve employees. What is the probability that she selects two chefs?

It follows neither a binomial nor a poisson distribution. The probability changes after choosing the first employee. If the first employee chosen is a chef, the probability of choosing another chef is 3/11. If the first employee chosen is not a chef, the probability of choosing a next chef is 4/11. Thus, it is not a binomial distribution. The probability of choosing the second chef is dependent on the first choice, so it is also not a poisson distribution.

P = 4/12 * 3/11 = 0.0909

(d) A university’s Outdoor Resource Center rents out various equipment, including large tents (meant for up to 10 people to sleep in). The center keeps four such tents available for rent, as they find that three such tents are reserved per weekend on average. What is the probability that the center will receive more rental requests than they can fill?

It is a poisson distribution. The number of rental requests are independent for each weekend, and the probability of rental requests every weekend is the same for all units of equal size.

The probability that the center will receive more rental requests than they can fill is 0.1847.

 

2. This problem continues from the unit 5 lab activity and the same distributional assumptions will be made. This article from the Guardian in 2015 reports on two shark attacks in two days.

(a) The random variable Y was used to denote the number of shark attacks per year during the years 2012-2014. From the lab activity, what is μY ?

μY = 19.6667

 

(b) Let the random variable V denote the number of shark attacks in Australia in a two-day period in 2015. What is the mean of V , μV ? Note: 2015 was a non-leap year.

μV = 0.1078

 

(c) What is the probability that 3 shark attacks will occur in a two-day period in Australia in 2015?

P (3 attacks) = 0.0002

 

(d) What is the probability that at least 3 shark attacks will occur in a two-day period in Australia in 2015?

P (at least 3 attacks) = 0.0002

 

(e) How many independent (non-overlapping) two-day periods are there in 2015?

365/2 = 182.5

There are 182 independent two-day periods in 2015.

(f) What is the probability that at least one of these two-day periods in 2015 sees at least 3 shark attacks in Australia?

The probability that at least one of these two-day periods in 2015 sees at least 3 shark attacks in Australia is 0.0357.

 

(g) Given the result from the previous part, is observing 3 shark attacks in a two-day period in Australia in 2015 surprising?

It is not surprising to observe 3 shark attacks in a two-day period if we look at every two-day period  because  in  2(f),  the  probability  is  0.0357  for  one  of  all the two-day  periods  in  2015. However, the probability that at least 3 shark attacks will occur in a two-day period in Australia in 2015 is 0.0002 calculated in 2(d). It would be surprising if we just randomly choose one two- day period and observe 3 shark attacks in that two-day period.

3. For each situation below, determine whether the given percentage is a statistic or a parameter. Explain.

(a) In the ten most recent games of chess between my two kids, my son has won eight times.

The given percentage is a statistic as 10 out of most recent games were chosen and for these chosen  10  games, the  son won 8 times  (p  =  8/10).  When we select  another  10  games, the percentage can possibly change and no longer stay 80%.

(b) 75% of all students at a school are in favor of more bicycle parking spaces on campus.

The given percentage is a parameter as 75% of all students at a school describes the characteristic of the entire students’ population at school rather than the percentage of students sampled.

(c) A  customs  inspector  selected  10  out  of  several  hundred  asylum  seekers  for  heightened security screening at the border. Of these, 30% had at least one forged document with them .

The given percentage is a statistic as 10 out of several hundred asylum seekers were selected for heightened security screening at the border. When we select another 10 asylum seekers, the percentage can possibly change and no longer stay 30%.

4. Are the following statements true or false? If false, explain.

(a) The sample mean is an unbiased estimator of the population mean because the sample mean is always equal to the population mean.

False. When samples are  randomly selected, the sample  mean would  be different while the population  mean is fixed. This  is  because there are variabilities among samples. As a  result, sample mean would not always be equal to the population mean.

(b) For a sample mean to be an unbiased estimator of the population mean, a large sample needs to be drawn.

False.  Drawing  a  large  sample  would  only  reduce  variability.  To  make  the  sample  mean  an unbiased estimator, random sampling is needed and also, we need to select an unbiased statistic for the parameter of interest.

(c) Sample means are less variable than individual observations (assuming a sample size of at least 2).

True. As each sample set contains more than one sample, the larger the sample size, the less variable the means will be, so sample means will be less variable than individual observations.