Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


Problem Set 4

Analytical Statistics


1. Your friend randomly chooses a square picture frame from the store.  Let X be the height in inches of the picture frame. Based on your knowledge of the square picture frames at the store, you know that the expected height of a randomly chosen square picture frame is 8 inches and the variance is 36 inches. What is the expected area in square inches of a randomly chosen square picture frame?

 

2. A stationary store offers many different types of paper. Each paper type has a width and a height in inches.

● Let H be the height in inches of a randomly chosen piece of paper.

● Let W be the width in inches of a randomly chosen piece of paper.

● Let A be the area in square inches of a randomly chosen piece of paper (A = H × W)

The expected value of H is 12, the expected value of W is 9, and the expected value of A is 150. What is the covariance of H and W?

 

3.  The length of time, Y , that a customer spends in line at a bank teller’s window before being served is described by the continuous probability distribution function (pdf) pY (y) = .2e-.2y  if y > 0 and 0 if y < 0.

(a) Find the cumulative density function, FY(y)

 

(b) What is the probability that a customer will wait more than ten minutes?

 

(c) What is the probability that a customer waits between 5 and 10 minutes?

 

(d) A customer comes to the bank on 10 separate occasions. What is the expected number of times she is served in less than 5 minutes.


4. A subway has good service 70% of the time and runs less frequently 30% of the time because of signal problems. When there are signal problems, the amount of time in minutes that you have to wait at the platform is described by the pdf

probability density function with signal problems = pT |SP(t) = .1e-.1t

But when there is good service, the amount of time you have to wait at the platform

is

probability density function with good service = pT |Good(t) = .3e-.3t

You arrive at the subway platform and you do not know if the train has signal problems or is running with good service, so there is a 30% chance the train is having signal problems.

(a) What is the probability that you wait at least 1 minute if there is good service?

(b) What is the probability that you wait  at least  1 minute if there  are signal problems?

(c) After 1 minute of waiting on the platform, you decide to re-calculate the prob- ability that there are signal problems conditioning on the fact that your wait will be at least 1 minute long (since you have already waited 1 minute). What is that new probability?

(d) After 5 minutes of waiting, still no train.  You re-calculate again.  What is the new probability?

 

5.  Suppose you want to model the number of goals scored in a regulation-length World Cup soccer game. Each regulation length game is 90 minutes. Based your experience watching games, you estimate that on average 2.25 goals are scored.

(a)  Suppose you model the number of goals scored as a binomial random variable, G, with n = 9 and p = 1/4.  In other words, you divide the game up into 9 10-minute  “trials” in which a goal is either scored (“success” with probability of 1/4) or not scored (with probability 3/4). Therefore E[G] = 2.25 (matching your estimate of the average goals scored in a game).  Find pG (2), pG (3), and Var(G).

(b) Your friend points out that it is in fact possible for multiple goals to be scored in a ten-minute period, so perhaps you should model G as a binomial random variable with n = 90 and p = 1/40, in other words dividing the game up to 90 1-minute ”trials” in which a goal is scored with probability 1/40 or not scored with probability 39/40, and E[G] = 2.25.  Given this new definition of G, find pG (2), pG (3), and Var(G).

(c) Another friend points out that it is possible for multiple goals to be scored in a single minute.  You model G a binomial random variable with n = 900 and p = 1/400. Find pG (2), pG (3), and Var(G).

(d)  Suppose we keep increasing n and decreasing p such that n × p remains constant at the value 2.25. What value will the Var(G) of converge on? In other words, find

lim       Var(G)

n→l,np=2.25


R Exercises

1. Load the New York City Census data that is available on NYU Classes.  Using the data, find the average income in New York City of the following three groups:

● People without a college degree

● People with a college degree in a subject other than economics

● People with a college degree who majored in economics

Now re-calculate the average for those three groups, but limit it to people who are under age 30 and have an income above zero.

2.  The dbinom() function in R calculates values of the binomial probability function. So for example, if you roll a die 10 times and want to know the probability of getting a six twice (n = 10, p = 1/6), you could compute that using:

>  dbinom(x  =  2,  size  =  10,  prob  =  1  /  6)

[1]  0.29071

 

The value that dbinom gives is exactly the same as what you would have gotten if you calculated:

P (k = 2ln = 10, p = 1/6) =  (1/6)2 (5/6)8 = .29071

In addition, we can use dbinom to calculate the binomial probability function for a sequence of numbers.  For example, if we want to calculate the entire probability function of a random variable Y with n = 10 and p = 1/6 you could execute the following code:

>  prob_function_G  =  dbinom(x  =  0:10,  size  =  9,  prob  =  1/6) >  data.frame(Y  =  0:10,  prob_function_Y)

Y  prob_function_Y

1      0        1.615056e-01

2      1        3.230112e-01

3      2        2.907100e-01

4      3        1.550454e-01

5     4        5.426588e-02

6      5        1.302381e-02

7      6        2.170635e-03

8      7        2.480726e-04

9      8        1.860544e-05

10    9        8.269086e-07

11  10        1.653817e-08

 

Or to graph the probability function:

 

plot(  0:10,  prob_function_Y,  type  =  "b")

 

Questions:

(a) Find the probability of there being 0, 1, 2, 3, 4, and 5 goals scored in a regulation length world cup game by modeling it as a binomial random variable with n=9 and p = 1/4.

(b) Find the probability of there being 0, 1, 2, 3, 4, and 5 goals scored in a regulation length world cup game by modeling it as a binomial random variable with n=90 and p = 1/40.

(c) Find the probability of there being 0, 1, 2, 3, 4, and 5 goals scored in a regulation length world cup game by modeling it as a binomial random variable with n=900 and p = 1/400.

(d) Find the probability of there being 0, 1, 2, 3, 4, and 5 goals scored in a regula- tion length world cup game by modeling it as a binomial random variable with n=9,000 and p = 1/4, 000.