Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAT 344 Midterm Exam

Problem  1  (20 pts, 2 pts each).  The following are True/False questions or multiple choice questions. Clearly circle the (one) most appropriate answer.

1.  Given a dataset, the values of an estimate of a parameter and its standard error (SE) depend only on the data, not depend on how the data were collected.     True         False

2. We compare diferent estimates for the same parameter mostly by comparing their SE’s because SE is more important than bias.                                                True        False

3.  Using extra information does not always lead to an estimate with smaller SE than the corresponding estimate not using the extra information.                            True         False

4.  A stratiied sample is obtained to estimate the average income in a city.  The less variable (spread apart) the stratum-speciic sub-population mean incomes are, the better stratiied sampling will perform compared to simple random sampling (SRS).        True         False

5. When combining individual estimates from diferent studies targeting the same parameter based on a random efect model, the more diferent the individual estimates, the larger the estimated variance of the random efects.                                         True         False

6.  In statistics, we often use computer simulations to evaluate and compare diferent esti- mates. The main reason is

A.  A mathematical proof may be difficult  (otherwise we should use a mathematical proof instead of simulation)

B.  Simulation is equally valid as a mathematical proof

C.  Simulation is better than a mathematical proof

D.  None of the above.

7. In an election, a poll reported 33.0% support for Liberal Party in July, within 3.0% margin of error,  19  out  of  20  times.   A  new  poll  in  November  (on  diferent  people) reported Liberal’s support rate at  27.0%,  within 4.0% margin of error,  19  out  of  20 times.  Is there signiicant statistical evidence that Liberal’s support has declined over time?

A. No        B. Yes        C. Need to know sample size        D. cannot tell

8.  To estimate the average time students spent on study in a large university, two sampling methods are considered: theirstone is a SRS, and the second one is a stratiied sampling of male and female students separately, using proportional allocation.  Suppose that the two samples have equal  (total) sizes.  If the average study times for male and female students are the same, compared with the SE of the estimate based on SRS, the SE of the stratiied estimate should be

A. smaller        B. larger        C. same        D. cannot tell.

9.  Suppose that the itted least square linear regression line of y on x has a strict positive intercept and that y and x are positively correlated.  Suppose also that the population mean of x is known to be larger than its sample mean.  Then, compared with the ratio estimate, the regression estimate of population mean P  is likely to be

A. larger        B. smaller        C. equal        D. cannot tell

10.  Consider a regression estimator and a vanilla estimator for estimating a population mean.

A. the SE of the regression estimator will always be strictly larger than the SE of the vanilla estimator

B. the SE of the regression estimator will always be strictly smaller than the SE of the vanilla estimator

C.  It is possible that the SE of the regression estimator is the same as the SE of the vanilla estimator

D.  None of the above is correct.

Problem 2 (8 pts). An instructor conducted two surveys before and after the midterm exam respectively based on SRS from a large population, with the following question:   “ Do you think iClicker help you learn? Choose Yes or No”. The results are summarized below

After midterm

Yes     No         Total

Before midterm     Yes      75         5        |    80

No        15         5          |      20

Total  90        10        |   100

We consider two diferent scenarios about how the surveys might have been conducted. Show the key steps below.

(a) (4 pts) Suppose the two surveys were conducted separately before and after midterm with two SRS’. Do students’ attitudes toward iClicker have changed after the midterm exam?

(b) (4 pts) Suppose the two surveys were conducted on the same students in the sample, before and after the midterm.  Do students’ attitudes toward iClicker have changed after the midterm exam?

Problem 3 (12 pts). Jim is running for the major of a big city.  Two independent surveys were conducted, each based on a SRS. The proportions of support for Jim in the surveys are given below, with the associated SE:

Survey     proportion       SE

I              0.55           0.03

II             0.65          0.02

We consider two diferent scenarios about how the surveys might have been conducted.  (Show the key steps below.)

(a) (4 pts) If the two surveys were conducted separately in two regions that partition the city, with the percentages of the population in Region I being 40% and Region II being 60%.  Given an estimate and its SE for the proportion of whole population supporting Jim.  (Note:  Survey I is from Region I and Survey II from Region II.)

(b) (4 pts) If the two surveys were conducted independently by two diferent irms targeting the same population. Give an estimate and its SE for the proportion of the whole population supporting Jim, assuming no systematic biases for the irms.

(c) (4 pts) For Problem (b), is there likely a systematic bias? Circle one: Yes   No.    Explain the main reason for your answer in one sentence (please write clearly)


Problem 4 (10 pts). Show the key steps for both problems.

(a) (5 pts) A researcher wishes to estimate average household income in a region consisting of two distinct postal codes.  She respectively obtained a SRS of size 5 and  10 from the two distinct postal codes, which have 20 and 60 households respectively.  The data are summarized below:

Postal code              Number of households sampled       Household income (in $1000’s)  

Postal code A                5 out of 20                               sample mean        sample SD

Postal code B               10 out of 60                                   90                         15


If the dataset was treated as if it came from stratiied sampling, with each postal code being a stratum, ind the estimate and its SE of the average household income in the region represented by the two postal codes.

(b) (5 pts) (This problem is unrelated to (a).) We wish to estimate a population total, denoted by tg;P, of variable y, with large population size.  Let x be a auxiliary/helper variable, which is positively correlated with y.  Suppose also that the SE of the ratio estimator for the population mean P , denoted by SE0 , is known. The known information for x is its population total tx;P and sample mean S .  Based on mathematical arguments, derive a formula for the standard error of the estimator  (S /S )tx;P   for the population total  (express your inal answer as a function of known quantities).