Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAT 616 Exam 1-Spring 2022

1.       (25 points) Concepts – Provide short answers (5 points each)

a.   What are the assumptions in the dependent samples t-test? Suppose only the differences appear normal, will that invalidate the test?

 

b.   For the case of two treatments, why will a repeated measures Anova and the 2-sample dependent t-test provide the same inference?

 

c.   In the usual one-way Anova setup yj  = µ+ αi  + εij   with k levels for the factor A and j                observations of the dependent variable (DV), what is the explanatory (independent) variable (IV)?  Is the predictor continuous?

 

d.   Suppose we have conducted an experiment with only continuous predictors. Would we use Anova or some other tool to analyze?

 

e.   Regarding causality, explain the difference between a randomized experiment and an observational study.


2.       (20 points) In the US population, the height of a 25 year old white male can be modeled as a normal random variable with mean 69.5” and standard deviation 4.7”. That is, the mean height is 5’ 9.5”

a.       Let us consider anyone at or above the 90th percentile as “tall.” How tall is this? Express your answer in feet and inches.


b.       Suppose we have random sample of 10 men and we are interested in the number of tall men in the sample. What probability distribution should we use to model this question? Be sure and    state the numerical values of the parameters.


c.       In this sample, what is the probability that no more than one individual is tall?


d.       What is the probability that two or more individuals are tall?


3.       An experiment is designed to investigate significant factors in vehicle emissions. The treatment will be four different fuel additives (A, B, C, D). It is desired to block on drivers (I, II, III, IV) and vehicle (1,2, 3, 4). One can use a Latin square design for independent blocking variables. Since there are 4 treatments and 4 levels for each blocking factor, this is a kxk=4x4 Latin square.

a.   (5 points) Write down the sequence of the Latin square indicated from the data below

Write the experimental sequence here:

 

b.   (5 points) Write down two additional sequences of this 4x4 Latin square (you will use them    later). For example, a 3-level Latin square with two blocking variables, possible experimental arrangements might be:

 

Place your arrangements in the squares below

 


c.    (10 points) Perform the appropriate Anova. Your regression formula will exclude interaction terms. What conclusions do you make from this study? You should look at all pairwise           differences if you get a positive result for the omnibus F-test.

d.   (5 points) Suppose there is a third blocking factor for ambient temperature (T), a factor with k=4 levels. Let the levels of T be α, β, γ, and δ . How would you code these additional factor levels into an appropriate Latin square design? What is this design called?


4.       Consider the following fractional factorial design:

 

a.   Explain the diagram (5 points each, total 40 points)

(1)       How many levels of each factor

(2)       How many factors

(3)       This design is _________ (fraction) of which full factorial design

(4)       How many total runs are required to run the full factorial experiment

(5)        How many total runs are required for this experiment. You may ignore center runs

and multiple measures

(6)       How many generators are required for a 2(k-p) fractional factorial design

(7)       What are the design generators for this experiment and what does that mean.

(8)       What is the resolution of this experiment and what does that mean



b.   (10 points) Using the R package FrF2 it is easy to generate the entire full factorial design for k=6 (in Yule order) is:

If we are only using ¼ of a 6-factor experiment, then we need places for X5 (E) and X6  (F), so we will use those originally belonging to interactions. Using the generators above, provide the        design for the 2(6-2) fractional factorial design. Explain your choice of confounded factors and      interactions. Leave this in standard order.

c.    (5 points) Also provide a randomized run sequence for the standard design you provided in (b) above.


5.       Consider an industrial experiment with objective to explore the effect of 3 factors affecting yield. A   Plackett-Burman screen design identified the following 3 factors as significant: Temperature (T,         160/180 deg C)), Concentration (20%, 40%) and Catalyst (A or B). The next step in the exploration is to examine some interactions and determine which are of importance. We will prepare a 2k factorial design with k=3.



a.   (10 points) Write down the design matrix. Use Standard Yule ordering. Be sure and identify all interactions.

b.   (5 points) Explain how you would randomize the experimental plan.

c.    (5 points) How many total runs are specified by this factorial design. Define but do not include any center points.

d.   (10 points) It has been determined that a half factorial experiment would have a more        manageable number of runs. Identify the total number of runs and write down the design matrix for the resulting 2(3-1) fractional factorial design.


6.       (20 points)   Suppose we have a random sample of size n=10 from the lognomal distribution with unknown shape and scale parameters. We knowX is unbiased for the population mean µX , and in the lognormal case µX  = eµ+σ2 /2 and σ = (eσ2   − 1)e2 µ+σ2   . Rather than using an analytical expression for the standard error of the sample mean σX , it is easier in this case to use the bootstrap. We calculate B=5,000 bootstrap sample means and obtain the following statistics:

 

Resampled Sample Means


5

5


.975

 

.025

5                      10                   15                   20                   25

x

 

a.       What is the analytical expression forσX , the standard error of the sample mean?


b.       What are the numerical values of the bootstrap mean and standard errors forX ?

 

c.       Using ±2σX   write an approximate 95% confidence interval forµX .

 

d.       Using the ECDF technique, find an approximate 95% confidence interval forµX .