Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


STATISTICS

QUESTION. You are working as a consulting statistician for a company that has a contract with a medical researcher. She has gathered data on 60 adult female patients for a diabetes study. The  variables measured include health and demographic variables for the females. The 7 variables      she has are:

X1 = Number of times pregnant

X2 = Plasma glucose concentration (based on an oral glucose tolerance test) X3 = Diastolic blood pressure (mm Hg)

X4 = Triceps skin fold thickness (mm)

X5 = Two-Hour serum insulin (mu U/ml)

X6 = Body mass index (weight in kg/(height in m)^2)

X7 = Age (years)

The questions that the researcher would like answered include:

1. Are there individual females who are highly unusual (in any way) based on the measured health variables, X2 through X6? If so, identify their numbers.

2. Are there notable associations/relationships between some of the variables? (if so, describe them)

3. Is there a way to graphically represent the raw data for the 60 patients and draw conclusions about the data set from such a graph?

4. Can we find a few indices that describe the variation in the data set using a lesser     dimension than the original set of variables? If so, what are those indices? Is there a convenient interpretation of any of the indices? (USE PCA)

5. Can we graphically display the data in a low number of dimensions using such indices? What conclusions about the patients (individual patients or groups of patients) can you  draw from such a graph?

6. What are any other potentially interesting aspects of the data set?

You will prepare a roughly 6-page report detailing your analysis of the data and your                 conclusions. Keep in mind that the report should be written for two audiences: the medical        researcher, who has a sense for numbers but is not an expert in statistics, and your own              supervisor at the statistical consulting company, who will be judging you and deciding on your possible promotion based on the statistical competency ofthe report. Your report should be       understandable and meaningful to both audiences.

You should include graphs that illustrate and/or support your findings. (The graphs do not have to count as part of the roughly 6-page length.) Do NOT include computer code within the main  body ofyour report. This will be incomprehensible to the researcher and would only annoy her.

You should include such code in an Appendix. Include references used in preparing the report. The data for this problem is available in the class folder on Google Drive as “diabetes”.