Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Problem Set 6

DATS 1001

2022

In this problem you will analyze data from a randomized controlled trial conducted in rural India in 2017. The experiment tested an intervention to combat sepsis in infants. Sepsis is a life-threatening inflammatory condition that arises in response to infections.

1.  Study Details (20 points)

Look up the article “A randomized synbiotic trial to prevent sepsis among infants in rural India,’ ’ published by Pinaki Panigrahi and colleagues in Nature in 2017. You should be able to download  the article from GW, but the abstract answers all of these questions.

a. What is the purpose of the study?

b. How is the study population defined?

c. What is the unit of observation?

d. What is the sample size?

e. What is the treatment?

f. What is the main outcome of interest?

2. Using documentation (20 points)

Download a .zip archive of the authors’ data fromhttps://datadryad.org/stash/dataset/doi:10.5061/dryad.275d4. Click “Download Data” in the upper right corner. Begin by inspecting the readme file (a .docx).

a. What is the treatment variable’s name? What values can it take?

b. What is the outcome variable’s name? What values can it take?

3. Analysis (50 points)

Load the data (the .csv file from the .zip archive) into R and conduct the main analysis.

a. How many subjects were assigned to each treatment condition?

b.  Using group_by() %>%  summarize(), calculate the average outcome in the treatment and control groups.

c. Using regression, calculate and report the average treatment effect on the main outcome variable. Interpret your results.

d. How do parts (b) and (c) relate to one another?

e. Using weight after 60 days as the outcome variable, repeat steps (b) through (d).