Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

PPHA 311

Problem Set 1

Winter 2024

Due date: Sunday, January 14,  2024 at 11:59PM. You must submit via Gradescope on Canvas. No late problem sets will be accepted.

Group work: You may work in groups, but each person must submit individual answers. These answers must reflect the individual’s own work and may not be copied from others or generative AI. Please write the names of all members of your study group at the top of your submission.

Scratch work and code: Please  show your work  (where relevant) and include all code and output for this assignment with your submission. Please use brief but clear comments in the code to reference the applicable assignment section. Note: submitting the code/log of a classmate is considered a violation of our academic integrity policy and will result in a 0 on the overall assignment.

1    A Hypothetical Policy Intervention (5 points)

Please see PS1 Q1 under Canvas quizzes.  Note:  No partial credit will be given for this question, please check your answers carefully.

2    Q2:   The  Oregon Health Insurance Experiment (OHIE) (15 points)

The Oregon Health Insurance Experiment was a randomized experiment run in the 2008 that expanded Medicaid to low-income, uninsured, able-bodied adults aged 19-64 in Oregon through a random lottery drawing. Eligible individuals interested in receiving Medicaid signed up for a lottery; winning the lottery (“treated”) provided an opportunity for the individual and up to two additional eligible household members to sign up for Medicaid. 12,229 individuals participated in a long-term study examining outcomes 2 years later.

In this question, you will work with data from the OHIE Experiment. You should use R to answer this question and append your code and output (or Rmarkdown output) as PDF to your submission. Failure to submit code and output will result in a 0 on this question.

Refer to the datafile OHIE.csv available on Canvas → Modules→ Problem Set 1. This file con- tains  12,229 rows, where each row is a survey response from a person in the experiment. The dataset on Canvas has the following variables:

* Note:  The  Framingham risk score is a function of age, total cholesterol and HDL cholesterol levels, measured blood pressure and use or nonuse of medication for high blood pressure, current smoking status, and blood sugar levels.

Please note that some outcomes have “NA” values if respondent data were unavail- able. When analyzing an outcome with an  “NA” value, simply exclude those rows from your analysis for that particular outcome. This also means that the sample sizes will be smaller for outcomes with “NA” values.

1. Fill in the following balance table. In Column (4), calculate the p-value using a two-sample t-test assuming equal variance. Recall, the test-statistic for this test is given by:

where t is distributed as Student’s t with NT  + NC 2 degrees  of freedom.   In terms of notation, YT  is the sample mean of the treated group, YC  is the sample mean of the control group, NT  is the sample size of the treated group, NC  is the sample size of the control group, sT(2) is the sample variance of the treated group, sC(2) is the sample variance of the control group.

For full credit, please code your significance test by hand, instead of using the built-in package t.test in R. You can use other basic functions like sum(), mean(), var(), and pt().  (3 points)

2.  Discuss your findings. Do these baseline characteristics appear balanced?  (2 points)

3.  Calculate the treatment effect of winning the Medicaid lottery and the statistical significance for each of the outcomes, filling out the table below. Discuss your findings–– What conclusions can we draw about the effectiveness of the Medicaid lottery program?  (3 points)

4. Let’s try redoing Part (3) using a simple linear regression.

For each of the outcomes in Part (3) above, run a simple linear regression of the outcome on a treatment indicator:

Yi = β0 + β1Treatedi+ ui

Compare to your results in Part (3) above.

For this question, we recommend using the lm() regression function in R and referring to the output in your answer.  (3 points)

5. In what ways might features of this experiment affect the external validity of the results, say, to thinking about expanding Medicaid to the entire U.S. population of low-income, able- bodied adults?(2 pt)

6.  Suppose instead of running an experiment, you could get health data on everyone  in the low- income, able-bodied adult population in 2008.  You compare the health outcomes of those with health insurance to those without health insurance.  Do you expect you will find similar results to Part (3)? Why or not?  (2 pts)