Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Health Economics

Economics 368

Empirical Exercise #1

Fall 2023

Due Date: To be submitted through Course Site before Thursday, September 28th, at 12:10pm.  Assignments handed in late will be penalized at a rate of 25% per day, including weekend days.

Format:  Please hand in a single document containing the relevant STATA output that has been

annotated with your typed answers to the questions below (There is no need to re-format the

STATA tables or estimation output; simply cut and paste them into your answer document). In

addition, please hand in a copy of the STATA log file for your program. Both documents must be     converted to .pdf format for submission (otherwise you will not be able to upload them to Course Site). While it is permissible to work with other students in the class on this assignment, you must   write your own STATA code and answers.

Link to LUApps to access STATA: https://lts.lehigh.edu/luapps

General MEPS references

Documentation file: https://meps.ahrq.gov/data_stats/download_data/pufs/h181/h181doc.pdf Codebook: https://meps.ahrq.gov/data_stats/download_data/pufs/h181/h181cb.pdf

1)   The importance of weights and the svy adjustments

a)   Compute the means of the variables, white, black, hispanic and other_race using the      “mean” command without using survey weights. Now re-compute the means using the MEPS survey weight perwtyf. What difference does using the weights make for your

conclusions about the racial/ethnic composition of the U.S.? Why?

b)   Compute the mean of real total medical expenditure without any adjustments, and then

re-compute the mean after adjusting for the survey weight. What difference does using the weights make for your conclusions about the average level of medical spending in the U.S.? Why?

c)   Use the svyset command to set the PSU variable, survey weight and the strata variable. Now use the svy prefix to the mean command to re-compute the standard error of the

mean of total medical expenditures. How does the standard error change? Why? Without adjusting the standard errors for the complex survey design of the MEPS, what might you  erroneously conclude about the statistical precision of the estimated mean?

Now that you see the importance of survey weights, use them when creating statistics in the rest of the assignment unless otherwise indicated

2)   Trends in insurance coverage [In order to answer the questions in this section you will need to do some reading online about the Affordable Care Act (ACA). I recommend Wikipedia as a

source]

a)   Make a table showing the trend in both Medicaid enrollment and Medicare enrollment by    year, where your measure of enrollment in the proportion of the population enrolled in the given program [Stata command: “table”]. The enrollment trends in these two government insurance programs are similar, but for different reasons. What do you think explains the trends in both Medicaid and Medicare enrollment from 2009 – 2021?

b)   Add columns to the table you produced in part a) for the proportion of individuals who are uninsured and the proportion of the individuals who are enrolled in private insurance.

Taking your results from both parts a) and b) into account, what do you think is responsible for the (nonlinear) trend in the rate of uninsurance that you observe? Does there appear to be a shift in the sources of insurance coverage across the population? If so, why?

c)   Referencing the table you produced in part b), did any provisions of Tax Cuts and Jobs Act of 2017 affect rates of private insurance. If so, how and why?

d)   Make a table that shows the proportion of uninsured from 2009-2021 for four separate

poverty categories. There is a variable on the dataset called povcaty that contains five

poverty categories  its definition can be found in the MEPS documentation:

https://meps.ahrq.gov/data_stats/download_data/pufs/h181/h181doc.pdf  ]. Create a new  variable called povcaty2 where you have collapsed poverty levels 2 (near poor) and 3 (low   income) into one category, and use povcaty2 as the column variable in your table. What do you observe about the average level of uninsurance across the poverty categories? What     about the change in the rate of uninsurance from 2009 – 2021 over the data range across    poverty categories?

e)   Create a new variable called “agecat” that is =1 if the individual is less than 21 years old, and =2 is the individual is 21 or older. [Use the Stata command generate to create the

indicator for children/young adults, and then the command recode to complete the

variable coding]. Now create a table similar to the one in part d), but by age category

instead of poverty category. What do you find regarding the average level of uninsurance   across these two age groups? What likely explains this? What about the change in the rate of uninsurance from 2009 - 2021 over the data range for the two groups?

3)   Medical spending for different demographic groups

a)   First, examine medical spending by education levels. In order to do this you need to create one categorical variable for different education levels in order to easily display the results.  Call this variable educ_cat and use the generate command to set the lowest level of

education (less than high school education) =1. Then use the recode command to set the higher levels of education to the values 2 through 5 (high school diploma, some college,

bachelor’s degree, graduate school). When you create this variable use the binary variables for degree levels, not the continuous years of education variable. Finally, display the

average level of total medical expenditures (totexpy_r) by education level using the table command [Note: You don’t need to display medical expenditures by year and education   level, just by education level]. What do you observe about the trend in medical

expenditures as education levels increase? Is the trend you observe consistent with the conclusions of the Grossman model?

b)   Using the “if” statement, re-create the table in part a) only for individuals living in

households where family income per adult equivalent is greater than $85,000 (approx. The 90th percentile).  Is the trend you observe for high income individuals more or less

consistent with the conclusions of the Grossman model than the result from part a)?

c)   Recode the educ_cat variable to combine categories and focus on just the higher levels of   education. In particular, recode values 1 or 2 of educ_cat to missing. Also, combine the top two categories by recoding the value 5 to 4. Now, using the if and the “&” statements, re-create the table in parts a)/ b) only for individuals living in households where family     income per adults equivalent is greater than $85,000 who also have private health

insurance, are between the ages of 25 and 54, and are working in a “white collar

profession”. Is the trend you observe for these individuals more or less consistent with the conclusions of the Grossman model than the results from the two previous tables? Why?

d)   Now consider the relationship between medical spending and income. For this part of the analysis you will estimate a simple regression line where the outcome variable is total

medical expenditures, and the regressors are 1) income, and 2) income squared divided by   1,000. The income variable on the file is the full income per adult equivalent (fincpe), which adjusts for household economies of scale. First, use the generate command to create the      square offincpe and divide by 1,000. Next, estimate a linear regression with the reg

command with survey adjustments. Based on the signs of the coefficients for income and income squared, is the relationship that you find consistent with a “fast lane” effect or

“health spa” effect? Why? (Don’t worry about the statistical significance of the individual coefficients because there is multicollinearity between income and its square.)

4)   The financial burden of medical care costs [In order to answer some of the questions in this   section you will need to do some reading online about the Medicare and Medicaid programs.

Again, I recommend Wikipedia as a source]

a)   In this section you will examine the financial burden of medical care costs on U.S. families.  The first step is to compute a measure of burden, which we will call “burden”. Specify the   variable burden as the total amount paid out-of-pocket for medical care (totslfy_r) divided  by family income per adult equivalent. Look at descriptive statistics for this variable using    the summarize command with the detail” option. In order to incorporate the weights into summarize you must use aw=” (as opposed to pw=”). What do you observe about the distribution of financial burden?

b)   Using the table command, create a table of average financial burden by poverty status using povcaty2. Do the estimates conform to your expectations? Why?

c)   Now create a table for burden by insurance type (use the variable insur) that applies to

only those in the lowest poverty category. Report the median as well as the mean burden.   Comment on the difference between the mean and median estimates  what explains this   difference? Discuss the difference in financial burden for the poorest U.S. individuals across the four categories of insurance. What do you think explains these differences?

d)   Finally, replicate the table you created in part c) for people with and without heart disease (anyheart). Explain what you find and why.