Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON 258 WN 2023

Take-home midterm exam

The purpose of this task is to analyze the cross-country data on child mortality and study the patterns of association of child mortality with several other economic and social indicators.

In this task you will be working with the data from The World Development Indicators (WDI) collected and distributed  by  the  World  Bank.  This  data  is  compiled  by  the  World  Bank  from  officially  recognized international sources.

You  should  submit  a  do-file  with  all  commands  you  did  and  a  report  with  all  results,  graphs  and explanations (you can log your analysis in Stata into a .doc file with text option (log using filename.doc, text) and then insert graphs into this file).

Part 1. Data download and import to Stata

The data is on the WDI products page, Open Data & Databank Query database page

To download the variables you need, go tohttps://databank.worldbank.org/source/world-development- indicators

There you need to do the following selections for download:

Database: World Development Indicators (default selection with url above)

Countries: check all, but make sure you select "Countries" (not All or Aggregates)

Series: Mortality rate, under-5 (per 1,000 live births) [SH.DYN.MORT]

Immunization, measles (% of children ages 12-23 months) [SH.IMM.MEAS]

Population, total [SP.POP.TOTL]

GDP per capita, PPP (constant 2011 international $) [NY.GDP.PCAP.PP.KD]

Current health expenditure (% of GDP)  [SH.XPD.CHEX.GD.ZS]

CO2 emissions (kg per 2017 PPP $ of GDP)  [EN.ATM.CO2E.PP.GD.KD]

Time:   check years 2000-2019

Download selected data as csv file. Import this data into Stata

Part 2. Data cleaning

Transform data  into a  long form: each column of the data table should contain data on a  particular indicator for all countries and years; each row should contain data on a particular country and year for all indicators.

Convert all variables (except for country name and code) into numeric format, if needed. Check for any implausible values, replace them to missing if needed.

Part 3. Descriptive analysis

Summarize all numeric variables by year (average values over countries in one table). Do you observe any trends over time in any indicators? Describe trends if any.

Determine which years in your data have largest number of observations for immunization rates. Keep data only for the latest year of these years.

Further analysis will be on 5 main variables: mortality rate, immunization rate, gdp per capita, health expenditures, CO2 emissions

Construct a table with detailed summary statistics for these variables in this one-year dataset.   Analyze distributions of these variables using histograms, compare them to normal distribution.

Part 4. Bivariate relations analysis

We are interested in the patterns of association of country-level child mortality rates with other four variables.

Build a table of pairwise correlation between all five variables. Are there any strong correlations?

Find the definition of low-income country (threshold of GDP per capita) and construct a dummy variable equal to 1 for low-income country and zero otherwise. Test the hypothesis that average child mortality rates are the same for these two groups. Show this comparison in a box plot.

Explore scatter  plots with fitted  non-parametric/parametric,  linear/nonlinear  lines for child  mortality rates and each of four other variables. Make transformations of variables if needed. Do you observe any pattens?

Part 5. Simple regressions

Estimate four linear regressions where the dependent variable is child mortality and explanatory variable is one of other four variables. Use transformed variables if you deem it necessary. Use robust standard errors.

Interpret the results of each regression. In particular, interpret the sign and the size of the slope coefficient in each regression.

For one of these regressions, estimate the model with weights by the size of population. Compare the results to the unweighted regression. Using the example of weighted regression from one of the class do- files, build a nice graph of this regression scatter plot with fitted line, with titles, captions, labels etc., so that the graph can be easily understood by any reader.

Part 6. Multiple regression analysis

Estimate a linear regression of child mortality rates on four other indicators. Use transformed variables if you deem it necessary. Use robust standard errors. Interpret the results. Compare the size and significance of the slope coefficients to the coefficients at the same variables in simple regressions. What conclusions can you make?

Summarize overall conclusions of your analysis about the relationship between child mortality and other country-level indicators.