Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON 172 - Problem Set 2- Answer Key

Spring 2022

1    African Economic Development and the COVID-19 Pandemic

Based on the article as well as the course readings, lecture slides, and any additional materials you find relevant, briefly discuss how the COVID pandemic is likely to affect African economic growth and poverty reduction. Specifically:

• What did economic and social impacts look like over the past two years?

• What economic and political effects are likely over the next 5-10 years?

• Make sure to discuss at least three potentially important channels of impact, at least one of which is likely to be positive.

There are several ways to answer this question well. A good response will include a mininum of 3 channels (including a positive one) through which COVID may have affected long-term growth and development in Africa.  Either 3 channels per period or 3 channels overall are sufficient.  These may include some of the following ideas:

Economic and social impacts over the past 2 years

 

• Negative:

– A large increase in extreme poverty was observed in SSA (±40 million people), as well as in hunger. Overseas aid was reduced, which for some contries in the continent represent a big proportion of GDP. All of this, plus a dire economic situation, limited social safety programs, and a context of high poverty put populations on the edge. The latter, in combination with local and national elections being postponed, have resulted in less social stability and civil unrest.

– Some negative impacts on the economy, which have impacted the poor the most, have been seen in the form of hikes in prices due to inflation and global supply chain failure .  Unpaid incomes, massive firing, and an increase on unemployment, especially for younger individuals, have also affected economic growth in SSA. Additionally, the overall decrease in spending has implied less revenue for governments, and therefore the diversion of an even smaller pool of resources to cover previously existing needs in addition to the new ones resulting from the pandemic.

• Positive:

– SSA experienced a milder impact of COVID in regards to its spread and related deaths as com- pared to most of the rest of the world. This could be due to the combination of several factors such as a younger population, an effective public health response due to recet outbreaks (e.g. Ebola), and A more rural population.  As for economic impacts SSA experienced a smaller decrease in GDP compared to higher income countries (2.6


Economic and political effects over the next 5-10 years

 

• Negative:

– Economically, even though Africa experienced less impact according to available data, it is also expected to have a slower growth in the long-run.  This will increase the divergence in welfare with higher income regions.  For instance, later access to vaccines, less availibility to technology that would enable remote education, and a significanlty slower retaking of school activities could imply a considerable setback to human capital for years to come (you could analyze these effects through the Solow model).  More indebteness of national governments due to the need to put money into the economy and provide a safety net could also affect growth into the future.

– Politically, the pandemic has granted an opportunity for authoritarian governments to increase their exertion of power and surveillance, resulting in the erosion of democracy.  The prolonged effects could also put people on the edge in more politically unstable nations, or even incentivize insurgent movements due to bad handling of the pandemic.

• Positive:

– The neccessary adaptations that the public and private sector were forced to go through could set the foundation for a faster and easier transition into new technologies that enable growth.

 

2    Household  Cash  Transfers  and  Food  Security  in the  COVID Pandemic [6 points]

The impact of income on nutrition is an important topic in international development policy.  Starting in September 2020, thousands of households in Kenya received medium- sized cash transfers worth 600 Kenyan Shillings (valued at approximately US$12 in PPP terms) to assist them during the COVID-19 pandemic. The amount is equivalent to a couple of days of work for typical unskilled laborers in Kenya. These unconditional cash transfers were targeted to relatively poor households (in both rural and urban areas) and delivered via mobile money.  Approximately four weeks after the distribution of the cash transfers, the households were surveyed (by phone) and data was collected on economic and life outcomes, including some measures of food security, total spending, and household earnings, among many others. Importantly, before any cash grants were distributed, all households were also interviewed in a baseline survey round, and we can denote the baseline round time t=0 and the endline survey round t=1.

In reality, the program was designed as a randomized control trial (RCT), and the households receiving the COVID-19 cash assistance were randomly chosen. In this question, imagine that instead we only have data from the treatment households (cash=1), and not any of the control households, but we do have data on both survey rounds.  Below you will estimate the impact of the cash transfer on nutrition using data on treatment households, from both the baseline and endline surveys.

 

2.1     [2 points]

Discuss the econometric assumptions needed to make a pre-post-analysis (PPA) approach appropriate for understanding the impact of cash transfers on subsequent food security outcomes.

 

• Given that we seek to understand the effect of household income on nutritional outcomes, why is it important that we have access to data from both the baseline and endline survey rounds?

• How does the fact that the dataset cannot take advantage of randomization in the allocation of cash transfers across treatment households affect the estimation of treatment effects, and how might it lead to omitted variable bias? Please illustrate your points with the discussion presented in class, as well as any other relevant material, and be sure to include the equations from lecture that illustrate potential bias.

 

Example Answer:

For a Pre-Post analysis to deliver a causal effect, the main assumption we need satisfied is that of constant omitted variable  bias  over time.  In other words,  there  cannot be any unobservable variable that changes between the pre-treatment and post-treatment time periods and simultaneously affects the outcomes of interest. For some given  unobservable  u  and time  t,  we  would want  to  see  in  an  ideal world cov(u, t)  =  0  and cov(u, y) = 0.  Tied to this, we assume that nothing else in our time period of interest changes our outcome besides the treatment itself.

In a two period case, let t=0 denote the period before the treatment and t=1 denote the post-treatment period. If an unobservable u is correlated with y, then we need:

 

E[u|t = 0] = E[u|t = 1]

Having data on both baseline and endline is necessary for PPA because in this analysis we compare outcomes in the post-treatment period to  outcomes in the pre-treatment period.   In a more general note,  collecting data before the treatment is useful to inform researchers about the baseline population.   This can be used to  understand the magnitude  of treatment effects  and also  to  control for eventual baseline  differences in


observable characteristics.  Panel data also allows us to control for unit and time fixed effects.  As seen in the differences in differences analysis, using unit and time fixed effects is an useful tool to identify causal parameters.

Because the dataset only contains information on the treated household, we cannot use the randomization of treatment for our analysis.   Thus we are left to perform a Pre-Post Analysis to estimate the treatment effect.  If we had data on the control group, omitted variable bias would be eliminated if the treatment and control groups have similar baseline characteristics.  In our case, where we do not have the control group

variables correlated with the outcomes that are changing between the pre and post treatment periods. More formally, we can define the following model:

Yit = α + β ∗ Tit + dXit + eit

where Tit  is a dummy that takes value 1 in the post treatment period and 0 in the pre treatment period. Xit is a set of unobserved variables.

A pre-post analysis would take the average difference in outcome Y between periods 0 and 1.  We would arrive at the following expression:

 

E[Yit|t = 1] − E[Yit|t = 0] =          β

|{z}


+ d(E[Xit|t = 1] − E[Xit|t = 0])

|                                    {z                    }


Treatment Effect                                        OVB

If the OVB term is equal to zero, than PPA provides a causal effect of the treatment.

 

 

• In your view, are the required conditions likely to be met in the case of these COVID assistance cash transfers in Kenya?

Arguments can be made in for and against the conditions for PPA being met in our case study of the COVID assistance cash transfers in Kenya.  You will not be penalized for only arguing one side.

An argument supporting the causal interpretation of the effect estimated via PPA: The time difference between the pre and post treatments is relatively small.  It is reasonable to assume that in a four week period, not much will change for these families besides the cash treatment.  Thus whatever OVB we have will remain constant between the baseline and endline surveys.

On the other hand, it is also valid to argue that during the COVID crisis, there was an increased volatility of economic conditions, and a four week period can see large downturns in the economic situation of an area or even large positive recoveries in employment and earnings.  Then we would not be able to state that nothing else in our time period of focus could have changed our outcomes

Answers will be graded by how you articulated your answer and how you related it to economic theory and the econometric method.

 

2b

The dataset is a partial extract of data from the actual project,  where each observation  (row) in the dataset represents one household during one time period (“time”), and where the baseline survey round is denoted with time=0 and the endline round with time=1. Using the “lm” command, determine the average difference between households observed in the baseline round (time=0) and in the endline round (time=1) for each of the following two characteristics:  an indicator variable for whether the household respondent is married  (“married”),  and an  indicator variable  for whether the household resides  in an urban area


(“urban”).  (Consider these two characteristics one by one, that is, you should run two separate regressions here.)

 

• Report the regression output for the two regressions and interpret the coefficients.

• Please also discuss the standard errors and t-statistics. What differences (if any) do you observe, and why?

knitr ::opts_chunk$set(echo  =  TRUE)  ##  sets  global  option  to  include  code  chunks  in-line #install.packages("haven")  ##  only  run  once  to  install

library(haven)  #this  library  allows  you  to  load  datasets  in  Stata  format

#install.packages("tidyverse")  ##  only  run  once  to  install

library(tidyverse)

#install.packages("summarytools")  ##  only  run  once  to  install

#library(summarytools)

#install.packages("stargazer")  ##  only  run  once  to  install

library(stargazer)  ##This  package  is  great  for making  tables  in  .html,  .tex  and  many  other formats. #install.packages("broom")  ##  only  run  once  to  install

library(broom)

 

 

Table 1: Demopraphic Changes

Dependent variable:


married

(1)


urban

(2)


time

Constant


−0.024

(0.063)    0.435∗∗∗


−0.073

(0.055)

0.790∗∗∗


(0.045)                 (0.039)

 

Observations              248

248

Note:                      ∗p<0.1; ∗∗p<0.05; ∗∗∗p<0.01

Results for item 2b are reported in columns 1 (married) and 2 (urban) of Table 1. For both the married and urban variables we see negative, but insignificant coefficients.  We would interpret the coefficients as follows:

•  The average number of married individuals in time period 1 is 2.4 pp less than in time period 0.


•  The average number of individuals living in an urban area in time period 1 is 7.3 pp less than in time period 0.

Results show that these coefficients are no statistically insignificant, so we cannot state that there is a sig- nificant difference between periods 0 and 1 in both variables.  Using standard errors to construct confidence intervals for both of those coefficients, we see that 0 falls within the CI, indicating that the true value of this difference could be zero.  The T statistics are also less than our conventional levels of significance: t=-0.384 and t = -1.326 for married and urban respectively.

Observing no difference in these two variables is expected since they are less volatile characteristics.  That is, people do not often get married/divorced or move from an urban to a rural area. Since these are rare events, it is unlikely that we would observe a large difference in marriage rates or urban rates in a four week period.

 

2c

Determine the average change in terms of households’ nutritional status (“nutrition”) between the baseline survey (time=0) and the endline survey round (time=1). Since all of the households in this dataset eventually received the cash transfer, the cash treatment indicator variable  (“cash”) takes on a value of 1 for all households both at baseline and at endline, but recall that they received the cash between these two time points.  The nutritional status measure is an index of food security and is created by combining survey questions on the respondent and their household members’ numbers of meals eaten, number of days that they had to cut back on or skip meals in the last week, and number of days they went to bed hungry. (The variables take on a sign such that positive values denote better outcomes, i.e., fewer days going to bed hungry is associated with a more positive value in the index.)  Taken together, this index can be thought of as a summary measure of the household’s regular access to adequate food.  The index is measured in standard deviations from the mean of zero, and can take on either positive (better) or negative (worse) values.

• Estimate the difference in nutritional status again using the “lm” command in R. To do so, please carry out two regressions. In the first regression, estimate the effect of the cash transfer on nutritional status between the baseline round and the endline round without including any other explanatory variables. In the second regression, estimate the effect of the cash transfer on nutritional status while also including “urban” and “married” as explanatory variables.

• Report the results of these two regressions and interpret all coefficients. Under what assumptions do these analyses have a causal interpretation and reliably estimate the impact of cash transfers? Do you feel these conditions are likely to hold here? Why or why not?

Results for item  2c  are  reported in  Table  2.   The  results  show  a positive  coefficient that is  statistically significant at the 5% level.  Conditional on the assumptions of PPA holding, we would say that on average, the cash transfers increased a household’s nutrition on average by 0.184 s.d.

When we add the married and urban variables to the regression we see the point estimate of the time coefficient decrease slightly to a value of 0.172.  Although it now significant at the 10% level and not the 5%, it has a


Table 2: Effect of Cash Transfer on Nutrition

 

Dependent variable:

nutrition

(1)                     (2)


time      married urban

Constant


0.184∗∗

(0.088)

 

 

 

0.065


0.172∗

(0.089)

0.005

(0.089)

−0.170∗

(0.103)

0.198∗


(0.062)               (0.112)

 

Observations             248

248

Note:                  ∗p<0.1; ∗∗p<0.05; ∗∗∗p<0.01

 

t-statistic of 1.93 (compared to t=2.09 before), making it very close to significant at the 5% level. Although not significant, we did see a slight negative correlation between time and urban which could be driving this slight change.

The interpretation of the married and urban coefficients is as follows:

•  Holding all esle constant, individuals who are married have a nutrition index that is on average .005 s.d. higher than individuals who are not married (although this is not a signficiant coefficient).

•  Individuals  who  live  in  urban  areas  have  a  nutrition  index that is  on  average  .170 s.d.   less  than individuals who live in rural areas, holding all else constant

–  This result is a  bit puzzling as generally we see that individuals who  live in urban areas have higher standards of living. Perhaps because of the pandemic, more things were shut down in urban centers (both in period 0 and 1) and urban residents were not able to work as much and thus not be able to buy as much food for their families.  On the other hand, rural households tend to have small farms that could provide them food resilience to some extent.

If there is nothing else changing during the period for this sample of households that could also be affecting nutrition, these estimates provide causal effects of the cash treatment

As explained in 2a, you could make an argument that supports the validity of the PPA and one that rejects it.  On one hand it is a short time period, so it is unlikely that many things change during the period besides the treatment.  On the other hand you can argue that COVID times are highly volatile and a four week period is enough to have more thing changing besides the treatment.

 

2d

Estimate the difference in total household spending between the baseline and endline survey rounds, while also including “urban” and “married” as explanatory variables.

• Report the results of this regression and interpret all coefficients.

• Do these patterns in any way help make sense of the results in part c. above? Discuss why or why not.


 

Table 3: Effect on Spending

Dependent variable:

spending                  


time

married

urban

Constant


−3.020

(3.151)

17.896∗∗∗

(3.183)

30.894∗∗∗

(3.664)

4.651


(3.966)

 

Observations

248

Note:                  ∗p<0.1; ∗∗p<0.05; ∗∗∗p<0.01

You can find results in Table 3. We can see that the time coefficient is negative, small and not statistically significant. Thus we cannot reject the null hypothesis that the average difference in spending between post and pre treatment periods is different from zero.

Because there was no statement about currency or time frame of the spending question, let’s assume that the variable has been converted to USD and that spending is for a week long period. Then we can interpret the coefficients as the following:

•  Spending decreases on average between time period 0 and 1 by about 3USD, all else constant.

•  Married individuals spend 17.9USD more on average compared to unmarried indiviuals, all else con- stant.  This makes sense – if you are married you at minimum are spending for two people, will also probably have children to provide for, but may have two income streams.

•  Urban individuals spend 30.9USD more than their rural counterparts on average, all else equal.  This is what we’d expect as prices are higher in urban areas.

These results (particularly the coefficient in front of time, our variable of interest) are not what we would have expected after seeing the results in part 2c.  There we saw that nutrition increased over time since baseline and treatment.  It is reasonable to assume that the cash transfers would affect nutrition through spending. That is, households have more money so that they can spend more on food. However, in item d, we see that

spending does not necessarily increase with the treatment.  If spending is not increasing, then how/why does nutrition improve?

First, if spending has not increased that means households have either saved the money, or they spent imme- diately when they received it. If they spent it right away, then it would not show up in their weekly spending


measure when they are surveyed four weeks later. Perhaps they bought large quantities of nonperishable food (such as rice) and their sustained supply of that food has increased their nutrition outcome.

This is not the only correct answer and we accepted answers that provided a thoughtful, thorough argument.