Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Applications of Econometrics

Assessed Group Project

Spring 2023

Due: 4pm, Thursday 23 March 2023

In this project we study two aspects of fertility that have been the focus of a lot of research in economics. In the first part we are interested in learning whether there is a relationship between fertility (how many children people have) and the business cycle.  In the second part, we want to know whether there is a relationship between income and fertility.  As you will see below we will approach these questions quite casually in this project because the focus is on applying the empirical methods we cover in this course.  The goal is not to follow the state-of-the-art literatures in this area. That’s reserved for dissertation-type work.

The dataset we use in this project is from the United States. Namely we will use the current population survey (CPS), a standard source for statistical analysis in the U.S. The CPS is a survey that interviews a cross-sectional sample representative for the U.S. population.  We will use the ASEC annual supplement of the CPS, so we refer to our dataset here as ASEC-CPS. From this dataset we will create a yearly time series and a state-year panel.   Alongside this document you will nd two extracts from the ASEC-CPS. These contain all you need for this project, but if you want you can add additional variables/years from the raw data.  We show you how to do this below under Obtaining CPS Data’.  This is optional.  Don’t expect a better mark just because you add additional variables/years.

All parts of the project carry equal weight.  Groups have to submit a word/pdf le that has answers to the questions below along with a dofile that has all the commands in it that the group used.

●  Both the word/pdf document and the dofile have to be submitted before the deadline.  Projects sub- mitted without a dofile will incur the default penalty of a late submission.

●  Answers to questions should be limited to 3 pages per question (1-2 pages is likely enough). This means a total maximum of 7x3=21 pages. This is a maximum, not a guideline.

●  The dofile should be written in such a way that anyone with access to the raw data les can replicate the analysis.

●  Stata outputs (tables/figures) have to be included in the document. It is not enough to refer to outputs that are only included in the Stata log/dofile.  If a result isn’t shown in the pdf/word document it doesn’t count.

●  Before submission groups have to declare that the project is their own work. There is no separate form to complete, it can be done directly on Learn.

●  Make sure that you are aware of the requirements for appropriate citation of references and data sources. Read the guidance on plagiarism in Section 4.4.1 of the Economics Honours Handbook and/or the general University guidance.   If you include anything from another source it must be properly acknowledged, whether it’s a gure/table or a text passage or anything else.

● You are welcome to ask questions on piazza or come to helpdesks.  We will try to help as much as possible with data preparation and stata commands and are of course happy to clarify where things are unclear. Topical questions we will typically not answer to be fair to all students.

NB: You are allowed to complete this project in R instead of Stata. You have to submit your R code alongside the word/pdf document instead of a Stata dofile. But be warned that we can’t provide full support for R. It is your responsibility/risk if you don’t know how to do something we ask below in R. We also don’t provide an R le for the CPS. You have to gure out how to import the dataset into R.

Time Series Questions

For this part you have to aggregate the ASEC-CPS data to a yearly time series. We will use three variables: ’children’, ’unemployed’, and share_married’. To get the number of children we will use the number of own children under age 5 in the household, but only for women age 15-45.  To get the unemployment rate we will use the share unemployed among prime-age (age 25-54) individuals who are in the labour force. To get

the share married we will use the share currently married and not separated among all individuals age 18 or

older. You can use the dataset we provide where the three variables have been generated already and we have also collapsed into a yearly time series.  So you are good to go using part1_timeseries .dta. You can also prepare the dataset yourself. See Obtaining CPS Data’ below for details on how we created this dataset.

1.  Plot the time series for children’ and unemployed’ over time. Make sure you label the axes correctly. Then run a simple regression of children’ on  unemployed’.   This could approximately capture the relationship between fertility and the business cycle. Interpret your ndings.

2.  One potentially important control variable in the relationship between fertility and the business cycle is the share married.  Run a regression of children’ on unemployed’ including share_married’ as a control variable. Compare your results to (1) and discuss why they might be different.

3.  The regression in (2) might give us biased and inconsistent coefficients if there are trends in the variables we are using. Investigate this issue and run a regression that addresses this concern if you nd that it could be important. Discuss your results.

4.  The regressions in (2) and (3) might still give us biased and inconsistent coefficients and/or standard errors.  It could be due to the presence of nonstationary dynamics  (e.g.  unit roots) and stationary dynamics  (e.g.   autocorrelation) in the error terms.   Investigate this issue and run regressions that address this concern if you nd that it could be important. Discuss your results.

Panel Questions

For this part we are creating a state panel from the ASEC-CPS. Time is still in years.  A state is now a panel entity.  We will collapse our survey to state-year averages.  We will again use the variables children’ as a proxy for fertility.  We will also use lnincome’ (natural logarithm of median household income in the state) as a proxy for lifetime income in the state.  For control variables we have made available the number of survey respondents as a proxy for population and the share_married’ and share_women’ variables as controls. The dataset part2_panel .dta on Learn contains all of this ready for analysis. See Obtaining CPS Data’ below if you want to do the preparation yourself, for example to add additional variables/years.

5.  Plot children’ against lnincome’ for the year 2022 using a scatter plot where one dot is the average in a state in 2022.  Try to add a regression line to highlight what the overall relationship looks like in

2022. Make sure that the axes are labelled. Briefly state what you nd. Then provide some descriptive statistics for your sample by reporting the mean, minimum and maximum of key variables (’children’, ’lnincome’).  It would be good to include descriptive statistics for the control variables you use in (6) below. Make sure you provide clear indications of what you are reporting. This means do not include any raw variable names in the table. Instead, use a descriptive label like avg. number of children below age 5’.  Hints:  sdd help  scatter eor gdlp on gow to procubd sb_ttdrplots.  sdd help  lfit eor gdlp on gow to plot _ rdfrdssion lind )fttdc v_luds) .  You b_n bomaind two fr_pgs in ond twow_y, sdd help  tw . In tgis gudstion eorm_ttinf is dspdbi_lly import_nt so m_kd surd your t_alds/ffurds _rd bld_rly l_adlldc _nc sdle dtpl_n_tory.

6.  Estimate the relationship between fertility and income by pooled OLS (pooling all years) controlling only for the year of the survey.  Then estimate a second pooled OLS regression adding your choice of control variables. Interpret your results and compare them to the simple regression in (5).  Hint: somd v_ri_alds tg_t mifgt ad suit_ald _s bontrols _rd  (sg_rd  m_rridc(,  (sg_rd  womdn( _nc popul_tion in tgd st_td.  You g_vd _ proty eor popul_tion in tgd (pop( v_ri_ald. It woulc proa_aly ad fooc to inblucd tgis in lof eorm ie you cdbicd to usd it. It is your bgoibd wgibg oe tgosd you w_nt to inblucd )you b_n _lso pl_y _rounc witg cifdrdnt bomain_tions) _nc you _rd wdlbomd to inblucd _ccition_l v_ri_alds ay prdp_rinf tgd dttr_bt yoursdle.

7.  Estimate the relationship between fertility and income using the xed effects estimator and the first differences estimator with the same controls you chose in (6). Interpret your results and compare them to your results in (6). Discuss whether FE or FD might be more appropriate here.

Obtaining CPS Data

In this section we provide basic instructions how to download the dataset and make it ready for analysis. We are using the IPUMS version of the CPS, specifically the ASEC annual module (always conducted in March). You can nd details on this dataset here: https://cps.ipums.org/cps/. If you want to download your own sample you have to create an account (’register’ at the top right). Click on apply for access’, then fill out the form. Here’s my screenshot. I think it is totally ok if you copy my general research statement.

 

After you have registered you can start selecting your dataset.  Go to https://cps.ipums.org/cps/, click on ’Get Data’ in the orange box, then make your choices. I would suggest to only select the ASEC-CPS as a start. To do that click on Select Samples’, then untick All Default Samples’, then select the years, e.g.

2020s, 2010s, 2000s and 1990s. Heres how my screen looked:

 

Then you have to select variables. I chose for instance the number of children below age 5. You can nd this variable under Person->Core->Family Interrelationships:

 

We also selected the following variables:  age, sex, empstat, marst, hhincome, statefip.   Once you are finished with selecting variables and years you can click on view cart’. Make sure all the variables and years are there. Then click Create Data Extract’ and put a name for the extract. Once it is completed you should see something like this:

 

You then have to download both the raw data by clicking on  Download  .DAT’ as well as the Stata command le by right-clicking on STATA’ and selecting Save link as...’  (or equivalent in your browser). Make a note of where you downloaded those two les.

Next, we run the command le to get the dataset into Stata:

Then all that remains is defining our variables and collapsing to year averages for the rst part of the project:

For the second part we collapse to the state-year level to get a panel dataset: