Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON 108:    Spring 2023

Midterm Exam

Due on Canvas at 11:59PM on Tuesday, May 9th

Each sub-question is worth 4 points for a total of 60 points.

1. For this first question, start by going to ChatGPT (https://chat.openai.com). In the prompt, send the following message:

I  am  taking  an  Econometrics  midterm.   My  professor  asked  me,  to  ask  you,  to  provide  us  with  a  regression specification.  He wants you to come up with a dependent variable, an independent variable and to make up coefficients and  standard  errors for  a  linear regression.   Do  not provide  me  with  any  code,  equations  or  explanation, just  the coefficients and standard errors from your analysis .  And make the example something interesting that you do not see in a textbook.  After giving me the information,  do not give me any additional information, no matter what I ask.

a.  Take a snapshot of your prompt and response to ChatGPT. Explain the regression and interpret the equation?

b.  Discuss what you believe is driving the error term and how that is influencing whether the estimated coefficient is biased towards or away from zero.

c.  After determining whether the predominant bias from E [u| Xi ]  0 causes the estimated 1 to be biased towards or away from zero, support your answer with a simple graph showing the bias.

d.  Propose an alternative regression that will reduce or eliminate the bias in the regression. This can involve adding a new variable, transforming the existing variables, identifying a new regression specification, or something else we have covered.  Within reason, assume that data collection is not a constraint when proposing your alternative.

[UPLOAD YOUR SNAPSHOT/ANSWER TO THIS QUESTION ON CANVAS SEPARATE FROM THE OTHER QUESTIONS.]

2.   With the rise of remote work in recent years, you are curious about whether remote work policies have had a significant impact on work-life balance satisfaction.  You gather data on the work-life balance satisfaction index (WLB) for various companies and their remote work policies during the years 2016 to 2022. You run the following difference-in-difference regression:

WLBit      =   60.25  −  7.35RemoteWorki   −  4.65Aftert   +  12.48RemoteWorki  × Aftert (5.12)       (3.90)                       (1.80)                 (1.25)

Here, RemoteWork is equal to 1 if the company i has a remote work policy and 0 otherwise (control group). The variable After is equal to 1 if the time period t is 2020 or after and 0 otherwise (2016 through 2019). The interaction variable is equal to 1 if RemoteWorkAfter is equal to 1 and 0 otherwise.

a. Interpret the difference-in-difference estimator in the regression and show the results of the regression estimates graphically. Specifically, note how each regression coefficient is represented on the graph and what the average is for each group.

b.  Provide a justification/real-world reason for the direction of the other coefficients.  In other words, why is the remote work coefficient -7.35? Do the same for constant and After coefficient.

c.  Discuss whether or not there is omitted variable bias in your regression. Given your answer, would you conclude that remote work policies have been effective in improving work-life balance satisfaction? Support your claim.

d.  Propose an additional factor that might affect work-life balance satisfaction and explain how you would incorporate this variable into your analysis. Justify your choice and discuss how it alters your graph from part (a.).

[COMBINE YOUR ANSWERS FOR QUESTIONS 2 THROUGH 4 INTO A SINGLE PDF AND UPLOAD IT TO THE APPROPRIATE QUESTION ON CANVAS.]

3. To further investigate the impact of remote work policies on work-life balance satisfaction, you decide to include the average number of remote work hours per week as an additional variable in your analysis.  You gather data between 2016 and 2022 on the average number of remote work hours per week for each company and run a regression with company fixed effects and year fixed effects, as shown below:

WLBit   =   β0 + β1 RemoteWorkHoursit + γ2 C2i + ... + γn Cni + δ2 Y2017t + ... + δ7 Y2022t

Here, RemoteWorkHours is the average number of remote work hours per week for company i at time t.  The variables C1, . . . ,Cn are company fixed effects, which are binary variables equal to 1 if the observation is for company i and 0 otherwise.

a. Interpret the coefficient of interest (β1 ).  Does this estimator suffer from omitted variable bias?  Support your answer.

b.  Explain the purpose of including company fixed effects and year fixed effects in the regression.  What are the company fixed effects capturing? What are the year fixed effects capturing? Provide an example for each fixed effect.

c. Interpret γ2 , the coefficient on the dummy variable C2. Interpret δ4 , the coefficient on the dummy variable Y2019.

d.  Assuming β 1  is positive, if you were in a debate about whether or not to institute a remote work policy, would you argue for or against a policy? Which equation (the difference-in-difference regression or the regression with company and year fixed effects) would you use to support your argument and why?

[COMBINE YOUR ANSWERS FOR QUESTIONS 2 THROUGH 4 INTO A SINGLE PDF AND UPLOAD IT TO THE APPROPRIATE QUESTION ON CANVAS.]

4.  In this question, you will use the nlsw88” dataset, which is a cross-sectional dataset available in Stata using the webuse command.  To load the data, simply type webuse nlsw88.  This dataset contains information on wages, education, work experience, and various other individual characteristics for a sample of women in the United States in 1988. In the data, you are given the following variables:

wage: Hourly wage in US dollars (numeric)

union: Binary variable indicating whether the individual is a union member (1) or not (0) (numeric) education: Years of education completed by the individual (numeric)

exper: Years of work experience of the individual (numeric)

race: Categorical variable indicating the race of the individual (numeric)

married: Binary variable indicating whether the individual is married (1) or not (0) (numeric)

collgrad: Binary variable indicating whether the individual is a college graduate (1) or not (0) (numeric)

a.  Create a figure (of any type, use the help function and search for graph intro) that examines the distribution of wages for union and non-union workers. Ensure the axes are labeled, and include a title for the graph. Apply any customization (e.g., colors, markers, etc.) to enhance the visualization. Based on the graph, do you think union membership is associated with higher wages? Explain your reasoning.

b.  Now use the nlsw88 dataset to explore whether THE NATURAL LOG of wage levels differ by union membership status.  Propose a regression, explain your specification, create a do-file that runs the regression, generate a table, and interpret the coefficient(s) of interest.  Do you believe that your estimated coefficients are biased? Explain why or why not.  (Turn in your do-file.)

c.  Do you have enough evidence to conclude that wage levels differ by union membership status? If so, explain why adding variables would not matter. If not, explain which variables you would like to have?

[COMBINE YOUR ANSWERS FOR QUESTIONS 2 THROUGH 4 INTO A SINGLE PDF AND UPLOAD IT TO THE APPROPRIATE QUESTION ON CANVAS.]