Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON7310: Elements of Econometrics

Research Project 3


Instruction

Answer all questions following a similar format of the answers to your tutorial questions. When you use R to conduct empirical analysis, you should show your R script(s) and outputs (e.g., screenshots for commands, tables, and figures, etc.). You will lose 2 points whenever you fail to provide R commands and outputs. When you are asked to explain or discuss something, your response should be brief and compact. To facilitate tutors’ grading work, please clearly label all your answers. You should upload your research report (in PDF or Word format) via the “Turnitin” submission link (in the “Research Project 3” folder under “Assessment”) by 10:00 AM on the due date June 1, 2022.  The marking system will check the similarity, and UQ’s student integrity and misconduct policies on plagiarism apply.1  Email submissions are not accepted.

Please do not wait until just before the deadline to submit your assessment. It is expected that you will allow yourself enough time to complete your assessment and submit it on time, allowing time for possible technical issues or submission problems.  In other words, please keep in mind the risk if you decide to wait until the last minute to submit your assessment. If you submit your assignments after the deadline, your mark will be deducted automatically based on the time stamp in the Turnitin system.

Since the lockdown started in Australia, many Australians lost their job.  The Australian government passed its JobKeeper package to reduce the unemployment rate in Australia. The longer this lasts, the higher the numbers of unemployment goes.  They want to know what kind of workers might lose their jobs during the COVID-19 health crisis. Specifically, are young workers more likely to lose their jobs than middle-aged workers? Does their education back- ground help them to keep their jobs?

Unfortunately, you have only one dataset (i.e. Project III Data.csv), which contains a random sample of 5,412 workers from the U.S. They were surveyed in 2008 after the global financial crisis of 2007-08 and reported that they were employed. The data file contains their employment status (i.e. employed or not) in 2009, one year later, along with some additional variables. A detailed description is given in the following table:


 

(a)  (10 points) Using a linear probability model (LPM) to regress employed on age and age2  and report regression results.  Was age a statistically significant determinant of employment?  Is there evidence of a nonlinear effect of age on the probability of being employed?

(b)  (15 points) Repeat (a) using a probit and logit regression model and report your results.

Explain the difference between probit and logit model.

(c)  (10 points) Using the models of LPM, probit and logit to compute the predicted proba- bility of employment for a 20-year-old worker, a 40-year-old worker, and a 60-year-old worker and fill the following table. Explain to differences in the results.

Table 1: Predicted Probability

LPM

Probit

Logit

P P

P

(employe1 |age (employe1 |age (employe1 |age

=

=

=

20)

40)

60)

 

0.916

0.730

 

0.832

 

0.911

(d)  (10 points) You d● n●t need to estimate MSPE (mean squared prediction error), but ex- plain how to use MSPE to compare the fits of the models (of LPM, Probit and Logit). Explain the difference between MSPE and MSFE (mean squared forecast error).

(e)  (15 points) The data set includes variables measuring the workers educational attain-

ment, gender, race, marital status, region of the country, and weekly earnings. Repeat (a) and (b) using these factors as additional regressors and construct a table (such as Table

11.2 in SW textbook) to investigate whether the conclusions on the effect of age on em- ployment from (a) and (b) are reliable or not. Use the regressions in your table to discuss the characteristics of workers who were hurt most by the financial crisis. [Hint: Include dummies for race groups and ln(earnwke + 1). We do this transformation to avoid the presence of ln(0).]

(f)  (10 points) What is simultaneous causality bias? Explain the potential for simultaneous causality in this study, such as the unemployment rate and age (or educational attain- ment). What is the solution for the simultaneous causality bias?

(g)  (10 points) What is the population of interest in this study? What is the population stud-

ied? How to assess the external validity of this study?

(h)  (10 points) Suppose you want to predict the unemployed rate using the dataset and the

number of regressor (or predictor) is large relative to the sample size. Can you use the leave-one-out cross-validation with ridge regression estimator and/or LASSO estimator in this study?  What is the purpose to use the leave-one-out cross-validation?  Please explain the difference between the ridge regression and LASSO.

(i)  (10 points) What is the purpose of AIC and BIC? Please explain the difference between AIC and BIC?