Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit



Econ 351 001 – Barber


 

Q1.

a) Load the attached dataset

CRIME1.DTA

 

into Stata.

 

This dataset contains a sample from a population of young men in California born between       1960 and 1961 who have at least one prior arrest to 1986. The dataset describes the variables, but the dataset includes the following variables:

•    the number of times the individual was arrested in 1986 (narr86)

•    the proportion of prior arrests that led to conviction (pcnv)

•    the average sentence served for prior convictions in months (avgsen)

•     legal income in 1986 (inc86)

•    the number of month spent in prison in 1986 (ptime86)

•    the number of quarters (0 to 4) the person was legally employed in 1986 (qemp8)

•    whether the individual identifies as Black (black) or Hispanic (hispan).

 

Create a binary variable called "arrest" which equals one if the person was arrested in 1986, and 0 if the person was not arrested in 1986.

Use this newly created variable to run the following regression:

arrest=γ0+γ1black+γ2hispan+ϵ

 

Interpret the intercept, as well as the estimated coefficient on "black".

 

Test whether ethnic background has an influence on the probability of arrest. (4 marks)

 

 

b) Now run the following regression:                                                                                       arrest=β0+β1black+β2hispan+β4ptime86+β5qemp86+β6pcnv+β7avgsen+β8inc86+u Calculate the fitted values from this regression and report their summary statistics.   Do all the fitted values from this regression make sense? Carefully explain. (4 marks)

 

 

c) Replace the dependent variable in (b) with "not_arrested", where "not_arrested" = 1 if the person was not arrested in 1986 and "not_arrested" = 0 if the person was arrested in 1986.

What happens to the estimated coefficients? What about the standard errors and R2R2? Carefully explain why this is happening using the theory we have learned. (4 marks)

d) Using your regression from (c), test whether quarters of employment and average sentence are jointly significant at 5%. Carefully indicate your null and alternative hypothesis, indicate      how you calculate your test statistic, and use Stata to come up with a conclusion about your     test. (3 marks)

Q2.

a) We are interested in determinants of university GPA and have the following dataset:

gpa2.dta

Run the following regression:

colgpai=β0+β1sati+β2femalei+β3athletei+β4athletei×femalei+u

 

Use your results to sketch out (by hand) the sample regression function for each possible group on the same diagram. (4 marks)

 

 

b) Run the following regression:                                                                                               colgpai=β0+β1hsizei+β2hsize2i+β3sati+β4femalei+β5athletei+β6athletei×femalei+ui

What is the effect of high school graduating size on GPA? Graph the relationship. Do you think this relationship makes sense? Carefully explain. (4 marks)

c) Drop sat from the regression. What happens to the coefficient on athlete? Carefully explain. (4 marks)

d) Using the results from (c), does the effect of being an athlete differ by gender? Carefully explain. (3 marks)


 

Q3.

The Bard Prison Initiative is a program run by Bard College that provides those in prison with an opportunity to take college courses and earn a degree in several prisons in New York State.

Imagine that the Governor of New York is considering expanding the program to all prisons in the state, but wants to know if the program is effective in raising wages for those released, as well as if it reduces recidivism.

Suppose you have information on 1200 individuals who were released from prison in 2010. 600 of these individuals chose to complete degrees through this Bard Prison Initiative program          while 600 did not choose to participate. Some of these individuals were convicted of crimes        since being released and are back in prison.

In addition to program participation and whether the individual was convicted of a crime again, suppose you also had information on yearly wages, experience, age.

Answer the following questions:

 

I) Write out a regression that would measure the impact of the program on wages, controlling     for age and experience. The regression you write out should allow you to make statements such as "a one-year increase in age changes wages by _ %..." and allow diminishing returns to               experience.

II) Write out a model that would measure the impact of program participation on recidivism, controlling for age and experience. Make sure to explain what your dependent variable is.

 

III) Interpret the coefficient on program participation in each of your regressions. Is sample          selection (self-selection) a potential issue here? Why/why not? If yes, how do you think it would influence the results of each of the regressions? Carefully explain.

 

(6 marks)