Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Econ1150-PS2

Due: Wednesday February 15, 10:30AM

1.  Suppose a new standardized test is given to 100 randomly selected third-grade students in New Jersey. The sample average score  on the test is 58 points and the sample standard deviation sY  is 8 points.

(a)  The authors plan to administer the test to all third-grade students in New Jersey.  Construct a 95% confidence interval for the mean score of all New Jersey third graders.

(b)  Suppose the same test is given to 200 randomly selected third graders from Iowa,  producing a sample average of 62 points and sample standard deviation of 11 points.   Construct a 90% confidence interval for the difference in mean scores between Iowa and New Jersey.

(c)  Can you conclude with a high degree of confidence that the population means for Iowa and New Jersey students are different?  (What is the standard error of the difference in the two sample means? What is the p-value of the test of no difference in means versus some difference?)

2. You are interested in studying the factors that influence a person’s decision of whether to go to college. Therefore, you have collected data from 3796 high-school graduates, 6 years after they graduated from high school.  You can assume you have an iid sample.  In particular, you observe their total years of education (yrsed), which ranges from 12 to 18, and whether or not at least one of their parents graduated from college.

(a)  Out of the 3796 people in your dataset, 954 have at least one parent who graduated from college. The average years of education  (yrsedc ) for this group is  14.8 years with a sample standard deviation  (sc ) of  1.74.   The remaining  2842 people in the sample have parents who did not graduate from college. In this group, the average years of education (yrsednc ) is 13.5 years with a sample standard deviation  (snc ) of 1.72.   Using this information,  construct 95% confidence intervals for the population means of years of education for each group.

(b)  Using a 1% significance level and the information in the setup of part a), formulate and conduct a test of the null hypothesis that there is no difference in the mean of yrsed between the two groups of people.  (You may assume that the two population variances are equal).

(c)  Now, again using a 1% level of significance, repeat the exercise in part b using a one-sided test (where the alternative is that the mean of yrseduc is greater for people for whom neither parent graduated from college). What do you conclude now?

Now, let’s analyze the data using a univariate regression. Using the same data set, you construct a dummy variable (parcol), which is equal to 1 if at least one of the person’s parents graduated from college and 0 if not.  The following simple regression was estimated using data on all n = 3796 people:

yrsed = β0 + β1 . parcol + u

yrsed = (103(3.)2(5) + (10(.)6(3)5(0) . parcol,    R2  = .095

(d) What is the interpretation of the constant in this regression? Does it have a meaningful interpre- tation in this model?

(e) What is the interpretation of the slope in this regression?  Using the regression results, what is

the predicted mean of yrsed for people with at least one parent who graduated from college?

(f)  Repeat the hypothesis test in part b) using the regression results.  Do your conclusions change? Should they?

In addition to the information on parent’s college status, you have also collected information on the distance to the nearest college (dist) in 10’s of miles (dist has a range of 0 to 16). You decide to run another regression, this time using dist as the regressor. Here are the results:

yrsed  dist,    R2  = .01

(g) What is the interpretation of the constant in this regression?  What is the interpretation of the slope? Is the slope statistically significant at the 5% level?

(h) What is the interpretation of R2  in this regression?  Does the low value of R2  imply that the coefficient on dist is not statistically significant at the 1% level?

(i)  Using the regression results, what is the predicted mean years of education for a person who lives

13 miles from the nearest college?   How about a person who lives 100 miles from the nearest college?

(j)  Construct a 95% confidence interval for the expected decrease in mean years of education associ- ated with moving 20 miles farther away from the nearest college.