Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

SPRING 2022 - ECONOMETRICS

ECON-SHU 9301 F01

PROBLEM SET 3

MULTIPLE CHOICE SECTION

For open questions, please provide all relevant answers or calculations and conclusion.  For the multiple choice questions, please pick one answer and provide at least a one sentence explanation.

1.  (5 points) What is the consequence of not rejecting the null in a test of overall significance of a regression?

(a) β0 , β1 ,... βk  are not significantly different from zero for x1,...,xk  explanatory variables. (b) All t-tests performed on individual coefficients will also reject the null.

(c) We do not have evidence that any of the regressors can explain the variable of interest.

None of the above.

2.  (5 points) Suppose a total of n = 9 measurements are to be taken on a simple linear model, where the xs will be set equal to 1, 2,..., 9. If the estimated variance of the coefficient is 0.07, what is the probability that the estimated slope will be within 1.5 units of the true slope?

3.  (5 points)  Recall questions 5 and 6 about the nuclear plant in the state of Washington from Problem Set 2. Set up and carry out an appropriate hypothesis test for the contamination data given in these exercises.   Let ↵ = 0.05.  Justify your choices of H0  and H1 .  What do you conclude?

4.  (6 points)  Derive a formula for a 95% confidence interval for β0  if the sample size is n and in the simple linear model Yi  = βˆ0 + βˆ1Xi + ui,  i = 1 ...n assuming to know the variance of the random disturbance. Suppose assumptions SLR.1-SLR.5 from Wooldridge hold.

5.  (5 points) Suppose you run a simple regresson model and you obtain estimator βˆ1  (β1  is the population parameter).   Does it make sense to compute a confidence interval for βˆ1?   If β1 represents the return to education seen in examples in class, how would you interpret a 95% confidence interval?

6.  (6 points)  Insect flight ability can be measured in a laboratory by attaching the insect to a nearly frictionless rotating arm with a thin wire. The "tethered" insect then flies in circles until exhausted. The nonstop distance flown can easily be calculated from the number of revolutions made by the arm. The following are measurements of this sort made on Culex tarsalis mosquitos of four different ages.  The response variable is the average distance flown until exhaustion for forty females of the species.

Age, x (weeks)   Distance Flown, y (thousand meters)

1                                       12.6

2                                       11.6

3                                        6.8

4                                        9.2                             

Estimate the coefficients of a simple linear regression to these data and test that the slope is

7.  (5 points) Construct a confidence interval for β1 from Question 6 with 95% confidence. Interpret the results. Calculate and interpret the R2  for the regression from Question 6.

8.  (5 points) Which of the following statements is true?

(a)  Regression coefficients estimated using least squares are always BLUE.

(b)  If the omitted variable has positive effect on the explained variable and is negatively corre- lated with another explanatory variable we have negative bias.

(c) R in the expression: Var(βˆj) =  is obtained from the regression of the dependent

(d)  None of the above.

9.  (4 points) Which of the following is a consequence of including irrelevant variables in a regression model?

(a) There is no consequence we should worry about.

(b) The variance of the relevant estimators increases.

(c) The bias of the relevant estimators increases.

(d) The relationship between the explained and explanatory variables can become nonlinear.

 

LONGER QUESTIONS

10.  (16 points)  From the dataset about bike sharing in Seoul which you used in Problem Set 2. The explained variable is the number of bikes rented at each hour and the explanatory variables are:

•  Temperature: temperature in Celsius

•  Humidity: in %

•  Wind_speed: m/s

 

How many observations does the regression have?

(b)  Is the wind speed estimated from this regression statistically significant at the 1% level?

of the parameter and interpret it.

(c) Suppose on Monday at 11 AM the temperature was 20 degrees in Celsius, humidity was 59% and wind speed was 1.8 m/s. On that same day at 3 PM the temperature was 20 degrees in Celsius, humidity was 59% and wind speed was 1 m/s. Construct a 95% confidence interval for the expected difference between rented bikes between these two hours.

In the table below you can see the regression with added variable "Visibility" in 10 meters:

 

from zero using both F and t-test.  Interpret the results. What is the relationship between these tests? Use 1% of significance level.

Write down relevant hypotheses for the F-test in the second regression output and interpret.

 

y = β0 + β1x + β2x2 + u E(u|x) = 0

(1)

where the explanatory variable x has a standard normal distribution in the population.  In par- ticular, E(x) = 0,  E(x2) = Var(x) = 1,  E(x3) = 0.  This last condition holds because the

Show that we can write

y = ↵0 + β1x + v

where E(v) = 0. In particular, find v and the new intercept, ↵0. Show that E(v|x) depends on x unless β2  = 0. Show that Cov(x,v) = 0

(b)  If βˆ1  is the slope coefficient from regression yi on xi, is βˆ1 consistent for β1? Is it unbiased?

Explain.

(c) Argue that being able to estimate β1  has some value in the following sense: β1  is the partial effect of x on E(y|x) evaluated at x = 0, the average value of x.

(d)  Explain why being able to consistently estimate β1  and β2  is more valuable than just esti- mating β1 .

12.  (18 points)  From the package wooldridge in R you can access various datasets.  Install it by typing: install.packages("wooldridge"). If you want to use a given package in your current session in R you always need to load it into the environment, which in this case you can do by typing: library(wooldridge) or require(wooldridge).

(a)  Load the data about college grades by typing data("econmath"). You can find description of the variables here. Estimate an OLS model explaining college GPA with high school GPA, ACT math score, ACT English score and hours studying per week (you can use the function lm). Are all explanatory variables statistically significant at 1% level?

(b) Test the null hypothesis that coefficients on ACT math score and ACT English score have the same effect in the population at the 5% level.   Do not use in-built functions while performing the test (use one of the methods described during lectures).

(c) Suppose the college admissions officer wants you to use the data on the variables in (a) to create an equation that explains at least 40% of the variation of the college GPA. What would you tell the officer?

(d) Test the hypothesis at 5% level that coefficients on hours studying per week and ACT English score are jointly equal to zero. Do not use any in built function calculating the value of the test. Interpret the result.

(e)  In the model from (a), why cannot assumption MLR.6 from Wooldridge hold for the error term u? What consequences does this have for using the usual t statistics to test that the coefficient on variable ACT English score is equal to zero in population?