Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


ECO00047M - Spring

MSc Degree Examinations 2018-9

ECO00047M Econometrics 1&2 - Spring



Section A

1. Indicate which of the following five statements are true (T) and which are false (F). For example, if statement (n) is false, your answer should read, “(n) F”.

(a) Let X be a fixed (n × k) matrix and H = X (XX)− 1 X , then H is idempotent. (1 mark)

(b) In a multivariate linear regression model, we use the t-test to test the joint significance of all the regressors and the F-test to test the individual significance of each regressor. (1 mark)

(c) When estimating the unknown population parameters of a multivariate linear regression     model through least square estimation, the second order condition requires the Hessian matrix to be positive semi-definite. (1 mark)

(d) Consider the model y = Xβ + ε where y is an n × 1 vector, X is an n × k matrix, β is a k × 1 vector and ε is an n × 1 vector. Assuming that the appropriate assumptions for OLS     estimation of this model are valid, the OLS estimate of β is b = (XX)− 1 Xy. (1 mark)

(e) Let X ∼ χ2 (k1) and Y ∼ χ2 (k2) be independent chi-square random variables, then has an F (k1,k2) distribution. (1 mark)


2. Suppose that the true data generating process is given by

Y = X1β1 + X2β2 + ε,

where E (ε) = 0,E (εε) = σ2I and X = [X1,X2] is a fixed matrix of dimension n × k in which X1  is n × g and X2  is n × (k − g). Let b = [b,b] and e denote the OLS estimator of             β = [β] and the corresponding residual vector obtained from a regression of Y on X, and   let bR  and eR  denote the OLS estimator of β1  and the corresponding residual vector obtained    from a regression of Y on X1  alone which is the restricted model.

Indicate which of the following five statements are true (T) and which ones are false (F). (a) bR  = b if X1  and X2  are orthogonal. (1 mark)

(b) Var (bR) > Var (b). (1 mark)

(c) bR  and b will both be unbiased if β2  = 0. (1 marks)

(d) In the model represented by equation (1) above, the number of restrictions is (k − g) under the restricted model. (1 mark)

(e) To test H0  : β2  = 0 we should use a chi-square test. (1 mark)


3. OLS estimators are called BLUE. Write down what BLUE stands for and explain clearly all the BLUE properties of the OLS estimator. (6 marks)


4.Consider the following earnings equation which explains wage income as a function of schooling and experience

y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + ε,

where y = log(wage), X1  is the level of education, X2  is years of age, X3  is a categorical        variable (takes values 1 to 4) that reflects the highest education among parents education, X4


is a Rural-Urban Dummy (1=Rural, 0=Urban) and ε is an idiosyncratic error term.

Given a sample of 50 observations, describe how you would construct a joint significance test of H0  : β3  = β4  = 0, and indicate the reference distribution of your test statistic. (6 marks)

5. Suppose that the relationship between a dependent variable, y and an explanatory variable x, is described by the nonlinear model y = f(x,β) + ε, where β is a unknown parameter, and ε is  an error term with mean zero and constant variance. Given a sample, y1 , y2 , ..., yn, of y and    associated x values, x1 , x2 , ..., xn, write down the objective function of the nonlinear least       squares method that can be minimised to estimate β. Derive the first order condition (FOC)     and describe the meaning of this FOC. (6 marks)

6. Consider the model, yt  = β1 + β2xt + β3yt − 1 + εt , t = 1,...,n, for a dependent variable yt and an explanatory variable xt. Suggest a statistical test that can be used to test for serial      correlation in the disturbances of this model. Using first-order serial correlation as an example  of the alternative hypothesis, describe how you can carry out this test. (6 marks)

7. Consider the linear model yi  = x β + εi , i = 1,...,n, where yi  is a dependent variable, xi  is a vector of explanatory variables whose values are fixed over repeated sampling, and the error    term εi  satisfies E[εi] = 0. Explain what heteroscedasticity means for this model and describe    the properties of the OLS estimator of β in this model when there is heteroscedasticity. (6 marks)


Section B

8. A study of monthly wages of female workers produces the results in the table below. There  are three types of female workers: Child0, Child1, and Child2plus, and the dummies are defined as Child0=1 for women with no children, 0 otherwise, Child1=1 for women with one child, 0    otherwise. Age is age in years. Edu id education in years. The multiplicative variables, such as  Edu*Child0 are defined in the natural way as the product of their components. The estimated  coefficients are designated as β0 , β1 , ..., β8, and correspond to the underlying linear regression model

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + β6X6 + β7X7 + β8X8 + ε.

Dependent variable (Y): Wage

Method: Ordinary Least Squares; Included Observations: 1120

Control variable

Coefficient

Std. Error

|t|-Statistic

Outcome of t-test in terms of significance

C: constant

397.120

231.810

X1 : Age

-9.700

6.640

X2 : Age*Child0

0.230

0.098

X3: Age*Child1

0.470

0.281

X4 : Edu

69.750

26.910

X5: Edu*Child0

32.020

29.840

X6: Edu*Child1

16.980

28.080

X7: Child0

83.240

50.990

X8: Child1

19.840

56.150

R-squared: 0.074

Restrictions

Test statistic

Value

d.f.

Probability

H0 : β3 = β4 = 0

F

4.920

(2,1111)

0.021

H0 : β6 = β7 = 0

F

1.810

(2,1111)

0.140

(i) In the above regression table first calculate the |t|-statistics and fill in the ”|t|-Statistic” column. Then, using the rules given below fill in the column ”Outcome of t-test in terms of significance” by indicating whether or not the corresponding t-test is significant and if so at

what level. Also comment on the sign of each of the explanatory variables. (8 marks) If |t| ≥ 2.59 results are significant at the 1% level;

If |t| ≥ 1.96 results are significant at the 5% level;

If |t| ≥ 1.69 results are significant at the 10% level;

If |t| < 1.69 results are insignificant.

(ii) Consider the following two restricted models against the unrestricted model (2)

Y = β0 + β1X1 + β2X2 + β5X5 + β6X6 + β7X7 + β8X8 + ε

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + β8X8 + ε

a) Considering the values of the F-statistics and the corresponding probabilities of the

F-tests in the above table which of the three models is the most preferred and why? (6 marks)


b) If one chooses any of the other models instead of the most preferred one from a), then what would be the potential econometric issues? (6 marks)


9. Consider a set of wage data from 474 US bank employees. The data consist of the following variables: LOGSAL – natural logarithm of yearly salary in dollars, EDUC – finished years of        education, LOGSALBEGIN – natural logarithm of begin salary in dollars, GENDER – 1 for male and 0 for female, MINORITY – 1 for individuals belonging to a minority group and 0 otherwise. Consider the following model for the data

LOGSAL = β1 + β2EDUC + β3LOGSALBEGIN + β4GENDER + β5MINORITY + ε

Panel 9.1 below shows the OLS regression results of the model.

(i) Based on the results shown in Panels 9.1, interpret the estimated coefficients for EDUC, and test for its individual significance. (6 marks)

(ii) Panel 9.2 shows some additional regression results for the data. Using appropriate results in Panels 9.1 and 9.2, test the null hypothesis H0  : β4  = 2β2  using an F test. Your answer should explain the construction of the test and its conclusion. (8 marks)

(iii) Using appropriate results in Panels 9.1 and 9.2, test the same null hypothesis H0  : β4  = 2β2 using a likelihood-ratio test. (6 marks)