Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON20110

ECONOMETRICS

2019/20

SECTION A

Answer all questions from this Section

Questions 1 to 4 make use of data that are the result of an experiment in which 2,565 students were followed through the first four years (Kindergarten to Year 3) of their primary school experience. The data contains the following variables:

● tscorei, which is a score indicating the level of the student’s achievement

● deg bachi, contains ”bachelor” if the student’s teacher has a bachelor teaching degree, or ”higher” if the student’s teacher has a higher teaching qualification

●  experiencei, is the years of experience of the student’s classroom teacher

The last letter i in these three variables takes the value k,1,2,3, representing kindergarten, Year 1, Year 2 and Year 3.   For example, tscore2 represents the student’s scores in Year 2,  deg bachk  indicates the degree qualification a the student’s  Kindergarten teacher and

experience3 representing the years of work experience of the student’s Year 3 teacher. In Tables 1 to 3 on page 8 you can find some relevant summary statistics.

1. You are  interested  in establishing whether a  primary school teacher’s  level of degree qualification and amount of work experience matters for their students scores.

(a)  [5 MARKS] Without performing any formal test, outline any evidence that the dis-

tributions of teaching qualifications and experience are different for different years (Kindergarten and Years 1 to 3)?

(b)  [5 MARKS] You estimate the following linear regression model:

tscorek = β0 + β1 deg bachk$higher + β2 experiencek + u             (1)

hence only using data for students in their kindergarten year. Here we are using the variable deg bachk$higher which takes a value of 1 if a teacher has a teaching qual- ification higher than a bachelor’s degree and 0 otherwise.  How would you interpret the coefficients β1  and β2 ?

(c)  [10 MARKS]  In the context of this model, state the zero-conditional mean assump- tion and explain why this assumption is important.

(d)  [5 MARKS]  In this example what could be a reason for the zero conditional mean assumption to be invalid?

2. This dataset also contain ten additional demographic variables (relating to student’s gen- der, whether the student is eligible for free school meals, student’s ethnicity, teacher’s ethnicity and  the school location) which you can potentially include in the regression model (see regression output in Tables 4 on page 10).

(a)  [5 MARKS] Test the hypothesis that there is no difference in student achievements

between students  being taught  by a teacher with a  bachelor’s degree and those taught by a teacher with a higher teaching qualification in Model A (α = 0.01). Refer to the regression output in Table 4.

(b)  [5 MARKS] A  colleague says that  Model A suggests that  an  additional year of

teacher experience  (holding all else equal) will,  on average,  increase a student’s grade by more than 1 grade point. Perform an appropriate hypothesis at α = 0.05.

(c)  [5 MARKS] What are the approximate p-values for the two tests you performed in parts (a) and (b)?  Interpret the approximate p-value you obtained for one of the two tests.

(d)  [5 MARKS]  From the estimated Model A a colleague concludes that teacher expe- rience has a very large impact on students’ test scores. Use all available information to evaluate this statement.

(e)  [15 MARKS]  Consider Models A, B and C as reported in Tabe 4 (on 10).   Test

whether the data support the restrictions imposed for Model B and whether they support the restrictions imposed for Model C. Hence perform two hypothesis tests. Ensure that you clearly state the hypotheses being tested.  Hypothesis tests are to be performed at α = 0.01.

In your answer you should clearly state the unrestricted model equation which is being estimated.

3. The data also includes a variable that indicates whether the students were in a regular (22-25 students) or a small (11-17 students) classromm, and another variable on whether they were in a regular classroom (22-25 students) with an additional teaching aide (reg- ular+aide).

The two variables small and reg+aide are dummy variables defined as follows:

  small = 

 reg + aid = 

(a)  [5 MARKS]  Explain whether you would expect the signs of the parameters to these

two additional variables (small and reg+aid), if they were added to Model A (see Table 4), to be positive or negative. State why you come to your predictions about the sign.

(b)  [10 MARKS] When we add these variables to  Model A we obtain the regression

output in Table 5, where this model is applied to the kindergarten and the Year 3 sample. What do you learn from these results?

SECTION B

Answer one of two questions from this Section

4. This question continues the data and model used in questions 1 to 3.

Consider the students’ grades in kindergarten and Year 1, Year 2 and in Year 3. We now denote the total score variable tscoreij  where i indexes the individual student and t the year (i.e. t = Kindergarten, Year 1, Year 2 or Year 3). Consider the following model:

tscoreit  = β0 + β1 smallit + β2 femaleit + β3 free mealit + uit                      (2)

(a)  [2 MARKS] What do we call this type of data?

(b)  [5 MARKS] You are interested in investigating whether the class size has a causal

impact on a student’s score.  What is the crucial assumption you have to make in order to use this model to answer this question?

(c)  [5 MARKS]  Do you think the assumption you outlined in part (b) is a valid assump- tion in the context of this data? Explain your answer.

(d)  [5 MARKS] A colleague tells you that students were randomly allocated to regular or small size classes before they started kindergarten. Students stayed in these classes up to and including Year 3. Does that change your previous judgement?

(e)  [8 MARKS] The error term in model (2) is likely to contain unobserved heterogene-

ity.   Do you think that applying a first-difference or fixed effect estimator will be useful in order to establish whether class sizes matter.

5.  [25 MARKS] Your flatmate (not an economist) claims that lecture attendance has an im- portant and large effect on the grades that students receive in a course. You immediately think to estimate the following regression model:

gradei  = α0 + α1 attendi + ui                                                             (3)

where

● gradei  is the grade (out of 100) the ith student receives for econometrics

● attendi  is the number of econometric lecture hours the ith student attended.        Assume that both variables are observed without error and that your flatmate knows what a correlation is. Explain to your flatmate (without using formal language):

● why measuring a correlation between a student’s grade and their lecture attendance


is not sufficient to establish that higher lecture attendance causes higher grades, 

● why using an instrumental variable may be useful, and

● give an example of what would be a useful instrumental variable to have available.