关键词 > ECON20110/30370

ECON20110/30370 (Semester1): Assignment #2

发布时间:2022-10-31

Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON20110/30370 (Semester1): Assignment #2

ASSIGNMENT 2

Below you will nd a number of exercises you need to complete. They involve you loading a data- set into R and running a number of regressions. There may also be a number of questions to think about that relate the tasks performed in this problem set back to the theory covered in the lectures and blackboard material. Follow all of these instructions, save your results and output from R and make some notes. You can then use these notes and results to answer a range of questions in the BB Quiz associated with this problem set. In the quiz I will ask you some questions that can be answered directly from your saved results and also some questions that test your understanding of the econometric theory behind the work you have done.

Once you open and start the BB quiz you will have to answer all questions with 45 minutes. This will not be enough time to do the required work in R. You will therefore have to complete the tasks that follow before you start the quiz. Once you have all of the results from your work at hand, you can answer the questions very quickly.

The questions you will see in the BB quiz will be a random selection from a pool of questions, such that everyone will see a slightly different set of questions. However, all of the questions can be answered if you have completed the tasks that follow. All answers have to be submitted via the dedicated on-line test on Blackboard.

The quiz will be open from Friday 28th October 0:01am until 28th October 23:59. But once you have opened the quiz you will have to complete the quiz within 45 minutes.

DATA

For this assignment we will use data from the STAR data-set. The data required for this assign- ment can be downloaded from the following URL:

http://fmwww.bc.edu/ec-p/data/stockwatson/caschool.dta

The data is stored in a Stata data format so it will be needed to be imported accordingly.

The California Standardized Testing and Reporting (STAR)) data-set contains data on test perfor- mance, school characteristics and student demographic backgrounds. The data used here are

from all 420 K-6 and K-8 districts in California with data available for 1998 and 1999. Test scores

are the average of the reading and math scores on the Stanford 9 standardized test administered to 5th grade students. School characteristics (averaged across the district) include enrollment, number of teachers (measured as "full-time-equivalents"), number of computers per classroom, and expenditures per student.

The student-teacher ratio used here is the number of full-time equivalent teachers in the district, divided by the number of students.  Demographic variables for the students also are averaged across the district. The demographic variables include the percentage of students in the public assistance program CalWorks (formerly AFDC), the percentage of students that qualify for a re- duced price lunch, and the percentage of students that are English Learners (that is, students for whom English is a second language).

All of these data were obtained from the California Department of Education (www.cde.ca.gov). The variables that we are interested in for the upcoming tasks are:

testscr

The average of the reading and math scores on the Stanford 9 standardized test administered to 5th grade students.

meal_pct

The percentage of students qualifying for reduced price (or free) lunch.

str

The student-teacher ratio is the number of students , divided by the number of full-time equivalent teachers in the district.

avginc

Average income in the district, (in $,000’s).

el_pct

The percentage of students that are English Learners (that is, students for whom English is a second language).

calw_pct

The percentage of students in the public assistance program CalWorks

TASKS

Complete the following tasks. Save all of you code, R output, and make any notes and calculations before attempting the questions in the on-line quiz.

Task 1

Remove all schools for which average income is greater than or equal to 40. You should use the remaining data set for all further work related to this problem set.

Task 2

Estimate each of the following 3 models using OLS:

testscri = β0 + β1 stri + β2 avginci + ui                                                                                      (2)

testscri = δ0 + δ1 stri + δ2 avginci + δ3meal_pcti + δ4 el_pct + ui                              (3)

Be sure to save the output of each regression, you may wish to use the stargazer function to organize your results.

Task 3

Create two new variables called:

(i) meal_high that takes the value 1 if the percentage of students in a school qualifying for reduced price (or free) lunch is more than 50%, and 0 otherwise.

(ii)  el_high that take the value 1 if the percentage of students that are English learners is more

than 10%, and 0 otherwise.

Task 4

Using the observations where the percentage of students qualifying for reduced price lunch is greater than 50% estimate the following models.

testscri = β0 + β1 stri + β2 avginci + ui                                                          (5)

Repeat the above process for observations where the percentage of students qualifying for re- duced price lunch is less than (or equal to) 50%. Based on your estimates, think about whether the Gauss-Markov assumptions hold in each of these regressions.

Task 5

Using the observations where the percentage of students that are English learners is more than 10% estimate the following models.


testscri = β0 + β1 stri + β2 avginci + β3 calw_pcti + ui                                                        (7)

testscri = δ0 + δ1 stri + δ2 avginci + δ3meal_pcti + δ4 calw_pct + ui                           (8)

Repeat the estimation for observations where the percentage of students that are English learners is less than (or equal to) 10%. Based on your estimates think about the relationship between the explanatory variables.