Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

EC 204-A1, C1 Fall 2022

Problem Set#3, 100 points

Instructions:

1)   PS#3 expires at 8:00 pm on T, 11/29.

2)   Submit a do-file for Q1, Q2, and Q3. You can answer the written parts of these questions in a separate word file and include the Stata output in the same word file. Upload these two files under PS#3 Submission” link under Problem Sets” folder.

3)   The other questions are all fill in the blanks/multiple choice. Answer them also on the same word file. We will only grade the final answers for these questions.

4)   To reiterate, you need to upload two things: the do-file for Q1, Q2, Q3, and a word file with your Stata output, written questions, and fill in the blanks/multiple choice. Mark the question# that you are answering in both your word file and do-file for ease of grading.

5)   Please double check to make sure that everything has been uploaded correctly. If you arent sure, re-upload (I give you multiple attempts) or email me and our TA. We wont be able to give you full points back if you tell us that your documents werent uploaded correctly, after we post the answers.

6)   Use the data set star1.dta uploaded under the same folder to answer Q1, Q2, Q3. The data set contains information on the kindergarten class. This data pertains to an experiment that was conducted in Tennessee in the 1980s to estimate the impact of attending a small class size on student outcomes. Children were randomly assigned to small classes (13-17 students), and a regular size class (22-25 students). The variables tchexper is in years and totalscore is in points.

7)   If you are using sources other than the book (including online sources) to complete this problem set, please cite.

8)   Each student must submit their own problem set. You are encouraged to work together but show your own work. Two problem sets shouldn’t be the same. You must write names of your classmates you are working with.

9)   Round all your final answers to 3 decimal places.

1)  Open Stata, then open a new Stata do-file and call star1.dta data in Stata using the use” command. Make sure you state the data path correctly. “use” command must be in your do file. Refer do files uploaded on blackboard for the “use” command syntax. Along with this have the clear all”, “log using”, “log close” and save command for your data set” . You should save your data set with a new name. Note: log close should be the last line in your do file. We are working with 3 variables in this problem set: tchexper, totalscore and small. Hence, you can drop any “ .” from the 3 variables. Usually, I would do this once I have finalized all my variables to get a consistent N for all models. (10 points)

2)  Simple linear regression model (50 points):

a.   Generate summary statistics for totalscore, tchexper, and small. Attach the summary statistics table output that you get using outreg2 command. Give a table name. Command must be in the do-file. This is similar to table 2 in your paper. (5 points)

b.  Now create a new variable called h_tchexper which is 1 if tchexper ≥ 9 and 0 if less than  9. Note:  tchexper =  9  is  the mean  of tchexper,  approximately.  Generate summary statistics for totalscore and small according to h_tchexper” variable. This is done using the bys command. Attach the summary statistics table from outreg2 command. Commands must be in the do-file. You should also manually create the last column, which is difference in means between totalscore and small according to h_tchexper. Intrepret what you observe. Give a table name. This is similar to table

3 in your paper. (10 points)

c.   Regress totalscore on small and then regress totalscore on small and tchexper. Attach the Stata output from outreg2 command. Both regression outputs must be in the same table. Commands must be in the do-file. This is tables 4 and 5 in your paper. (5 points)

d.   Construct  a  99%  interval  estimate  for  the  coefficient  of small  in  the  simple regression model in (c). Interpret it. Solve this question by hand and show all steps.

(7 points)

e.   Write the Stata command for calculating 99% interval estimate. Attach the Stata output. Command must be in the do-file. Does Stata’s confidence interval match up with what you find in (d), barring rounding errors? (3 points)

f.   Test whether the coefficient of small is at most 15. Write the hypothesis, test it, and interpret it at the 1% significance level. Do this by hand. (10 points)

g.   Generate the t-stat and critical value using Stata (refer uploaded do-file#3). Attach the output and all commands must be in the do-file. (5 points)

h.   Clearly show tc, t-stat, p-value, and rejection region on a graph for the test in 2 (f). You don’t need to find p values from the z tables, just shade it on the graph. (5 points)

3)  Simple log-lin regression model (25 points):

a.   Generate log(totalscore), and regress log(totalscore) on small. Attach Stata output and command must be in the do-file. You don’t need to use outreg2 command for this one. (5 points)

b.   Write the regression model that you estimated in 3(a) in the proper format. It should have R2, standard errors in parenthesis and levels of significance should be shown using asterisks. (5 points)

c.   Verify R2 = T2y  in Stata for this model. Attach Stata output and commands must be in the do-file. (5 points)

d.   Which model is a better fit simple regression model in 2(c) or 3(a)? Use R2  to support your answer and make sure these R-squares are comparable. Attach Stata output and all commands must be in the do-file. (10 points)

4)  Suppose the p-value that comes with Stata is 0.267 and the tstat is - 1.11. The p-value will be ________________, if we had the same conjecture as Stata has, but now it is a left tailed test. Assume N is large enough, so that it is a zstat. (2 points)

5)  Suppose the p-value that comes with Stata is 0.267 and the tstat is - 1.11. The p-value will be ________________, if we had the same conjecture as Stata has, but now it is a right tailed test. Assume N is large enough, so that it is a zstat. (2 points)

6)  If the zstat = - 1.61, p-value for a two tailed test is __________. You need to look up z tables for this. (2 points)

7)  If the zstat = - 1.61, p-value for a right tailed test is __________. You need to look up z tables for this. (2 points)

8)  If the zstat = - 1.61, p-value for a left tailed test is __________. You need to look up z tables for this. (2 points)

9)   is ______________, if R2 = 0.4, SST = 100 and N = 22. Use simple regression model.

(3 points)

Multiple Choice Question

10) When we run reg totalscore small, the R2 that comes with Stata is 0.0072. When we run reg totalscore  small tchexper, the R2  that  comes with  Stata is  0.0203. What  can we conclude? (2 points)

a)  Multiple regression model is a better fit than the simple linear regression model, since R2 increases in the multiple regression model

b)  Simple regression model is a better fit than the multiple linear regression model, when we compare R2

c)  We cannot compare R2 between simple and multiple regression models because R2 will always increase when we add more x variables, however irrelevant they are

d)  None of the above