Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

LSA Final Coursework

Introduction to Quantitative Methods (PUBL0055)

Instructions

Submission Formalities

•  The final assessment is posted on Moodle on 24th July 2023 at 6pm, and is due on 21st August 2023 at 2pm.  Please follow all designated  SPP submission guidelines for online submission as detailed on the PUBL0055 Moodle page. Standard late submission penalties apply.

•  The coursework should be submitted via the ‘PUBL0055 – Assessment 2 – 2000 word final paper (70%) – LSA’ link on the course Moodle page. You will need to click the ‘Submit Paper’ link at the bottom of the page. When presented with the ‘Submit Paper’ box, the ‘Submission Title’ should be your candidate number, and you should upload your document into the box provided.

Please remember to state ONLY your candidate number on your coursework  (your candidate number is made up of four letters and one number e.g. ABCD5).  Your name and/or student number MUST NOT appear on your submission.

•  This is an assessed piece of coursework  (worth 70% of your final module mark) for the PUBL0055 module; collaboration and/or discussion of the coursework with anyone is strictly prohibited.   The rules for plagiarism apply and any cases of suspected plagiarism of published work or the work of classmates will be taken seriously.

•  As this is an assessed piece of work, you may not email/ask the course teaching team questions about the coursework.

•  Along with the coursework questions, the necessary data sets for the coursework can be found on the PUBL0055 page on Moodle.

Coursework Formalities

•  The word count for this assessment is 2,000 words.  This does not include the code, your output, or any words (or numbers) contained within tables or figures. The word count must be clearly indicated on the first page of the assessment submission.  Standard word limit penalties apply.

•  The coursework consists of three separate sections, each with several questions and subquestions. The marks allocated for each section are indicated in the text. You must complete each question to achieve full marks.

Together, the questions are worth 90 marks.

10 marks are reserved for presentation (see below).

•  Please submit your type-written (numbered) answers in a single document (preferrably a pdf file, but word files or equivalent are also allowed).  Make sure that you include the code, the output (plots, tables etc), and the answers in the document.  Double check after uploading your document that all

graphs, table, code, and written answers are visible.

•  Unless otherwise stated, answers should be written in complete sentences. Be sure to answer all parts of the questions posed and provide a substantive interpretation of the results.

• You can integrate the code with the answers (make sure that it is completely visible), as shown for example in the seminar worksheet solutions. Alternatively, you can create an appendix section at the end which contains all the R code needed to reproduce your results.

- In either case, your code has to work when we run it. You do not need to include the code that failed to run, but just the well-annotated, cleaned-up version.

- If you do not provide the code to a question which requires it, any written answer to that question

will be disregarded.

- Do not screenshot or copy and paste any brute R output (e.g. lm(y~x)) into your answers.  If applicable, create formatted tables that are easy to read.

•  Round all numbers to two or three digits after the decimal point.

•  Assign every table and figure a title and a number and refer to the number in the text when discussing a specific figure or table.

• You may assume that references to methods you have used (e.g. difference in means, linear regression, etc) are understood by the reader and do not need definitions, but you do need to be able to explain what they do and how they apply to answering the question.

Presentation (10 marks)

Points will be deducted for bad presentation, which includes (but is not limited to):

•  Failure to write the answers in full sentences

•  Failure to clearly indicate which question is answered where and which code pertains to which question

• Including screenshots from R output

• Including long print outs of data sets and objects (e.g., using View(), show())

•  Reporting unrounded numbers

• Including unnecessary code or output

•  Presenting figures with no or unclear axis labels (or labels that are the unedited variable name in the dataset)

•  Presenting tables that are hard to read/not well formatted

•  Presenting unnumbered and/or untitled tables and figures

•  Referring to the variables in-text by their unedited name from the dataset

Section 1 - Call to Military Service and Political Attitudes

How does being called to military service affect attitudes and political behaviour?  This question has received a lot of attention in political science, and particularly so in the United States, where, until 1973, many men were enrolled into the armed forces on a mandatory basis. In a recent paper, Green, Davenport, and Kolby (2019) examine whether the draft had long-term consequences for the political behaviour and attitudes of those men eligible for the draft.  The Vietnam draft randomly selected men who turned 19 prior to 1969 to serve in the US army. Although not all drafted men eventually served, we can investigate whether being drafted has long-term effects on attitudes and political behaviour.  In particular, in this section, we will focus on the effects of being drafted on trust in other people.

The replication data from this study is stored in the vietnam_draft.Rdata file, and contains the following variables:

Name

Description

Drafted

Whether a respondent was drafted (1) or not (0)

Wave

The wave in which the respondent participated in the survey (1-4)

State

Respondents state of residence at the time of the survey (5 unique states)

date

Respondent’s date of birth (mm/dd/yyyy)

birthyear

Respondent’s year of birth (1950, 1951 or 1952)

dem

Whether the respondent is a registered Democrat (1) or not (0)

rep

Whether the respondent is a registered Republican (1) or not (0)

rural

Whether the respondent lived in a rural (1) or urban (0) zip code at the time of the survey

CollegeDegree

Whether the respondent graduated from college (1) or not (0)

RaceEthnicity

White if the respondent is non-hispanic white, Black if African American, Hispanic if respondent is Hispanic

Vote12Obama

TRUE if the respondent voted for Obama in the 2012 Presidential election, FALSE otherwise

AfghanistanMistake

TRUE if the respondent thought that the invasion of Afghanistan was a mistake, FALSE otherwise

IraqMistake

TRUE if the respondent thought that the invasion of Iraq was a mistake, FALSE otherwise

AttendedPolEvent

TRUE if the respondent attended a political party event in the past two years, FALSE otherwise

trust

Respondent’s general level of trust ranging from “you can never trust other people (1) to you can always trust people (5)

ideology

Respondent’s political ideology ranging from very conservative (1) to very liberal (5)

After downloading the data and storing it in the relevant folder, you can load this data into R using the following command:

load ("data/vietnam_draft.Rdata")

Once you have successfully run this command, it will be available as a R data frame called draft.

Question 1

A. Calculate the difference in mean trust between drafted and non-drafted respondents.  Provide a brief interpretation.  (3 marks)

B. Explain the concept of a “sampling distribution”. What is the shape of the sampling distribution for the difference in mean trust between drafted and non-drafted respondents? How is the concept of the sampling distribution relevant and useful for analysing these survey data?  (5 marks)

C. Calculate the standard error and the 95% confidence interval for the difference in means using the formulae that we covered (i.e. do not just use the t.test function).  Explain what the standard error and confidence interval are in general and what they tell us in this instance.  (6 marks)

D. Now estimate the same effect by using linear regression.   Present the result in a table,  interpret the regression  coefficient  and  compare these  estimates to those obtained previously.   Can  the  coefficient  of Drafted be interpreted causally in this model? Explain why or why not.  (5 marks)

Question 2

A. Fit a linear regression model that includes covariates RaceEthnicity and birthyear in addition to the treatment variable.  Make a table that includes this model and the model from Question  1 part D above. What is the estimated average effect of being called to the military?  Are these results different from what you obtained in the previous question? If so, why; if not, why not?  (5 marks)

B. In the multiple regression model that you fit in part A, fully interpret the magnitude and statistical significance of the coefficient for the level Black of the RaceEthnicity variable.  (4 marks)

C.  Select  two  further  outcome  variables  from  Vote12Obama,  AfghanistanMistake,   IraqMistake,  and AttendedPolEvent that might tell you something about the long-term effects of being drafted on attitudes or political behaviour.  Estimate the average treatment effect of being drafted on these outcomes.  (For the purpose of this question, you can run linear regression models with a binary dependent variable.)  Produce a graph or a table to present your results. Write a short report summarising your findings.  (6 marks)

Question 3

Use a multiple linear regression model to investigate whether the effects of being drafted on levels of trust are different for the different race/ethnicity groups defined in the variable RaceEthnicity (White, Black and Hispanic).

•  A. Provide relevant descriptive statistics for the key variables (4 marks)

•  B. Explain how you set up the model(s) to make this assessment (3 marks)

•  C. Present your regression estimates in a table along with the other models for trust that you fit in Questions 1D and 2A. (1 mark)

•  D. What is the estimated average effect of being drafted, separately for White, Black, and Hispanic men?  (3 marks)

•  E. Provide some conclusions for your analysis (5 marks)

Section 2 - The Effect of Municipality Size

How does the size of a political system affect the cost of running it?  On the one hand, smaller units might be able to deliver targeted services that keep costs low.  On the other hand, larger political units may have more cost-effective service delivery, because they can benefit from economies of scale.

The effect of the size of municipalities as one example of political systems — on the cost of public service delivery is difficult to assess, because smaller and larger municipalities will differ on many dimensions, not just with regard to their size.  One way to deal with potential confounding is to use data from a municipality reform that took place in a small country in 2007 in which many municipalities were quite suddenly merged. We will use the 2007 municipality reform to explore whether mergers affect per capita public service delivery cost. Since the reform took place in 2007, you will consider the post-treatment period to start in 2008.

The CSV file cost_data.csv contains the variables presented in the table below.  In this data, each row is a municipality-year observation. Municipalities that were merged in 2007 are recorded as one municipality not just after the merger, but also before.  For the municipalities that were merged in 2007 (treated), the pre- treatment outcomes are based on the average of the outcomes of the municipalities that were later merged. Note that before the 2007 reform, the number of control and future treated municipalities was similar.

The outcome of interest is public service delivery costs per capita called Y. Whether a municipality is merged (treated) or not (control) is indicated as 1 or 0, respectively, in the variable called treatment.  The data also contains region and municipality identifiers:

Name

Description

year

Year (2005-2011: 2005-2007 pre-treatment, 2008-2011 post-treatment)

Y

The outcome variable. Public service delivery costs per capita.

treatment

Whether the municipality is the result of a 2007 merger (1) or not (0).

region

Region ID (4 unique regions)

municipality

Municipality ID (87 unique municipalities)