MAST10010: Data Analysis 1 Assignment 2


MAST10010:  Data Analysis 1

Assignment 2

Due Date: Friday September 23rd,  11.59pm.

❼ Your assignment must be submitted to Gradescope by 11.59pm Friday 23rd September.

❼ Assignments submitted late will incur a penalty of 5% per hour  (or part thereof).

If you need an extension then you must contact Vasuki Prabaharan: [email protected]

❼ Tutors may not help you directly with  assignment questions.  They may, however, provide some appropriate guidance.

❼ Please  ask  on  the  discussion board if you need  clarification on the wording of questions. Do not include partial answers on the discussion board.

❼ It is recommended to produce a single Word document which includes all the relevant graphs, statistics and comments.  You will then need to Export as a PDF to upload to Gradescope. If you need to include formulas or calculations, you may include photos of handwritten notes (or use equation editor, or any other method).

 This assignment consists of three (3) questions worth total of 38 marks.  It contributes 5% towards your final grade.



You must use Minitab to produce any graphs, tables and descriptive statis- tics.


must include your name/student number, which can be added by Edit- ing the graph, right-clicking and selecting Add → Footnote or Add → Subtitle.

must be relevant. You may look at many graphs, but you should only include the most relevant graph for each question.

should be clear:  ensure that  labels  and titles are correct and appro- priate; you can add gridlines/change symbols/colour as appropriate to make the graph clearer.  There are some marks awarded for improving upon the default from Minitab.

Mac   Users:   you  will  need  to  use  myUniApps  in  order  to   edit  the graphs  as  required  above.


Must be relevant:  you  will be penalised for including statistics which are not relevant to the questions asked.


must be in the context of the data.

❼ should be supported by relevant statistics where possible.

should be concise and informative.   Word  limits,  where  given,  must be strictly adhered to  (all word limits are a maximum, you will be penalised for going over this limit!). You may use dot-points.

Question 1: Does playing action videogames improve the eye- sight of healthy individuals?

[2 + 2 + 4 + 3 + 4 + 1 + 1 = 17 marks]

This  question  is  based  on  simulated  data  for  the  study  by  R.  Li  et   al. (2009)  ‘Enhancing the contrast sensitivity function through action video game training’, Nature Neuroscience, Vol.  12(5), 549–551 which can be ob- tained from the Library website (online Journal search).

You DO NOT  need  information  from this article to answer the questions; it is provided for interest only.

Researchers recruited 22 healthy individuals (contrast sensitivity in the normal range) between the ages of 20–25, who did not play videogames. They were randomly allocated to play either action videogames1  (AVG) or non-action videogames2  (NAVG) for 50 hours over a period of 9 weeks.  The variable of interest is the contrast sensitivity (higher scores represent better eyesight).

The data is available as Asst2  2023  data.csv on the LMS Assignment 2 page.

(a).  Explain why non-action videogames was chosen as the second treat- ment, rather than doing nothing.

(b).  Produce an appropriate graph showing contrast sensitivity for both groups.

(c).  Comment on the effect of Type of Videogame on Contrast Sensitivity. You should support your comments with relevant statistics, but do not include Minitab output.

Your comments must be less than 100 words.

(d).  Calculate a 95% Confidence Interval for the difference in mean contrast sensitivity for the two groups.  Show all of your calculations  (do not include Minitaboutput, but you may use Minitab to obtain descriptive statistics and relevant distribution values).

(e). What assumptions have you made in calculating this interval?  Were they satisfied?  (You need to provide evidence, in the form of one graph and a calculation.)

(f). Without doing further calculation, would a test of the hypotheses H0  : μ 1 − μ2 = 0 and H1  : μ1  − μ2   0 be significant at the α = 0.05 level? Explain briefly.

(g).  Does this study provide evidence of a causal relationship? Why/why not?

Question 2: Indigenous Voice to Parliament

[2 + 2 + 2 + 4 + 3 = 13 marks]

This question is inspired by the report ‘A majority of First Nations peo-   ple support the voice. Why don’t non-Indigenous Australians believe this?’,   Rebecca Huntley (2023)The Guardian Australia (https://www.theguardian.   com/commentisfree/2023/apr/27/a-majority-of-first-nations-people-support- the-voice-why-dont-non-indigenous-australians-believe-this), also linked on   the LMS.

You DO NOT  need  information  from this article to answer the questions; it is provided for context only.

This report discusses the results from a poll of 738 Indigenous people, where they were asked whether or not they support including an Indigenous voice to parliament in the Australian constitution.  The referendum  (elec- tion) will be held on 14th October 2023.  The poll identified 613 Indigenous people who support the inclusion of the voice in the constitution.

(a).  Construct a 95% confidence interval for the proportion of Indigenous Australians who support the voice to parliament being included in the constitution.

(b).  The official case for the ‘No’ campaign for the referendum (available

here: https://www.aec.gov.au/referendums/learn/your-official-referendum- booklet.html, and on the LMS) claims that “[m]any Indigenous Aus-

tralians do not support [the voice].”

Would it be reasonable to state that  “most  Indigenous Australians do not support the voice”? Justify your answer with appropriate evi- dence.

(c).  Outline how you would collect a representative sample of non-Indigenous Australian adults, of a similar size to this poll.  Your answer will be   assessed both on the statistical validity and the practicality of your   design.

(d). A sample of 100 non-Indigenous voters in Victoria found that many were still undecided.  Of the 59 people who had decided how they were going to vote, 39 supported an Indigenous voice to parliament in the constitution. Conduct an approximate hypothesis test to determine if this sample provides evidence a majority of the Victorian population support the voice. Show all of your calculations and steps.

Your answer needs to (the 5 step process meets these requirements):

❼ State the hypotheses in terms of the parameter(s) of interest.

❼ Calculate sd(estimator).

❼ Calculate the test statistic,  and give its distribution under the null hypothesis.

❼ Give the P-value for the test, using Minitab (you should not use Minitab for other parts of this question).

❼ State your conclusion in the context of the data.

(e). It is believed that the final result of the vote may be very close to 50%. Researchers would like to estimate this proportion using an 80% confidence interval based on a normal approximation, with a maximum margin of error of 0.02. What sample size would be required to achieve this? Show your calculations as well as your answer.

Question 3: Interpreting Research       [2 + 3 + 1 = 6 marks]

This question requires you to interpret the following small section of the ar- ticle: Christoph Pieh, Rachel Dale, Andrea Jesser, Thomas Probst, Paul L Plener and Elke Humer (2022) ‘The Impact of Migration Status on Adoles- cents’ Mental Health during COVID-19’, Healthcare, 10(1) 176. You can ob- tain this article https://www.mdpi.com/2227-9032/10/1/176 and from the link on the LMS.

You DO NOT  need  information  from this article to answer the questions; it is provided for context only.

From a total of 3052 participants,  N  =  508 had a migration background (first or second generation) and N = 479 could be matched according to age, gender, region, and education with adolescents without migration background.  Matched-pairs anal- yses showed that migration background is associated with poorer mental health concerning well-being, depression, anxiety, and in- somnia scores (all p-values < 0.05).

The relevant statistics quoted on well-being (specifically for the WHO-5, where higher scores indicate better well-being) are t(955) = −3.0;p < 0.01.

(a).  Explain the benefits of a matched pairs design, as done here for well- being.

(b). For the hypothesis test on well-being, clearly state the null and alter- native hypotheses being tested.  You may need to define appropriate parameter(s).

(c).  Since this is a matched pairs design, what degrees of freedom should the researchers have used to test the hypotheses in part (b)?

Relevance, Formatting & Submission                          [2 marks]

You can gain an additional 2 marks by:

❼ only including relevant material;

❼ submitting a clearly legible assignment  (eg all pages correct orienta- tion);

❼ selecting  correct  page(s)  for  each  part  of  each  question  (when  you upload your assignment to Gradescope, it will ask you to select pages: you can select multiple pages for a question part, you can also select the same page for multiple parts).