Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STAT 426 – Categorical Data Analysis

Project 2

2022

This project will involve analysis of the bacteria dataset from the MASS package, to answer some specific questions that are listed below.  The aim is to model the presence of the bacteria  H. influenzae in children with a middle ear infection in the Northern Territory of Australia. Specifi- cally, fit generalized linear mixed models to uncover treatment effects on presence of H. influenzae, that consider possible effects due to treatment compliance and the timing of the test (week) and possible interactions with treatment. Be sure to present the results both when compliance is used and when it is not used.

This is the identity verified portion of the course, which is a requirement.  The final product should be a filmed presentation of slides that may be done either in the R Markdown slide envi- ronment or on powerpoint, or whatever you are comfortable with.  You should film it so that all members and the slides can be seen. This can be done by recording a zoom meeting with yourself in which you share your screen. I expect this project will require about 10-15 slides and a film of 10-15 minutes. You may submit your film on Compass, but if uploading takes too long just load it in box and share with me and TA (Shen).

Research Questions:

1. Is the treatment effective?

2. How do they behave over time?

3. Any compliance effect?

Suggested Outline for the Slides

1. Introduction:  Do a little reading so you can give some background information on the bacteria and otitis media. Paraphrase the main objectives of your analysis.

2.  The Data: Provide some summaries of your data, search for outliers and consider what to do with them in your analyses.

3.  Methods:  Discuss your methods for developing your models, such as variable coding, uti- lization of interactions (if needed), and so forth.

4.  Results:  Show the results and details of the fitted regression models in appropriate tables and possibly any relevant graphs. Provide an interpretation of the results.

5.  Summary: Give a very brief summary of what you have found in a non-technical manner.

6.  Appendix: Provide the R-code that you used to conduct your analysis.

Grading will be based on:

●  (20pts) Clearly summarized the goal of the study?

●  (25pts) Clearly presented the description of the data and gave insightful data exploration?

●  (20pts) Appropriate figures and tables are used to highlight the results?

●  (25pts) Clear statistical justification of your method (technical accuracy)?

●  (10pts) How could you improve the model? Suggestion of further study.