关键词 > STA302H1S/1001H1S

STA302H1S/1001H1S Winter 2022 Methods of Data Analysis 1

发布时间:2022-03-09

Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Methods of Data Analysis 1

Department of Statistical Sciences

STA302H1S/1001H1S Winter 2022

COURSE OVERVIEW

How will this course operate? This course will be offered entirely online, with a combination of syn- chronous lectures and asynchronous video lectures. Each week, you should view the asynchronous course materials (posted in a Quercus module) and complete the knowledge check quiz.  Then come to the syn- chronous classes which will occur through Microsoft Teams.  These sessions will focus on demonstrations of concepts and applications using statistical software, with opportunities for hands-on practice. It is your responsibility to make sure you are available during scheduled lecture times and stay on top of the course material and all relevant deadlines.  Note that while the synchronous lecture time is a 2-hour block, we will not usually meet for the full duration but rather the time is available for additional question periods as needed.

** To avoid any issues accessing materials or lectures, always sign in to your Utoronto Microsoft account and ensure that Microsoft Teams is updated. Avoid using mobile devices to attend lecture or complete assessments.

*** Please ensure that you have access to reliable internet service, as some assessments will take place online and there is no guarantee that accommodations can be provided for faulty internet during an evaluation.

Course Description: The course provides a solid introduction to data analysis with a focus on the theory and application of linear regression. Topics to be covered include: initial examination of data, correlation, simple and multiple regression models using least squares, inference for regression parameters for normally distributed errors, confidence and prediction intervals, model diagnostics and remedial measures when the model assumptions are violated, interactions and dummy variables, ANOVA, and model selection and validation. Statistical software will be used throughout and will be required for the completion of various assessments during the term.

Learning Outcomes: By the end of this course, all students should have a solid understanding of both the mathematical theory of linear regression analysis and its application in the form of a data analysis. Students should be prepared to show their understanding of the above through

• application of methods through problem-solving questions;

• description and explanation of concepts relating to the mathematical theory;

• derivation and proof of topics based on linear regression concepts and theory;

• practical application of methods on real data using statistical software, with appropriate justification of use of these methods;

• interpretation of data analysis results in clear and non-technical language

Pre-requisites: Pre-requisites are strictly enforced by the department, not the instructor. If you do not have the equivalent pre-requisites, you will be un-enrolled from the course.  Students should have a second year statistics course, such as {STA238, STA248, STA255, or STA261}, a computer science such as {CSC108, CSC120, CSC121, or CSC148} and a mathematics course such as {MAT221(70%), MAT223, or MAT240} or equivalent preparation as determined by the department.

COURSE MATERIALS

Course Content: We have a common Quercus course page for all sections of this course.  All lecture slides, recordings and materials will be posted on this Quercus course page.  Further, any important an- nouncements will also be posted in Quercus. Please make sure to check it regularly.

Textbook: This course does not strictly follow any particular textbook, but rather merges material from a number of sources. All of the below recommended textbooks are freely available as an electronic copy through the University of Toronto Library. Our two primary reference texts will be

• Linear Models in Statistics, 2nd edition by Alvin C. Rencher and G. Bruce Schaalje (Wiley).

• A Modern Approach to Regression with R, by Simon J. Sheather (Springer)

Other helpful references from which practice problems may be assigned are:

• Applied Regression Modeling, 2nd edition, by Iain Pardoe (Wiley).

• Methods and Applications of Linear Models, 2nd edition, by Ronald R. Hocking (Wiley)

• Applied Linear Regression, 3rd edition, by Sanford Weisberg (Wiley).

These are all useful books, but may present the material in a different order or in a different way.  They are still good for additional explanation and practice problems.

Statistical Software: We will be using RStudio for performing statistical analyses. R is a free software that can either be downloaded onto your personal computer or used in the cloud.  If you choose to work with R on your personal computer, then installation will be a two step process:

1.  The base R framework is available for download at http://cran.r-project.org/ for Windows, Mac and Linux operating systems.

2. Next, RStudio is a good integrated development environment to R (makes it simpler to work in R) and can also be downloaded for free at https://www.rstudio.com/products/rstudio/download/.

If you don’t want to download the program or run into problems with installation, you may want to con- sider using RStudio through the JupyterHub for University of Toronto.  This will allow you to login with your official UofT credentials and use RStudio without the need for a local installation. More information about using RStudio in JupyterHub will be provided in the first class.   R code shown in class will be available on the course page and, along with any additional resources, should be sufficient to complete any assessment involving data analysis.

COURSE COMPONENTS

Lectures: The majority of the core content for this course will be delivered via pre-recorded video lec- tures which will be posted to Quercus for each week’s module (ideally by Friday night the latest). It is the student’s responsibility to watch these videos in a timely fashion. Synchronous classes will occur through Microsoft Teams and will supplement these videos with additional demonstrations and data analyses. Syn- chronous lectures will also be recorded and posted a few days after the class.

Oce Hours: Instructor and TAs will hold office hours online through Microsoft Teams. The office hour schedule will be posted on Quercus once finalized. It is recommended that you visit office hours whenever you have a question about the material. It is more important than ever in an online class to have material clarified as quickly as possible. Don’t wait until the last minute to ask your questions!

ED Discussion Board: We will be using the ED-STEM Discussion Board as an online discussion forum, which can be accessed through the Quercus course page. All questions about course material should be posted here or asked during TA/instructor office hours.  The instructor and TAs will monitor the board and will help answer questions but students are encouraged to answer posts and help their fellow classmates.

COMMUNICATION

How your instructor will communicate with you: All communication will be made through Quer- cus announcements or during lectures. Please ensure that you check Quercus regularly so you don’t miss anything important.

Where to send content questions: We will be using the ED Discussion board to collect student ques- tions regarding course content, assignments, etc. All questions should be posted here.

When to email the instructor: The instructor will only respond to emails of a private or sensitive nature. If you email the instructor with content related questions, you will be asked to repost your ques- tion on the content board so the answer may benefit all students. Should you need to email the instructor about a sensitive or personal nature, please use your official mail.utoronto.ca email, include your full name and student number in the text. Send all course related emails to [email protected]. Please allow up to 48 hours for a reply. Emails will not be monitored on evenings and weekends.

A note on email and discussion board etiquette: Please make sure that you communicate politely and respectfully with all members of the teaching team and your fellow classmates. Written communica- tions can sometimes take a tone other than what was intended (e.g.  can come off as dismissive, rude or insulting), so make sure you re-read or read out loud your email/post before sending it to make sure it has the tone you intended.  For more tips on respectful communication, see professional communication tips. The ED discussion board is a teaching and learning tool and therefore should only be used as such. Any posts that detract from the learning goal of the board will be removed to keep the board a safe space.

GRADING SCHEME

Both undergraduate and graduate students will be offered two grading schemes that will be used to cal- culate your final grade. Your final grade for the course will automatically be determined by the higher of the two grading schemes. Undergraduate students will have the grading scheme as outlined below.

Graduate students will use the same grading schemes, with the exception that the Term Test will be worth 15% while the Final Written Report (Part 3) will be worth 25%.