Syllabus of STAT 4052 - Fall 2022


Introduction to Statistical Learning

1    Course overview

1.1.   Course description:    The course introduces a wide variety of applied statisti- cal tools and methodologies for identifying different types of problems and selecting the appropriate solution for the analysis of the data.  The material covered in the course includes basic concepts of regression and classification.   Classical methods, as well as modern computer-intensive methods are discussed and compared.  Several datasets are analyzed and particular attention is paid on the interpretation of the results. The main topics covered are: cross-validation, bootstrap, linear regression, regularization methods, principal components, generalized linear models, non-linear regression, Bayes classifier,

KNN, linear and quadratic discriminant analysis, tree based methods, support vector

machines and missing data.

1.2.  Prerequisites: STAT 4051 and STAT 4102 (or STAT 5102).

1.3.  Credit Hours: 4.

1.4.  Class Web Page and course material: Lecture notes, assignments, etc will be made available on Canvas at https://canvas.umn.edu/courses/330896/modules.

1.5.  Course format:  Classes will be held in-person, whereas office hours will be held online through Zoom (link provided in Section 1.7). Attendance is not required. I intend to hold all class sessions in-person except if situational factors arise, such as personal illness of the instructor. Only under these circumstances, the class may be held synchronously via Zoom or recorded for later viewing.

1.6. Technology requirements: These technical requirements will allow you to access the Canvas site successfully, send/receive online communications, complete assigned activities:

a U of M internet ID (your official U of M email address), a reliable, high-speed Internet access, a supported web browser, a laptop or desktop with a working microphone and webcam, R or RStudio installed on your computer (see Section on statistical software below).

2    Course information

Instructor: Sara Algeri

Email: [email protected]

Website: salgeri .umn .edu

Online office hours: Mondays 11:10 AM - 1:10 PM (CDT/CST),


In-person lectures: M,W,F 10:10 AM - 11 AM (CDT/CST),

Ford Hall 130

Teaching Assistant: Lukas Buhler

Email: [email protected]

Online office hours: Tuesdays 3 PM - 4 PM


In-person labs: Tuesdays 10:10AM - 11AM (CDT/CST), Tate B65

Note: Office hours are intended for course-related inquiries only.                                     Every student attending the online office hours is required to activate the video.

2.1.  Course inquires:    Any question related to the course, including homework assign- ments, lecture notes, R code, exams and class organization, must be posted on the discussion board on Canvas.  Please, do not email the instructor or the TA if you have questions  regarding any of the above mentioned categories. Only questions related to your individual  performance should be sent directly to the main instructor or the TA via email.

2.2.  Textbooks:

•  (Required) James, G., Witten, D., Hastie, T., Tibshirani, R. (2013). An introduction to statistical learning. New York: Springer.  (It covers about 70% of the material). Free download at https://www .statlearning .com

  (Required) Faraway, J.J. (2004). Extending the Linear Model with R. Chapman &

Hall.  (It covers about 25% of the material). Free download at

http://ievbras.ru/ecostat/Kiril/R/Biblio/R_eng/Faraway%20-%20Extending %20the%20Linear%20Model%20with%20R%20%96%202006 .pdf

•  (Required) Gelman, A., and Hill, J. (2006). Data analysis using regression and multi- level/hierarchical models. Cambridge university press.  (Chapter 25 only).  (It covers about 5% of the material). Free download at http://ecologia .ib .usp .br/curso_ r/lib/exe/fetch .php/bie5782:00_curso_avancado:uriarte:gelman_hill2007_ data_analysis_using_regression_and_multilevel-hierarchical_models .pdf

2.3.    Statistical  Software:   (Required) RStudio and R. Free download at:  https: //rstudio.com/products/rstudio/download/. Before the first lab you must make sure that the most updated versions of both R and RStudio are installed on your computer.

3    Assessment

3.1.  Homework assignments: The homework is a required part of the course. There will be 10 assignments during the semester and can be conducted either individually or in groups. Each group cannot contain more than 3 students. The homework will assess both the theory component discussed during class and the computational component introduced in the Lab. Assignments will typically be due weekly on Tuesdays. Occasionally, assignments may be due on Sundays and/or biweekly. Late homework will not be graded, but the lowest homework score will be dropped.

After the due date of a given homework assignment, only a few questions among those assigned will be randomly selected and ultimately graded. In light of this, as part of your preparation for the exams, you are solely responsible to check the solutions provided for all the exercises that were assigned to you in the first place.

3.2.  Participation: Participation in class and contribution to the discussion board on

Canvas are encouraged and will be rewarded.  Especially, for those students which will engage in addressing the queries posted on the discussion board.

3.3.  Midterm exams: There will be two in-class midterm exams. They will include both theory and application material but no R coding will be tested.

3.4. Final project: The final project will consist in the analysis of a real dataset (assigned by the instructor to the students) and can be conducted either individually or in groups. Each group cannot contain more than 3 students. The final project will be assigned towards the end of the semester and you will be given at least 10 days to complete the analysis. The final project must be submitted on Canvas. No submission of the final project report will be accepted after the due date.

3.5.  Exam dates:         First Midterm:  October 28 (in-person).

Second Midterm:  December 5 (in-person).

Final project: Assigned early December, due December 15.

3.6.  Grades distribution:         Homework 15%.

First Midterm Exam 25%.

Second Midterm Exam 30%.

Final Project 30%.

3.7.  Grade curve: a score greater or equal than 96% will be required for an A, between 90% and 95% will be required for an A−, between 86% and 89% will be required for a B+, between 80% and 85% will be required for a B , between 76% and 79% will be required for a B−, between 70% and 75% will be required for a C+, between 65% and 69% will be required for a C , between 60% and 64% will be required for a C − . Intermediate scores will be rounded to the nearest integer. E.g., 95.4 will be rounded down to 95, whereas 95.5 will be rounded up to 96.

3.8.  Submitting the wrong files: You are solely responsible for the files being submitted for assessment. Specifically, it is your responsibility to make sure that the files you have up-  loaded on Canvas are the correct ones, that all their parts can be clearly read when open on Canvas. Only what readable through Canvas will be graded, and no later submission of the “correct files” will be accepted. This implies that, if you will accidentally upload a blank file, that will result in a grade of zero.

4    Course policies

4.1.  Letters of Recommendation.  Letters of recommendation may potentially be written for deserving students only after the course has been completed.   Requests for letters will be taken under consideration only for students satisfying all of the following requirements:

 a letter grade no lower than A-,

 participation during the lectures and/or on the discussion board,

• a score ≥ 86% in the final project.

Requests for letter of recommendation must be made at least 3 weeks in advance .

4.2.  Incompletes.  Incompletes will be given in cases of extreme hardship, and when there is a substantial amount of unfinished work that the student is not able to complete.

The student must have a legitimate excuse why the work could not be done on time,

adequate documentation verifying the situation must be provided, and he or she must make arrangements with the instructor as to when the work will be done. Incompletes will not be granted retroactively, i.e., if a student facing hardship decides to complete homework assignments or exams, and requests an incomplete only after seeing the outcomes.  For more information, please refer to the university policy about incompletes.

4.3.  Makeup Work for Legitimate Absences.  Students will not be penalized for absence during the semester due to unavoidable or legitimate circumstances. Such circum- stances include verified illness, participation in intercollegiate athletic events, subpoenas, jury duty, military service, bereavement, and religious observances. Such circumstances do not include voting in local, state, or national elections.  Adequate documentation is required only in situations where the legitimate absence involves missing an exam.

4.4.  COVID-19 policies.

•  COVID-19 symptoms. The instructor acknowledges that the COVID-19 pandemic may increase the likelihood of sickness. You should stay at home if you experience any signs of illness or have a positive COVID-19 test result. If this occurs, please consult with your healthcare provider about an appropriate course of action. I will follow these same protocols and will let you know if the delivery of this course has to be temporarily changed as the result of my own circumstances. Absences related to illness, including COVID-19 symptoms, for yourself or your dependents, that involve missing an exam will require adequate documentation from your healthcare provider.

• Face covering. Up-to-date policy information is available on the Safe Campus page at             https://safe-campus.umn.edu/return-campus/covid-19-prevention-and-wellbeing.

The University expects all community members to respect those who choose to wear

a mask, as well as those who choose not to wear one.

I do not intend to wear a mask in class myself while teaching, but I do intend to wear a mask before and after each lecture. At the end of each lecture, if you need to talk to me, please wait until I have covered my face to approach me. A reasonable distance should also be maintained. While this is my personal choice for what concerns face covering, I fully support your individual choices around masking.

• Vaccines. COVID-19 Vaccinations  (or approved exemptions) are required for all students and employees.

•  Testing. Information on When, Where, and What if for testing is available on MTest webpage at https://safe- campus .umn .edu/return- campus/mtest

Please note that the above policies and guidelines are subject to change. The University

regularly updates pandemic guidelines in response to guidance from health professionals and in relation to the prevalence of the virus and its variants in our community.

4.5.   Scholastic  Dishonesty.  You are expected to do your own academic work and

cite sources as necessary. Failing to do so is scholastic dishonesty. Scholastic dishonesty means plagiarizing; cheating on assignments or examinations; engaging in unauthorized collaboration on academic work; taking, acquiring, or using test materials without faculty permission; submitting false or incomplete records of academic achievement; acting alone or in cooperation with another to falsify records or to obtain dishonestly grades, honors, awards, or professional endorsement; altering, forging, or misusing a University academic record; or fabricating or falsifying data, research procedures, or data analysis.

Scholastic  dishonesty  will  be  considered  a  sign  of disrespect  towards  the  instruc- tor’s  work  and  the  effort  of the  other  students  in  the  class.    Scholastic  dishonesty

will not be tolerated and as per University regulations it will be reported immediately. Any act of scholastic dishonesty will result in failing the course .

4.6.  Appropriate Student Use of Class Notes and Course Materials.  Taking notes is a mean of recording information but more importantly of personally absorbing and integrating the educational experience. However, broadly disseminating class notes, homework and or exams beyond the classroom community or accepting compensation for taking and distributing the course material undermines instructor interests in their intellectual work product while not substantially furthering instructor and student interests in effective learning.  Such actions violate shared norms and standards of the academic community.

4.7.   Disability  Accommodations.   The Disability Resource Center  (DRC) is the campus office that collaborates with students who have disabilities to provide and/or arrange reasonable accommodations. If you have, or think you have, a disability in any area such as, mental health, attention, learning, chronic health, sensory, or physical, please contact the DRC office on your campus (UM Twin Cities - 612.626.1333) to arrange a confidential discussion regarding equitable access and reasonable accommodations. Students with short-term disabilities, such as a broken arm, can often work with the instructor to minimize classroom barriers. In situations where additional assistance is needed, students should contact the DRC as noted above. If you are registered with the DRC and have a disability accommodation letter dated for this semester or this year, please contact the instructor early in the semester to review how the accommodations will be applied in the course.  If you are registered with the DRC and have questions or concerns about your accommodations please contact your access consultant/disability specialist.  Additional information is available on the DRC website: https://diversity .umn .edu/disability/.

4.8.  Mental Health and Stress Management. As a student you may experience a range of issues that can cause barriers to learning, such as strained relationships, increased anxiety,  alcohol/drug problems,  feeling down,  difficulty concentrating and/or lack of motivation.  These mental health concerns or stressful events may lead to diminished academic performance. University of Minnesota services are available to assist you. You can learn more about the broad range of confidential mental health services available on campus via the Student Mental Health Website: http://www .mentalhealth .umn .edu.

4.9.  Sexual misconduct. In my role as a University employee, I am required to share

information that I learn about possible sexual misconduct with the campus Title IX office

that addresses these concerns. This allows a Title IX staff member to reach out to those who have experienced sexual misconduct to provide information about the personal support resources and options for investigation that they can choose to access. You are welcome to talk with me about concerns related to sexual misconduct. Within the requirements of my job, I will be as responsive to your requests for confidentiality and support as possible. You can also or alternately choose to talk with a confidential resource such as The Aurora Center, Boynton Mental Health and Student Counseling Services.