Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


MSCI521: Statistics and Descriptive Analytics


Coursework Guidelines

    You can include any graphs and outputs that you find relevant to the problem in the report,   but make sure that they are properly referenced and interpreted in the text. Remember that it is up to you to interpret what a figure or table shows, not for the marker to infer.

    It is also important to explain how you came to one or the other conclusion. For example, you should explain why you think that there is or there isn’t an effect in the model. Simply stating “there is” or “there is not” is not acceptable.

    There is no need to write summary, introduction and conclusions. Please, just focus on answering the questions.

    It would be helpful ifyou could have separate sections for each question, so that it becomes apparent, what your answer is.

    You should write answers to the questions, assuming that the reader knows the topic. This is not a management report!

    Do not include any appendices (they will be discarded during the marking). You do not need to attach R code either, except for the cases, when the code helps in explaining what you did  and why.

    Attach outputs ofmodels that you are going to interpret – otherwise, how are we going to find out whether your interpretations are correct or not?

    You must submit an electronic version of your report through Moodle.

    Do not include your name anywhere in the work, but please do include your library id!

    Each student will have a different dataset, so make sure that you use the one assigned to you, not to your colleague. Failing to use the correct dataset might result in the “fail” mark for the coursework.

    Your report must be between 1000 and 2000 words and should not exceed 15 pages.

The task

In order to determine the main factors, influencing the price of second hand cars, a company collected data of 137 cars with the following set ofvariables:

    price – price of the car in USD;

    year – year ofmanufacture;

    manufacturer – the brand ofthe car;

    model – the model ofthe car;

    condition – categorical variable, summarising the condition ofthe car;

    cylinders – number of cylinders in the engine;

    fuel – type of fuel used in the car;

    odometer – how many thousands ofmiles the car has done in its life according to odometer;

    transmission – type of transmission;

    drive – type of drive (forward / rare / both);

    size – categorical variable defining the size of car;

    type – categorical variable for the type of car;

    paint_color – the colour ofthe car;

    state – the US state, where the car was sold.

Company does not know if all these variables are important, and they need your expertise in                 explaining which ofthem are needed. They are also interested in few insights about the expected price for some specific cars.

You will need to do the following steps in order to help the company:

1.   Undertake a careful preliminary analysis of the data. Describe the relationships that you find, their possible causes and their practical implications. Explain how you could incorporate        these into a regression model, including variables transformations that you think might be      suitable. [25% mark]

2.   Propose and construct at least two regression models (e.g. with different sets of explanatory variables and / or with different meaningful transformations of some of the variables) and

1                     MSCI521: Statistics and Descriptive Analytics | Department of Management Science 


select the best of them. Justify your choice. Your justification should include a full diagnostic analysis of your selected regression model, making sure that it does not violate the regression assumptions. If it does, then make adjustments in order to improve its quality, or explain why the violation of assumptions is not critical. [45% mark]

3.   Using your preferred model, answer the following questions ofthe company and explain how the answers were obtained: [30% mark]

3.a How does the odometer influence the price of cars? Give an interpretation ofthe relevant parameter(s) in the model.

3.b Does the price on SUV differ from the prices on other types of cars? Ifyes, interpret the value of parameter. Justify your answer.

3.c Do the cars with manual transmission age differently than the automatic ones (i.e. does the year have similar impact on price for them)?

3.d What would be the expected price of an SUV car manufactured in 2017 by Dodge in an excellent condition, with 6 cylinders, gas fuel, automatic transmission, forward     drive, full size, black colour, if it is sold in California and has done 42,000 miles?

3.e What would be the lowest and the highest values of expected price for the car described in (d) in 95% ofthe cases?

3.f What is the 99% interval for the price of car in case of (d)?

Submission

You need to submit:

    The report (two sections) written in Microsoft Word or PDF file (the latter is preferred).

    The title of the report should contain the id of student.

    The report should not contain the name of student.

The file must be submitted on Moodle latest by Monday (31 January 2022) 10am.

Note that the Moodle submission system is very strict in terms of deadline. Do not wait until the last minute to submit your work.

Plagiarism

This is an individual work. Although no one can forbid you from communicating with each other      and discussing the problem, it is expected that your report would be different. You should not give your report to anyone and should not use files of your group mates. Ifwe notice that some files have    resemblance, this will be treated as plagiarism.

Furthermore, software to detect plagiarism will be used in marking. Standard university procedure for  malpractice applies for any detected plagiarism attempt. It is important to cite all the sources used in    the report (such as: url, a paper, a textbook). Make sure that you did not “borrow” any parts ofthe text from anywhere (or anyone) else, including: websites, textbooks, papers, workshop materials, reports    of other students.

Late submission policy

Standard departmental penalties will apply for late work unless you have been given an extension (by departmental coordinators) for exceptional reasons.