ECON10005 Quantitative Methods 1 Assignment First Draft


ECON10005 Quantitative Methods 1

Assignment: First Draft

Assignment Guide

You are submitting this assignment as a part of the data analysis report.   This is the first draft version. This draft assignment provides you with some experience working with data, which will help you complete the data analysis report (final draft) submitted in week 11.  You may complete the questions individually or in a group of no more than three people.  You will receive new tasks after this rst draft has been submitted and marked with feedback.


The assignment is due on 6 April.  Detailed time and more instructions are delineated on Canvas along with this le.

The rst draft contributes 3% to your nal marks.

We use Turnitin, an originality and plagiarism checking tool, to check the similarity in students’ work.  Please ensure you or your group independently write the assign- ment from the other students and groups and submit your own work.  Zero-mark penalty applies to those who plagiarise.

No extension is allowed. Any assignments not submitted by the due date and time will incur 10% penalty for each full hour late until the zero mark.  Namely, if you submit your assignment 10 hours later than the deadline, your assignment will not be marked.

Assignments must be typed and converted into a single PDF document before sub- mitting online via Canvas. Scanned or handwritten assignments will not be marked. Figures or tables in a separate Excel le are not accepted.

Please make sure to include a cover page in the assignment. Your Name(s), Group ID, student ID(s) and your tutor’s name must be included on the cover page.

A group must comprise no more than three students from the same tutorial . The link for group registration will be activated soon.

Students must preview their assignment after uploading it on Canvas to see if they have uploaded the correct/complete le and if the formatting matches their origi- nal document.  Any version of the assignment submitted after the deadline due to

formatting issues or submitting an incomplete version will not be accepted.

The rst draft has a 700 word limit.

The detailed tasks are on the next page.


Your mission is to advise a potential client on the housing market in a small city in the U.S. Historical transaction data will be provided to you by your tutor. There are two sheets in the file.

Sheet 1 (data) displays the data. The yellow-coloured column is the sale price. It is the key variable that the client is interested in. The other columns are the explanatory variables to provide information for the sale price.

● Sheet 2 (description) defines the variables’ names from Sheet 1.

Notice that you are not supposed to promote selling or buying. Your task is to provide a clear picture for the client to understand the market condition. E.g., what is the average price for a newly built house? What is the additive value of more land size or an additional bedroom?

First Draft Tasks

Admittedly, there is no unique way to write a business report.  Meanwhile, we can start with some essential features shared among most data analyses. Considering the format of this assignment might be unfamiliar to students, the rst draft is designed as a sequence of scaolded tasks. We will guide each pivotal step and prepare you for the nal draft.

1. Use Excel to obtain the descriptive statistics, including mean, median, standard de- viation, quartiles, IQR, maximum, minimum and CV for all variables. Provide these statistics (including the sample size) in a table as Table.  Compare and contrast these statistics as appropriate.


(a) A narrative example can be found in the tutorial questions such as the three- asset problem. Some suggested items are

● Describe the sale price characteristics. Are there any outliers?

● How about the mean and median values? Do they make sense?

● What is the interpretation of the dispersion measures?

(b) There is no unique way to describe the data. Not all variables should be equally addressed.   The focus depends on the application and the presenter’s  (your) view.

(c) You may rst wish to explore some interesting insights and pick three impor- tant variables, including the sale price, to discuss.  Note that important” is subjective and requires your judgement.

2. Naturally and economically, our focus is the sale price.  What are the correlations between the sale price and the other explanatory variables? Interpret your results.


(a) An explanatory variable is the variable in the Excel sheet except for the Sale


(b)  Some suggested items are

Which variable has the largest correlation with the sale price? Is it intuitive?

You may create a table as Table.

You may create a bar chart similar to the one from the lecture here. Replace the X-axis labels with the variable names and the bar height with the values of the corresponding correlations.  Such a gure seems more friendly to a client.

3. Use data visualisation techniques to illustrate the sale price distribution. Recall that we have discussed the histogram and boxplot for one data series  (one column in Excel).  Use these visual aids to help illustrate the distribution of the sale price and some other variables that you consider essential.


(a) There is no need to exhaustively list all kinds of gures for all variables.

(b) You may choose three variables, including the sale price, for a more detailed discussion.

(c)  Some potential items are

● Mean and median. How different are they?

● Skewness and outliers. Could there be any over or under-sells?

● Mode(s).   Are there any multimodal distributions?   If yes, what does it mean? Could there be any story behind it?5

4. A scatter plot is a simple and convenient approach to revealing patterns.  To study the relationship between the sale price and the other variables, draw some scatter plots and interpret your nding.


(a) There is no need to draw all scatter plots exhaustively. Displaying two or three figures to show interesting features is sufficient.

(b)  Sale price must be on the Y-axis since it is our focus variable.

(c) You may use the correlation coefficients from Question 2 to choose explanatory variables. Which explanatory variable seems more important?

(d) Be careful of your interpretation. Correlation is not causality. Rubrics are on the next page.


The rst draft will be evaluated aggregately by incorporating the following four criteria: accuracy, logic, format and discovery.  Because reports are highly heterogeneous, detailed mark split is impractical.  You will receive an overall mark and written feedback on your work.

More detailed guidance is listed below.

1. Accuracy.

● Use the correct columns of data to be consistent with your choice in the report.

● Use the correct Excel formula.  This is hardly testable but will be reflected in your numeric results.

● Use the correct names for descriptive statistics and gures.

● Use the correct variable names in your report.

2. Logic.

● Sentences and paragraphs must be coherent and cohesive.

● Any statement should have data evidence or build on consensus or experience.

● Demonstrate that you understand the concepts learned from the subject.

3. Format

Clear title and section names.

Each paragraph has one clear message. Avoid overlong sentences.

Label figures and tables correctly. For example, you may use Table 1 and Table 2 for tables as in this le. Analogously, use Figure 1, Figure 2 and so on to label figures.

Label a gures X- and Y-axis properly.

Write titles for tables and gures.

Avoid screenshots. Excel gures can be saved properly.

Show page numbers.

Not many grammar mistakes and typos.

4. Discovery

Show your curiosity by discovering insightful facts from the data. Try to link the application to some real-world problem.

Think about the business world and consider what a client desires and if you may provide such a solution.