Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

32146  Data Visualization and Visual Analytics

2022 Spring Semester

Assignment One: Data Collection and Visual Analytics (30%) – individual

This assignment aims to ensure that students understand the large variety of property data types and sources. Property data visualisations and interaction tools are frequently used for property market research and property analytics, and this assignment mimics an analyst’s role in real life. This assignment also ensures that students understand the different visualisation techniques when dealing with other forms of property data.

Students must select an appropriate property data source and type and then collect relevant economic and property data for their chosen suburb. Students have to store data in the format style as an example dataset related to the suburb’s property economics and/or built environment contexts.

Word limit:    10 pages, including tables and graphs, excluding bibliography.

Due date:       Sunday 4 Sep 2022 11:59 pm

General Requirements:

Students must select one suburb from the Sydney suburbs list, select the appropriate property data source and type, and collect the necessary dataset. Please check the latest list in Canvas.

One student for this assignment can only select one suburb. The collected dataset should be the same as the example dataset, including relevant economic and property data for that suburb between 2001 and 2021. Students who use ABS Census data, which has five separate datasets for 2001, 2006, 2011, 2016 and 2021, should use State Suburbs (SSC) level statistical dataset, which is compatible with PriceFinder data, RP data and other data sources. The dataset collated by students should contain at least seven categories, including but not limited to the following:

1). The suburb’s property median price

2). The suburbs house finance status, personal and family finance status

3). The suburb’s ownership and household information

4). The suburbs dwellings information

5). Family information

6). The suburb’s population and marriage status

7). Unemployment and employment status (2021 data are not available until Oct 2022)

Please make sure the data is correct without any mistakes. The dataset should be saved in an Excel file (named as Student-ID-Ass1.xlsx).

The Greater Sydney’s sample dataset and styles:

 

After collecting the dataset, students must analyse and visualise the data for the relevant time series between 2001 and 2021. Statistical summaries of each category of data should be generated. Students must select the particular visualisation technique most suited to their dataset based on the data type, attributes and characteristics, and the desired form of visual representation. Students should be aware that the viewing and interaction schemes are vital concepts in visualisation.

Students  should  create  several  visualisation  graphs  involving  labelling  techniques  and  trends  analytics.  All categories of the data should be compared across several visualisations and graphs. Students must also provide commentary on these trends' real-world causes and implications. All visualisation graphs should be generated and saved to an Excel file (Student-ID-Ass1.xlsx).

Storytelling is the key when attempting property data visualisation in this assignment. The visualisation should explore the total dataset in a sufficiently specific level of detail to enable the reader to understand the attributes and

trends of the particular data the student has found.

Students must cite all data sources and references used.

The weighting of this assignment is 30% of a student’s overall final grade.

Detailed Requirements:

1.   Make sure all data have to be correct in the standard format. Each incorrect data will deduct ONE mark.

2.   Exclusive summarise the suburb’s profile through each category’s data. Indicate where the dataset came from, and highlight the data’s attributes and characteristics. Data attributes should be adjusted to fit the visualisation techniques the student intends to use. The dataset has to submit with an assignment report. (5 marks)

3.   Select the different method that you believe is the most appropriate to represent the dataset, and illustrate the data graphically in time series by using designed a) layout techniques; b) rescaling axes techniques; c) labelling techniques; d) trends techniques; e) highlight and commands inserting storytelling techniques. All categories should be compared across the entire visualisation process. Those visualisations should be based on the concept of property economics, including

1.   Supply and Demand

    Property supply and demand status (ratio between dwelling supply and population)

2.   Price

    Property price (house and unit) movement

3.   Finance

    Finance status (household, family and personal finance status)

4.   Population

    Population change and marriage status

5.   Ownership

    Household ownership status

6.   Workforce

    Part-time, full-time and unemployment (without 2021 data)

7.   Dwelling

    Property dwelling status

8.   Family                    Family status

All visualisation graphs should be saved in an Excel file (Student-ID-Ass1.xlsx). And those trend analysis graphs should be used in the report as well. Weight is 15 marks for this part.

4.   Write a report explaining how you dealt with data node-overlap / data edge-crossing / re-scaling in your data visualisation, particularly in combining multi-dimensional data. Describe the graphic attribute designs and labelling techniques used in your data visualisation and how they enhanced the readability and storytelling of the visualisation. Highlights any trends and breakthrough analysis you have discovered through the data visualisation process, particularly the price movement visual comparison. Concludes overall, you would give any recommendations to a buyer or investor for this suburb. Summarise the advantages of the visualisation

approaches you have used. (10 marks)

Submission method:

The assignment must be submitted via UTS Canvas in PDF or Doc format for your report (Student-ID-Ass1.docx/ or pdf) and Microsoft Excel format for your dataset and graphs (Student-ID-Ass1.xlsx). The fake data results in ZERO for this assignment. There will be a link to the submission form set up on the subject homepage. Note that late submission will incur a penalty of 10%.

Assignment Two: Advanced Data Visualisation (30%) – individual

This assignment aims to ensure that students understand the high-dimensional data types and format. The high-dimensional  data visualisations required using the  different  interaction  and  illustration tools.  This assignment mimics an analyst’s role in real life. The assignment also ensures that students understand the various visualisation techniques when dealing with other forms of high-dimensional data.

Students must analyse and visualise the Tennis dataset containing US Open championship matches, which includes 141 years of championship matches, both men and women, between 1881 and 2021. Dataset has various data types and forms, including year, gender, champion’s name, nationality, champion seed, match time, runner-up’s name, nationality, and score. Students have to use the required method to analyse and

visualise, which needs to convert into a different format for comparison.

Word limit:    15 pages, including tables and graphs, excluding bibliography.

Due date:       Sunday 9 Oct 2022, 11:59 pm

General Requirements:

Students must use the US Open Tennis dataset, which can be found and downloaded from Canvas. After downloading the dataset, make sure to rename the dataset as Student-ID-Ass2.xlsx. The US Open Tennis dataset styles are as follows.

 

There are three blank columns for Champion Seed, Mins, and Runner-up Seed. Those three values hadn’t been appropriately recorded before 1945, so we removed them from the dataset. Two columns have been created and filled for champion and runner-up countries because Tableau doesn’t recognise the nationality code. In the scoreboard field, data is the text format that couldn’t compare. We have converted it into 10x new columns representing each set of win and loss.

Students should create several new data sheets inside the Student-ID-Ass2.xlsx file to import them into Tableau apps for visual analysis. Several visualisation graphs need to be created, including Treemap, Parallel

coordinates, Geo-map, etc. Students must complete the champion’s win rate for champion and runner-up performance analysis and visualisation.

Storytelling is the key when attempting sports data visualisation in this assignment. The visualisation should explore the whole dataset at a sufficiently specific level to enable the reader to understand the attributes and

trends of the particular champions performance against the different players.

Students must cite all data sources and references used.

The weighting of this assignment is 30% of a student’s overall final grade.

Detailed Requirements:

1.   Exclusive summarises the US Open Tennis dataset and indicates data’s format, value and characteristics. Explains the visualisation techniques used in this assignment. The dataset with Tableau files has to submit with an assignment report. (5 marks)

2.   Select the different visualisation techniques to analyse players’ nationalities, genders, and performances in time series and group by nation. Illustrate the data graphically in time series, genders, or country by using designed a) layout techniques; b) rescaling axes techniques; c) labelling techniques; d) trends techniques; e) highlight and commands inserting storytelling techniques. Those visualisations should base on the concept of tennis players’ performance, including

1.   Treemap

    Analyse the player’s pattern between the champion’s nationality, gender, score, etc.

2.   Parallel coordinate

    Analyse the relationship between time, champion’s nationality, gender, score, etc.

3.   Geographic Map

    Analyse the champion's location and performance.

4.   Win rate performance chart

    Analyse performance patterns of top players (players who won 5 or more championships, both

men and women).

Excel files, Tableau files or other visualisation apps should be saved and zipped into a file (Student-ID- Ass2.zip). And those analysis graphs should be used in the report as well. Weight is 15 marks.

3.   Write a report explaining how you dealt with high-dimensional data in your data visualisation, particularly in combining multi-dimensional data. Describe the graphic attribute designs and labelling techniques used in your data visualisation and how they enhanced the readability and storytelling of the visualisation. Highlights any trends and breakthrough analysis you have discovered through the data visualisation process, particularly the top player’s performance patterns in the visual comparison chart. Concludes and

summarises the advantages of the Tableau or other visualisation apps you have used. (10 marksSubmission method:

The assignment must be submitted via UTS Canvas in PDF or Doc format for your report (Student-ID- Ass2.docx/ or pdf), and zipped Excel file + Tableau files (Student-ID-Ass2.zip). The fake data results in ZERO for this assignment. There will be a link to the submission form set up on the subject homepage. Note that late submission will incur a penalty of 10%.

Assignment Three: Applied Data Visualisation (40%) – individual

This assignment aims to ensure that students understand the large variety of Australia International Trade datasets and data types.  Students will learn data  statistical  and  analytical patterns and use the different visualisation techniques to present those patterns and uncover data stories inside the dataset.

Australia International Trade dataset extracted from ABS Statistics data contains over 30 years of data between 1988 and 2021. The dataset has import and export information, including 10 main categories and 67 sub-categories. Each sub-category involves the multiple industry's performances on productivities and resources.

Word limit:   20 pages, including tables and graphs, excluding bibliography.

Due date:       Sunday 6 Nov 2022 11:59 pm

General Requirements:

The dataset for assignment 3 can download from the online Canvas site. After downloading the dataset, Students must rename the dataset file as Student_ID-Ass3.xlsx.

Students should create several new data sheets that can import into Tableau to analyse and visualise the statistical and analytical patterns. Students should use the colour patterns to separate the import and export status and apply them to labelling techniques and trends analytics. All categories should be compared across the import and export in the visualisations graphs.

Combined with data visualisation techniques learned during classes, including interactive visualisation skills, the students should create the statistical and analytical patterns between main categories and sub-categories to compare the import and export status. The visual comparison needs to develop for the main categories and selected sub- categories. Find and explain any trend and breakthrough point during analysis and visualisation.

The dashboard and storyboard need to create for storytelling which is the critical component for data analysis and visualisation in this assignment. The visualisation should explore the total dataset at a sufficiently specific level to enable the reader to understand the import and export categories and the trends.

Students must cite all data sources and references used.

The weighting of this assignment is 40% of a student’s overall final grade.

Detailed Requirements:

1.   Create statistical and analytical patterns in the Excel file and import them to visualisation apps. Use Tableau or other visualisation apps to create time series visualisation graphs for both statistical and analytical patterns. (5 marks)

2.   Analyse the relationship between the main category and sub-category. Find major trends and change points from the main category and find the reason to explain them. (5 marks)

3.   Create the dashboard to explore ONE main category and its sub-categories for statistical and analytical patterns. Explain the uncovered trends and change points. (10 marks)

4.   Create the storyboard combining all visual graphs to summarise what you have found from the main category to the sub-category analysis, particularly the main category chosen above. (10 marks)

5.   Write a report explaining what you have found through this international trade data visualisation process. Describe  the  graphic  attribute  designs,  colour  patterns  and  labelling  techniques  used  in  your  data visualisation and how they enhanced the readability and storytelling of the visualisation. Highlights any trends  and breakthrough  analysis you have  discovered through the patterns  comparison  and the  data visualisation  processing,  particularly  the  selected  category  and  sub-categories  visual  comparison. Concludes what you would give any recommendations to the industries that the chosen category related. Summarise the advantages of the dashboard and storyboard you have used. (10 marks)

Submission method:

The assignment must be submitted via UTS Canvas in PDF or Doc format for your report (Student-ID-Ass3.docx/ or pdf), and zipped Excel file + Tableau files (Student-ID-Ass3.zip). The fake data results in ZERO for this assignment. There will be a link to the submission form set up on the subject homepage. Note that late submission will incur a penalty of 10%.