关键词 > FIT5145

FIT5145: Introduction to Data Science


Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Semester 1, 2022

FIT5145: Introduction to Data Science

Assignments 2 & 4: Business and Data Case Study

Assignment 2: Proposal

Weight: 5% of the unit mark

Size: up to 1000 words (approx. 2-3 pages).

Submission format: one PDF file

What you need to do:

●    Choose a data science project.

●    Write the  initial two sections, i.e., Project Description and Business Model (References as well if necessary) of the report. You can be creative and include visuals to explain your idea more clearly and in lesser words. This assignment is worth 5% of your unit mark.

Assignment 4: Report

Weight: 10% of the unit mark

Size: up to 3000 words

Submission format: one PDF file                                                                                                                     This report is your analysis of how data science can be used to help solve a particular problem. In your report you need to identify the size and scope of both the problem and the data science project, as well as the requirements of enabling the project.

Your report should have at least (but not limited to) the following sections:

●    Project Description: provide a description about the data science project that you study/propose, what the project is, and what data science roles are involved in this project and what are their responsibilities.

●    Business Model: provide analysis about the business/application areas the project sits in, what are the  challenges  of the project, what kind  of values  the project can create for the specific business area, the data curation and management issues or policies involved in the project, etc.

●    Characterising the Data and Data Processing: characterise the data in the project (i.e., the 4 V's),  provide  analysis  on  the  required  technologies,  software,  and tools  for  data processing according to the specific data characteristics.

    Resources: locate and assess existing or potential resources, software and tools for the project.

●    Data Analysis: specify/propose the statistical methods used in the project, provide analysis on why you choose those methods and discuss the high-level output.

The sections would present aspects of Weeks 1- 10 of the unit for your chosen case study.

The maximum word limit for the report (Assignment 4) is 3000 words.  It may include some/all of your Assignment 2, modified if needed (counted in the 3000 word total). References at the end of the report (i.e., URLs and academic publications) are not included in the word count.

Note that staying within the word limit demonstrates your ability to write concisely. For this reason, the marker may ignore the excess of your submission in Assignment 2 and 4.

Make sure that any resources you use are acknowledged in your report. You may need to review the FIT citation style to make yourself familiar with appropriate citing and referencing for this assessment. Also, review the demystifying citing and referencing guide for help.

How you will be assessed

Assignment 2:   The 5% awarded for your proposal is broken down into the following categories:

    clear description of the goals of the project;

    appropriateness of topic;

    clear description of the business benefits ;

   novelty/creativity (this one is ofextreme importance!);

    overall clarity of the initial report.

Assignment  4:  See the grading rubric to understand how we will grade your report. You will be assessed on your ability to:

Your report will be assessed on your ability to:

●    analyse the role of data in the business model, identify the data curation and management issues;

●    discuss different parts of the data science project from the perspective of the data science process  and  from the perspective  of the roles  such  as  statistician,  archivist,  analyst,  and systems architect;

●    analyse  the  size  and  scope  of data  storage  and  data  processing,  and  present  the  basic technologies in use;

●    locate and assess resources, software, and tools for a data science project;

●    discuss the kinds of data analysis and statistical methods suitable for the data science project;

●    think critically and creatively, providing justification and analysis;

●    being able to support the project with some realistic data (if available in the public domain) or a  mockup/example  dataset  to  clearly  explain  the  proposition,  modelling  approach,  and visualisations that can be derived from it.

Note: Implementation is not mandatory but explanations using a realistic example increases your chance ofgetting a better mark.

For  both  these  two  assignments,  please  make  sure that the Turnitin  scores will be generated properly for your submissions. If a submission receives a high Turnitin score (e.g., more than 15%), the student will likely need to provide further explanation on the project idea and a penalty might be imposed on the submission in case no proper justification is provided.

What you need to do

Before you begin, make sure you:

●    Download the business and data case study samples (available on Moodle) and review them as examples.

o     You may select one of those cases as the basis of your report, but please avoid using those that have been well-investigated, e.g., how Amazon enables personalized product recommendations to its customers.

o     You  are  highly  recommended  to propose your  own  interesting  and novel topic  and please feel free to discuss it with your tutors to ensure the topic is suitable.

●    Have a look at examples of good past student reports that are supplied in the folder under the assignment 2&4 section on Moodle. Please note that the length requirement and other aspects of the assignment were slightly different in the past.

●    Download the marking rubric (available on Moodle) as guidance on how you will be assessed.

Choose a data science project as a case, and then:

●    Do preliminary research about your case and the relevant technologies

    Write and submit your proposal (Assignment 2)

●    Research and prepare your final report with cited references.

●    Submit your report (Assignment 4).

You are free to modify the initial proposal sections submitted for Assignment 2 (especially in response to feedback from your marker), or even change topics, when you are working on Assignment 4.

How to Submit

Once you have completed your work, take the following steps to submit your work. Penalties may be applied to your marks if the following instructions are not followed.

1.   Please ensure you name the file containing your proposal/report correctly using the following format:


e.g., Guanliang_12345678_Assignment2.pdfor Guanliang_12345678_Assignment4.pdf 2.   Upload your assignment file in the corresponding assignment link provided on Moodle.

Further advice on the assignment:

Here is some further advice from the lecturer and tutors regarding the assignment:

1.   Make sure to carefully read the assignment specification above.

2.   The project should be data-centred -- ideally combining multiple sources of data to develop a predictive model that can solve a real-world problem.

3.   The  project  should  contain  a  clear  statement of the problem being tackled. What is the objective/purpose of the project? Have a look at the structure of the example case studies, each one starts with a clear definition of the problem.

4.   Make sure that the benefit of the project is clear. What is it? Will the project have a financial benefit, or result in a social good?

5.   The report needs to be "telling a story", and to be convincing somebody to "invest in your project" so that it can be built.

6.   Try not to make the project too broad. It should be an achievable data science project.

7.   You can include graphics to support claims. For example, depending on your project it may (or may not) make sense to include:

o     an  influence  diagram  showing  what  data  is  available  and  how  it  relates  to  the decisions and objectives of the project,

o     graphs showing some exploratory data analysis (if applicable).

8.   Read up as much as you can on the particular topic you've chosen in order to be able to describe the data (and software) requirements of the project.

9.   Make it clear where the data would come from for the project:

o     Is the data proprietary? How would it be collected?

o     If the data is public, you could even do some exploratory data analysis on it.

10. What preprocessing would be needed? How would the data need to be preprocessed before it can be used? What software might be needed? Can the preprocessing be distributed?

11. Finally, make sure you've seen the set of possible section headings suggested above and had a look  at  the  examples  of  reports  from  past  years.  (Note  though  that  the  assignment specifications were slightly different in previous years.)