关键词 > Python代写

Advanced (Business) Data Analytics – 2022 S1 – Assignment 2

发布时间:2022-05-21

Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

Advanced Business

(Data) Analytics

ASSIGNMENT 2

Summary

•    Type: Project report, individual assignment

•    Learning Objectives Assessed: 1, 2, 3, 4, 5

•    Due Date: 17 Jun 2022, 13:00

•    Deliverables:

o Report in the format of Python script only

o You need to use the provided .ipynb file as A2 template

•    Weight: 50%

•    Deliverable: .ipynb file

The aim is to provide experience in the steps involved with text preparation, text feature generation, visualization and evaluation of the importance of the generated text features. Feel free to discuss concepts and ideas with peers but remember your submission must be your work. Be careful not to allow anyone to copy your work. You need to research text analytics and Python functionalities if you aim to achieve excellent marks.

Specification: How Does Social Media Impact Bitcoin Value?

Digital currency was first introduced in the 1990s in the form of stored value cards for peer-to-peer (P2P) payments that did not require bank authorization. Bitcoin represents a new form of digital currency that uses cryptography and IT to facilitate P2P transactions. Since its invention in 2008, bitcoin has captured the attention ofthe business world. In August 2017, the market capitalization of all bitcoins in the world surpassed US$73 billion (Mai et al., 2018).

Bitcoin provides a unique opportunity to understand the economic value of social media and its role in catalyzing the spread of fintech innovations. Thanks to the focus of the media and a generation of investors who are vocal on social media, emotions of bitcoin investors are increasingly visible online. Online discussions about bitcoin are also abundant in quantity and diverse in form.

Bitcoin’s emergence has the potential to pave the way for a technological revolution in financial markets. In this project, you will examine the interactions between social media and the monetary value of bitcoin using textual analysis. Integrating these new aspects into economic models can improve the understanding of how social media interacts with the markets.

You investigate the following question: Is there a predictive relationship between social media and bitcoin value?

Objective:  Applying  text  analytics  techniques  on  tweets  written  about  bitcoin  to  uncover  the relationship between written tweets and the bitcoin price.

Dataset

A2 dataset consists of tweets collected from Tuesday 11th January 2022 to Saturday 19th March 2022. The data include user information, tweet text, and a target variable which indicates whether or not there has been a Rise or Fall in bitcoin price after the tweet. Table 1 shows the regular attributes of the dataset.

Table 1 A2 data attributes

Attribute

Description

user_name

Username or ID

user_location

Location of user/tweet

user_description

Users description/bio on their profile page

user  created

The date the users account was created

user_followers

Number of followers a user has

user_friends

Number of friends a user has

user_favourties

Number of favourite tweets by a user

user_verified

Whether the user is verified

date

Date of tweet

text

Text of the tweet

hashtags

Any hashtags associated to the tweet

tweet_source

Source location of tweet (e.g., online, iPhone app, Android app)

user_days_on_twitter

Number of days a user has held a twitter account

RiseFall

Whether or not after 1 hour of the tweet the bitcoin price has had a

Riseor Fall

Your task is to

   prepare text,

   apply ML techniques to generate features,

   provide visuals about text, and

   demonstrate the relationship between the extracted features and target variable.

You will need to analyze tweets, extract their features and then investigate if the extracted features have an impact on target variable. To this aim, you need to:

   apply the required steps to prepare and clean text,

   extract the text features such as sentiment, SVD, …

   apply available techniques, such as topic modeling and wordcloud to describe the tweets            use only one technique along with 6-folds cross validation to show that the extracted features

have relationships with target variable.

Deliverables

Note that using Python can be challenging, and you will need to do your own research. If you chose to use Python functions that are not used in the tutorials, you need to research it.

Your reports should be delivered in .ipynb file. A notebook template is provided to show how you can structure your work. You need to use the template and strictly follow its format which is designed based on the provided A2 rubric.

It is useful that add some comments next to your codes to explain it briefly.

You will get higher marks if your approach is innovative. It means no other student has applied it, or only a few others have applied your approach with some differences. So it is highly advised that you don’t share your creative work with anyone else. You can still discuss ideas and help each other.

Submission

To be done through Blackboard Assignment Submission, as indicated in Learn.UQ. The only acceptable submission format is .ipynb file. The file should be named in the format of YourStudentID.ipynb

You need to submit only one Python file. Before submission, make sure that all the important outputs are shown in your notebook. Avoid showing your data in the notebook. So make sure to remove codes such as head() before submission.

Plagiarism

It is understandable that students talk with each other regularly and discuss problems and potential solutions. However, it is expected that the submitted assignment is a unique document all parts of the assignment are to be completed solely by the individual student.   In cases where an assignment is perceived to not be a unique work, a loss of marks and other implications can result.   For further

information about academic integrity, plagiarism, and consequences, please visit:

http://ppl.app.uq.edu.au/content/3.60.04-student-integrity-and-misconduct.

Administrative Requirements

Deadline extensions

An extension to the assignment deadline will only be considered for legitimate reasons and with supporting documentation. A request for an extension is assessed by the Assessment, Examinations & Misconducts Coordinator. You need to make a formal extension request using the form identified on the Electronic Course Profile for this course. Extensions will not be granted where the school is not satisfied;  you  took  reasonable  measures  to  avoid  the  circumstances  that  contributed  to  you  not submitting by the due date.