Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECOM193

Statistical Machine Learning in Finance

This project carries a maximum of 100 marks. A 50% weighting will be applied to your overall ECOM193 module score for completion.

You are required to submit a typed document in Word or PDF format containing written analysis together with any supporting tables, graphics and code you think is necessary.

The details of what is required for this project are given on the next page.

This project has an maximum word count of 2500 words excluding computer output and any R code that you choose to submit.

This project must be your own work presented in your own words.

Gradient Boosting

Boosting is a general ensemble method that aims to create a strong classifier from a number of weak classifiers.

Explore and explain in detail the xgboost R package available at https://cran.r-project.org/web/packages/xgboost/index.html. For example, what type of problems is xgboost designed to solve? How exactly does it work? What is its parametrization?

Use xgboost to model the Credit Card Fraud Detection dataset (creditcard.csv) in an appropriate manner of your choosing; see https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud, which has been obtained from Kaggle. You will likely start with some basic exploratory data analysis before moving on to using xgboost properly.

You may use any information about the dataset from Kaggle or elsewhere that you are able glean. You are also allowed to verify or repeat other people’s analyses and to use other people’s code that might be available, provided you give full and clear references to the work of others in your write-up. You may not, however, copy the work of other ECOM193 students.

Please state clearly the aim of each of your analyses and your conclusions even if these do not support what you originally hoped to find. Marks will be awarded for thorough, clear and thoughtful analyses as well as accurate conclusions regardless of overall outcome.