关键词 > FIN*4000

FIN*4000 Machine Learning for Economics and Finance Capstone Project

发布时间:2023-04-03

Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

FIN*4000

Machine Learning for Economics and Finance

Capstone Project

Overview:

Your capstone project is an opportunity for you to explore an interesting machine learning problem of your choice in the context of a real-world data set. You should choose a problem that aligns with your  passions and interests and apply machine learning to solve this problem. While you cannot recycle a paper from other courses, you can use machine learning to extend the results from a previous empirical paper. I will provide some project ideas here, but the best idea is to combine Machine Learning with a problem within your passions and interests. For example, I encourage machine learning projects on different subfields of economics and finance such as: corporate finance, ESG, DEI, labor, health, game theory, macro, experiments, sports, marketing, international, growth, development, agricultural, public, political, etc.

I highly recommend that your group discusses your project idea and data with me beforehand to make sure that it is feasible.

Project Write-up (Due April 6)

Write either a research paper or a professional-grade report on your project. If you’re planning to go into academia, you should write a short research paper with an abstract, motivation, data, methodology (machine learning and traditional benchmark), results, and conclusion.

If you are planning to go into industry, you should write a professional report for a very statistical savvy manager or client who would read your report. In either case, your report should have a minimum of 2000, 3000, or 4000 words for groups of 1, 2, or 3, respectively, excluding figures, tables, and references. Use of artificial intelligence   technology (e.g., ChatGPT) for writing is considered academic misconduct and may result in serious consequences including failing   the course. You are expected to include your Python code with the submission with clear commenting, as well as a link to your data, if possible.

Your report should summarize what was the goal of the project, what data you used, what did you do to your data and why. You should clearly explain why the problem is important and why it makes sense to use a machine learning approach instead of the traditional method . How did you use your domain knowledge to create features and clean   the data? Which machine learning methods did you use? Did you manage to solve a particular problem or answer a question using machine learning tools? How well do the machine learning tools compare against existing benchmarks? If your method did not do as well as you were expecting, could you elaborate as to why? What conclusions can you draw from the project? Given your results, how would you extend the project in the future?

Sample Datasets (This list will be updated periodically)

Economics and Finance Datasets:

Many datasets available to MEF students, start here:

https://www.uoguelph.ca/lang/databases

Fama and French Portfolios:

https://mba.tuck.dartmouth.edu/pages/faculty/ken.french/data_librar y.html

Some economics datasets: http://fmwww.bc.edu/ec-

p/data/wooldridge/datasets.list.html

Data from Finance Papers:

(Tip: Paper authors will often release their data on their website. It is  often a good idea to free ride on released data from a published paper, provided you have permission and cite their paper. The data is high quality, already cleaned for you, and their paper already provides a detailed description of the data. Furthermore, you have a natural benchmark, and your paper will likely have a good motivation, e.g., can we predict something better than this published paper. Below are some examples of papers with data, but I encourage you to find data   from papers in the area you are interested in.)

https://sites.google.com/view/jingcynthiawu/yield-data

https://sites.google.com/site/serhiykozak/data

https://mpelger.people.stanford.edu/data-and-code

https://www.openassetpricing.com/data/

https://www.bryankellyacademic.org/

https://sites.google.com/view/agoyal145

https://dachxiu.chicagobooth.edu/

General Datasets:

https://www.kaggle.com/

https://www.kdnuggets.com/datasets/government-local-public.html https://archive.ics.uci.edu/ml/datasets.php                                               https://dataverse.harvard.edu/

Scraping Data:

You can also try scraping your own data (make sure you are doing this    legally). This is a time-consuming so be careful that you do not run out   of time. Additionally, you may have trouble cleaning the data. However, if you do scrape data and do a good job, I will take that into consideration when evaluating your paper (i.e., the bar will likely be lower). You also must make sure your data section is extremely detailed.