Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


MTH786U & MTH786P

Final assessment

Semester A, 2021/22

 

1    Recognition of spoken digits

The goal of this final coding assessment is to implement, describe and present (multi-class) classification models of your choice for the recognition of spoken digits.  More precisely, the goal is to implement (multi-class) classifiers that take an audio file encoded into an image of size 30 × 30 of a spoken digit from zero to nine as their input and automatically determine digit most likely has been spoken. The dataset to be used is the so-called Audio MNIST dataset and will be provided on the QM+ module page.

This assessment is formed of three parts: 1) For the first part you are required to fill in the missing parts of the provided Jupyter notebook template. 2) You then apply learned concepts from the first part and the module MTH786 in general to the Audio MNIST classification problem. 3) Last but not least, you present your results in a short, written report (written in LATEX) of no more than 8 pages length.

 

1.1    Complete the Jupyter notebook

Download the corresponding Jupyter notebook template and follow the instructions therein. Make sure you fill in any place that says ”YOUR CODE HERE”.  Test your implemen-   tations with the provided test cases.  Different tests are awarded different amounts of  marks.  The total number of marks for this part of the assessment is 40/100 .   Note that this part of the assessment will be graded automatically with the nbgrader  Python package.

 

1.2    Implement & validate classification strategies for Audio MNIST

Once you have completed the first part of the assessment (or have completed as much as you were able to complete), you can use any concept that you have encountered during the first part of the assessment and throughout this module, in order to obtain a classifier that can determine which digit has been spoken in corresponding audio file presented as 30 × 30-pixel image. While you are allowed to use different libraries for visualisation purposes, you can only use NumPy to implement your classifier; tools from libraries such as SciPy are not allowed.

Experimenting with different model approaches, regularisation models & parameters as well as hyperparameter-tuning strategies such as cross validation is recommended. This part will be graded together with the next part. Please feel free to use the provided template notebook for this freestyle part.

 

1.3    Write a report on the problem formulation and your results

You conclude the assessment by writing a report about the problem description and your findings.  The report should be no longer than eight pages and be written preferably in LATEXwith your favourite editor.  If no editor is at hand, please feel free to use online editors such as Overleaf.  This part is marked together with the previous part and the total number of marks for both parts is 60/100.  We refer to the following table for marking guidance on the report and the previous coding part.

Approximate weight

Description

60 %

Quality of the project work itself (as described in the report), taking into account its difficulty. This includes the methodol- ogy and choice of resources, the application of these resources, explanation/exposition and correctness of mathematical no- tation and computer programming and analysis of results.

30 %

Quality of presentation:  Logical structure of the document, clarity and coherence of exposition, correct use of English (punctuation, spelling and grammar) and precise mathemat- ical writing, layout and style, sensible use of sections and sub- sections, lack of typing mistakes, choice of sensible (and stan- dard) notation and other conventions, sensible use of equa- tion numbering,  appropriate use of figures, tables,  charts, diagrams, etc.

10 %

Initiative and ambition  (as described in the report):  How far did you go, or attempt to go?  Did you use only tools from the first part of the assessment, or did you use other methodologies from the lecture notes?