Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


BIOL5322M Analytical Skills in Precision Medicine

Second assignment

Read carefully the following instructions and notes

1.   For your second assignment, the task is simple: run an analysis on a microarray dataset, and write a report on the analysis. See further details below.

2.  The objective of this assignment is to assess your data analytic skills on the analysis    of gene expression data, to increase your understanding on the analysis of microarray data.

3.  Check immediately whether you need clarification on the tasks. The deadline for your  coursework is on 27/01/2022. Any submission after 4.30 pm on the day will be              considered as late submission. We have a strict policy on late submission: unexcused late submission of coursework normally results in a deduction of 5% for each calendar

day (not working day) past

the submission deadline.

4.  The time to do your coursework starts now. This means that you have approximately

45 days to work on the task. Please note that the reason for the coursework                 assignment be given early is for you to be able to balance your private study time with other modules’ course works and/or other commitments. Therefore, it is absolutely       not appropriate for you to consider this coursework as an excuse for poor quality          coursework in other modules.

5.  Your report should be written in total of four pages of A4 paper. The first three          pages should be the main report with clear sectioning and the fourth page can only

be used to list references and relevant R codes that you have used (see also point       No 12 below). The sectioning does not have to follow a certain format, but I would         recommend two main formats. First, you may have four sections based on the types of information contained: Introduction, Method, Results, and Discussion/Conclusion.         Secondly, you may base the sectioning on the order of the analysis, for example,          Introduction, Preprocessing, Main Analysis, and Results and Discussion. You do           not need to include all of the R codes that you have used in the fourth page. Include     only the key important ones. This includes, but is not limited to, reading the data,           normalisation, testing for differential expression, and presenting the result table.

6.  The format of the page should observe the following guidelines: the font size should be 11pt or more, and the margins on all sides should be 1.25 cm (0.5 in) or more.

7.  You need to submit both the paper copy of your report and the electronic copy      via VLE. The latter will enable a check for plagiarised works via Turnitin. The         deadline for both versions of the report is the same. If one of them is late, then it   is considered as late submission overall. The electronic copy of the file should be  in PDF format. If you are using Microsoft Word, you need to save it as PDF first    before submitting the PDF version. The name of the file should be in the following format: YourLastName-ModuleCode.pdf. For example, Doe-BIOL5322.pdf.

8.  You need to sign the Declaration of Academic Integrity for Individual Pieces of Work  form and attach it to your printed report when you submit the coursework. Plagiarism carries severe penalty, which may include zero marks.

9.  You are required to analyse one microarray dataset. You may consider any one of

these microarray gene expression datasets from Array Express: (1) E-GEOD-31403 - Clinically Relevant Subsets Identified by Gene Expression

Patterns Support a Revised Ontogenic Model of Wilms Tumor: A Childrens Oncology Group Study, (2) E-GEOD-22470 - Translocations Activating IRF4 Identify                   a Subtype of Germinal-Center-Derived B-cell Lymphoma Affecting Predominantly       Children and Young Adults, (3) E-GEOD-16716 - Transcription profiling by array of     human neuroblastomas: MAQC-II project quality control phase II, and (4)

E-GEOD-12288 - Gene expression patterns in peripheral blood correlate with the extent of coronary artery disease

You are allowed to analyse the same dataset (with a group of friends).However, it is extremely important that, when you write your report, you write it individually.

10. You are also welcome to consider other statistical methods for testing differential       expression (other than the standard t-tests as described in the handouts). However,  when you consider other methods, it will only add to the overall coursework marks if  you go beyond presenting the method. Specifically, it counts only when you describe the idea, principle, and/or insight of the new method and critically assess it in             comparison with the standard t-test from the handouts. I.e. (only) presenting the        new method is not enough.

11. When you consider a different statistical method for testing differential expression,      you need to describe (and analyse the data using) both the standard t-test and the     new method in your report. You need to also present the results of analysis under the standard t-test and the new method, and critically compare them. For this reason,       you are allowed to write the report in total of five pages, instead of four (one page is   still only for references and the key relevant R codes) when you use a new method.

12. Write the report as if you are presenting it to your peers, i.e. other students who take the module. In this regard, write any relevant mathematical notation, for example       for the model or the statistical test involved.

13. Bear in mind that the final “product” of any microarray data analysis is (1) a table    in which you order the results of an analysis such that the first row of the table        should be the most significant gene, followed by the second most significant gene, etc., and (2) a description and conclusion on the overall results. The table should   be managable for the report, e.g. top 10 genes.

14. Having figures in your report will help.

15. The assessment criteria of the report are described below with some guidelines on the marking. The actual marks given will be in gradation from zero to the maximum value.

(a) Presentation of written report (maximum 10 marks)

Poor presentation: 3-5 marks

Reasonably laid out: 6-7 marks

Well structured: 8-9 marks

(b) Clarity of exposition in written report (maximum 15 marks)

Poor clarity: 5-7 marks

Reasonable clarity: 8-10 marks

Good clarity: 11-13 marks

(c) Understanding (maximum 20 marks)

Moderate/reasonable understanding: 7-10 marks

Slightly deeper understanding than that conveyed in the module material: 11- 14 marks

Give insight of the research problem and analysis: 15-18 marks

(d) Data analysis (maximum 30 marks)

Incomplete data analysis steps taken: 8-11 marks

All of the necessary analysis steps are taken: 12-16 marks

More steps are taken to enhance clarity and understanding: 16-22 marks

You go beyond the standard analysis: 23-27 marks

(e) Content (maximum 25 marks)

Reasonable content are included, possibly close to the content discussed in the module material: 10-14 marks

More external content are included: 15-18 marks

A wealth of external content are included: 19-22 marks

The marker has the discretion to adjust the total marks up or down (up to 5 marks)       to be considered as the final coursework marks. This is needed if the total marks does not reflect the overall quality of the report, for a fair comparison between reports.          It is anticipated that this may be needed in very few cases. When the discretion is        used, the marker will write the reason to you.