Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

MATH5916: Survival Analysis

Term 1, 2022

Midterm Test

1. The data below are the follow-up times t for a hypothetical study where + indicates right-censoring and x is the participant’s age.


t

16

20

20

20

23+

x

28

93

76

76

46

(a) Ignoring age for now, create a table for the Kaplan-Meier estimate (t) and an estimate of variance, r( (t)).  Be sure to indicate what the estimates are for each possible value of T ∈ R+ ∪ {0}.

(b) What is the Kaplan-Meier estimate when t = 25?

(c) Suppose now you would like to fit a Cox proportional hazards model with x as a covariate and β its coefficient. What is LP (β), the partial likelihood for β, using Efron’s improvement?  You may use the shorthand notation ψi  = exp(βxi ) for participant i = 1,..., 5.

2. Suppose that the hazard rate for an individual, conditional on a random frailty Y , has the form

hc (t|Y) = Yhw (t)

where hw (t) is the hazard for a Weibull(1,γ) distribution and Y has a gamma(β,λ) distribution. For this setup, derive the:

(a) conditional survival function, Sc (t|Y),

(b) unconditional survival function S(t), and

(c) unconditional hazard function h(t).


Note: For both distributions, use the parameterisation given in the lecture notes. Recall that the moment generating function of a gamma random variable X is

MX (t) = E[etX ] = / β


3. A researcher would like conduct an analysis of the myeloma data to see if the variable Age is associated with survival. An earlier study found Age not to be associated with survival (p  = 0.9) which this researcher believes is due to Age being treated as a continuous variable.

To test their hypothesis, the researcher created the variable agegp which takes on values 0, 1, 2 to represent the age groups < 45, 45 − 60, and 60+ years of age, respectively. With the help of a statistician, the researcher fit the following Cox PH models:


mod1  <- coxph(Surv(Time, VStatus) ~ agegp, data = myeloma) mod2 <- coxph(Surv(Time, VStatus) ~ factor(agegp), data = myeloma)

(a) Write out the symbolic form of the hazard function implied by the models that

were fit to this data. Be sure to define any additional notation you use.

(b) The statistician informs the researcher that these models are nested, but the re-

searcher does not believe them. Using the notation you used in part (a), demon- strate that mod1 is nested within mod2.

(c) Using output below, conduct a formal test to determine which of the two models should be preferred by the researcher.

> mod1$loglik

[1]  -154.1947  -154.1623

> mod2$loglik

[1]  -154.1947  -153.7197