Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit


Question 1 (15 marks)

This question uses monthly returns on the Fama-French manufacturing portfolio, denoted by rt . Consider the following Fama-French three factor model

rt - rft = a + β1 (rmt - rft) + β2SMBt + β3 HMLt + vt ;                               (1)

where (rmt - rft) is the market factor, rft  is the risk free interest rate, SMB is the size factor, and

HML is the value factor.

1.  The expression on the left hand side, (rt - rft), is referred to as excess return on the manu- facturing portfolio at time t.

a.  Provide a deÖnition of the term ëexcess returníon a Önancial asset.  (1pt)

Answer: Excess return on a Önancial asset is deÖned as the di§erence between the return on this

Önancial asset which is considered to be risky (here rt) and the return on a riskless asset (here rft), at time t. The return on a riskless asset is often taken to be the interest rate on a short-term government bond.

b. Explain how this quantity relates to parameter a in (1).  (1pt)

Answer:  The CAPM speciÖcation describes the (linear) relationship between risk and ex- pected return. In its simplest form (and using the above notation)

E (rt) = rft + β1E(rmt - rft);

so that in (1) if a = 0 this implies that an investor earns adequate reward over the risk free interest rate for the amount of risk incurred.  If a ≤ 0 then this implies that an investor earns inadequate / excess reward over the risk free interest rate for the amount of risk incurred.

2. When estimating (1) over the period January 1990 to January 2020, we obtain the results shown in Figure 1.

2.a  Provide the Ötted regression equation. Neatly report the coe¢ cient estimate of the size factor and test for its statistical signiÖcance at  1% signiÖcance level.   Based on your conclusion

interpret this coe¢ cient estimate.  (3pts)

Answer:  The Ötted regression equation is given by:

rft  = 0:004 + 0:866(rmt - rft) - 0:037SMBt + 0:294HMLt

(0:104)       (0:025)                                    (0:034)                      (0:035)

The coe¢ cient estimate of the size factor (SMB) is given by 2 = -0:037. In order to test for its statistical signiÖcance, Örst we deÖne the null and alternative hypotheses:

H0     :   β 2 = 0

H1     :   β 2  0

and use the t-statistic:

2 - 0       -0:037

se 2       0:034

This statistic follows a t-distribution under the null. Comparing with the critical value from the t-distribution at 1% signiÖcance level (and o degrees of freedom (361 observations) we have that It - statI < 2:576, and we conclude that we cannot reject the null and it is statistically not di§erent from zero. This is conÖrmed by the large p-value shown in Figure 1. This implies that the manufacturing portfolio is conprised largely of large cap stocks.

2.b. How would you test for joint signiÖcance of the size and value factors?  Provide all required steps. If you found that the size and value factors were jointly not statistically signiÖcant what conclusion would you draw in terms of (1)? (3pts)

Answer: In order to test for joint signiÖcance for these two factors, we deÖne the following null and alternative hypotheses:

H0     :   β 2 = β 3 = 0

H1     :    at least one is not zero

and use the J-statistic:

J =    RSS0 - RSS1     

RSS1= (T - k - 1) ;

where RSS0 and RSS1 denote the residual sum of squares from running the constrained version of (1) which only includes an intercept and the market factor (2 restrictions imposed), and (1) without restrictions, respectively. T denotes the number of observations, and k are the number of regressors in the unrestricted model.  This statistic follows a chi-squared distribution with 2 degrees of freedom under the null. We need to compare the calculated value for J with the relevant critical value from the x2(2)-distribution at 5% signiÖcance level. If J-calculated is above the chi-squared critical value then we reject the null and vice versa. Non-rejection of the null would imply that the simple CAPM speciÖcation is adequate to explain the systematic risk inherent in the manufacturing portfolio.

3. Use the residuals obtained from regression (1),v^t .

a. Explain how you would check whether the E¢ cient Market Hypothesis (EMH) holds and why. Provide the required steps.  (2pts)

Answer: If the EMH holds, then this implies that there is no predictability in the (excess) returns of the manufacturing portfolio. In turn, this implies that no time dynamics (autocorrelation) ought to exist in the residuals of (1).  One can check this by running two versions of the auxiliary regression:

v^t = y0 + y1 (rmt - rft) + y2SMBt + y3 HMLt + p1v^t)1 + p2v^t)2 + : : : + ppv^t)p + "t ;

or

v^t = y0 + p1v^t)1 + p2v^t)2 + : : : + ppv^t)p + "t ;

where lag length p. We then test the following null hypothesis:

H0  : p1 = p2 = : : : = pp = 0

versus

H1  : at least one is not zero

[either of the two auxiliary regressions is acceptable]

b. Assume that the R2 of the relevant auxiliary regression amounts to 0.56. What conclusion would you draw when comparing your results with the appropriate distribution with 5 degrees of freedom?  (1pt)

Answer:  Given the information on the dof we can deduce that the number of lags p = 5.  Then, the relevant statistic is AR(5) = TR2 = 361 x 0:56 = 202:16.  [0.5pt] The AR(5) statistic follows a x2  distribution with 5 degrees of freedom under the null.  The critical value amounts to 11.07 at 5% signiÖcance level. Clearly the calculated AR(5) > x5(2) from which we conclude that some autocorrelation exists in the residuals which indicates that the EMH does not hold in our sample.

4.  Given the results in Q1.3 we re-run (1) and results are shown in Figure 2.

(a) Explain what change was made to the regression speciÖcation and why.  (1pt)

Answer: Instead of using the usual OLS standard errors we are now using the Newey-West (HAC) standard errors.The reason for making this change is that given that we have concluded in Q1.3 that the residuals have autocorrelation, this is indicative that the assumption of diagonal variance-covariance matrix of the errors for OLS is violated and hence we need to adjust the standard errors so that we make correct inference on the coe¢ cients of our model.

b. For what other reason would you make the same change?  Explain how you would go about testing this property using the residuals in (1). (Hint: we have discussed 3 versions of this test. Either one of these is acceptable).  (2pts)

Answer: Another reason for using HAC standard errors is evidence of heteroskedasticity being present in the errors. The null and alternative hypotheses are now:

H0     :   V (vt) = E (vt) = a2  constant [homoskedasticity] H1     :   V (vt) = E (vt) not constant [heteroskedasticity]

One can consider the Breuch-Pagan or 2 versions of the White test.  All are acceptable. In terms of the Breuch-Pagan test we run the auxiliary regression:

v^t(2) = δ 0 + δ1 (rmt - rft)2 + δ2SMBt + δ3HMLt + 5t :

Again we use an LM type test which is given by W = TR2, where R2  is the R-squared of the auxiliary regression.  Comparing with x3(2)  at 5% signiÖcance level (= 7:81) we can deduce if the errors in (1) are heteroskedastic or not.

c.  Do the results in Figure 2 change your conclusions in Q1.2.a on the coe¢ cient estimate of the size factor?  (1pt)

Answer:  The conclusions drawn in Q.1.2.a remain the same even though the t-stat and corresponding p-value for this coe¢ cient estimate have now changed.

Figure 1

Figure 2

 

Question 2 (15 marks)

Assume a time series {yt} . Its corresponding correlogram is displayed in Figure 3.

1.  Provide a deÖnition for stationarity of a time series. Based in the information in Figure 3 do you consider yt  to be a stationary or non-stationary time series? Brieáy explain why.  (3pts)

Answer:  A time series {yt} is stationary if:

E(yt) = A; constant and Önite for all t

V (yt) = a2 ; constant and Önite for all t

Cov (yt; yt) k) = yk; does not depend on t and only depends on the lag length k .

It is clear from the correlogram that the ACF is decaying as the lag length increases.   So persistence dies down over time. This indicates that this time series is stationary.

2.  Based on the information in Figure 3, a researcher decides to use the following model to Öt yt:

yt = o0 + o1yt)1 + o2yt)2 + "t ;

where "t ~ WN (0; a). Justify his choice.  (2pts)

Answer: It is clear from the correlogram that in addition to the decaying ACF, looking at the PACF it is evident that the Örst 2 lags have signiÖcant partial autocorrelations with the remaining lags having no signiÖcant marginal e§ect on yt .An AR(2) would be a good model to select.

3. Let Ft)1  denote all information available at time t - 1.  Derive the conditional mean of yt given Ft)1  and derive the unconditional mean of yt . What is the condition for this process to

have a constant unconditional mean?  (3pts)

Answer: We have:

E (ytIFt)1)   =   o0 + o1E (yt)1 IFt)1) + o2E (yt)2 IFt)1) + E ("tIFt)1) =   o0 + o1yt)1 + o2yt)2 ;

since yt)1  and yt)2  are known at time t - 1 and E ("tIFt)1) = 0 by assumption. Further,

E (yt)   =

=

o0 + o1E (yt)1) + o2E (yt)2) + E ("t)

o0

1 - o1 - o2 ;

since by stationarity E (yt) = E (yt)1) = E (yt)2) and E ("t) = 0 by assumption.  The condi- tion for a constant unconditional mean is that 1 - o1 - o2  0.

4.  Derive the expression for the 3-step ahead point forecast based in this model.  (4pts) Answer: We start with the 1-step ahead forecast:

E (yt+1IFt)   =   o0 + o1E (ytIFt) + o2E (yt)1 IFt) + E ("t+1IFt) =   o0 + o1yt + o2yt)1 ;

since yt  and yt)1  are known at time t and E ("t+1IFt). [1pt] Next, we have the 2-step ahead forecast:

E (yt+2IFt)   =   o0 + o1E (yt+1IFt) + o2E (ytIFt) + E ("t+2IFt) =   o0 + o1 [o0 + o1yt + o2yt)1] + o2yt

=   (1 + o1 )o0 +o1(2) + o2yt + o1 o2yt)1

Finally, we have the 3-step ahead forecast:

E (yt+3IFt)   =   o0 + o1 [o0 + o1E (yt+1IFt) + o2yt] + o2E (yt+1IFt) + E ("t+3IFt) =   (1 + o1 )o0 +o1(2) + o2E (yt+1IFt) + o1 o2yt

=   (1 + o1 )o0 +o1(2) + o2[o0 + o1yt + o2yt)1] + o1 o2yt                 =   1 + o1 + o1(2) + o2o0 + o1 o1(2) + 2o2、yt + o2 o1(2) + o2yt)1:

5.  Derive the unconditional autocovariance function, yk  = Cov (yt - A; yt) k - A), for k = 0 and k  0, as a function of lagged autocovariances. A denotes the unconditional mean of yt derived

in Q2.2. Here we assume that A = 0.  (3pts)

Answer: We have:

yk     =   Cov (yt; yt) k) = E (ytyt) k) - E (yt)E (yt) k)

=   E (ytyt) k) ;

since E (yt) = E (yt) k) = A by stationarity and here A = 0. Then:

yk     =   E (ytyt) k) = E [(o0 + o1yt)1 + o2yt)2 + "t)yt) k]

=   o1E (yt)1yt) k) + o2E (yt)2yt) k) + E ("tyt) k)

=   o1yk)1 + o2yk)2 + E ("tyt) k)

=   2"if

since A = 0 implies that o0 = 0, and E ("tyt) k) = 0, for k  0.  [It is ok to stop here] One can go further: Set as initial conditions:

y0     =   o1y1 + o2y2 + a 

y1     =   o1y0 + o2y1

y2     =   o1y1 + o2y0

from where we get

o1     

1 - o2

o1(2)    

1 - o2

Therefore we have:

y0     =   y0 + y0 + o2(2)y0 + a 

(1 - o2 ) a                      

y0     =

 

=

(1 + o2 ) !(1 - o2 )2 - o1(2)]

because

-o1(2) - o1(2)o2     =   -o1(2) (1 + o2 )

1 - o2 - o2(2) + o2(3)     =   1 - 2o2 + o2(2) + o2 - 2o2(2) + o2(3)  =   (1 - o2 )2 + o2 1 - 2o2 + o2(2) =   (1 - o2 )2 (1 + o2 ) :

Then

y 1  =                   o1 a                        

(1 + o2 ) !(1 - o2 )2 - o1(2)] ;

and then continue with y2  etc recursively.

Figure 3

 

Question 3 (15 marks)

A researcher is interested in modelling the Nikkei index daily log returns over the period 5 January 2000 to 7 May 2020. He uses a constant mean equation and initially considers an ARCH(5) speciÖcation for the variance equation.

1. Which stylised feature(s) of the Nikkei log returns does the researcher attempt to address by using an ARCH model? Give a brief verbal explanation of the feature(s).  (1pt)

Answer:  Mainly volatility clustering.  The log returns not only are heteroskedastic but their variance exhibits a time varying pattern such that there are periods of low variance which persists which are then followed by periods of high volatility which also persists.

2.  The estimation results from this ARCH(5) model are shown in Figure 4. Write the theoretical model that is implied by the regression output in Figure 4. Explain what conditions are needed on the slope parameters of this model and why. Given the information in Figure 4, are these conditions satisÖed in this case?  (3pts)

Answer:  Denoting the Nikkei log returns by rt  and given the information above, the model is written as:

rt     =   A + 5t ;

5t     =   atut; ut ~ i:i:d:N (0; 1)

a t(2)     =   V (5tIFt)1) = a0 + a15t(2))1 + a25t(2))2 + a35t(2))3 + a45t(2))4 + a55t(2))5 ;

where A = E (rtIFt)1) (constant mean) and Ft)1 is the information available at time t - 1. The conditions imposed on the slope parameters of the variance equation are ai  ≥ 0, i = 0; 1; : : : ; 5. This is required so that a t(2)  is always positive.  Also we need that i(5)=1 ai  < 1 so that the unconditional variance of 5t is well deÖned. From Figure 4 all slope parameters have the correct sign and add up to 0.7 which is less than 1 so the conditions for the model are satisÖed.

3. Next, the researcher considers a GARCH speciÖcation and re-estimates his model. The results are shown in Figure 5.

a. What is his motivation for considering this new model for the variance equation? Derive the relationship between this new model and an ARCH model.   [Hint:  start with the GARCH equation and sustitute recursively the lagged conditional variance component] (4pts)

Answer:  The motivation for generalising the ARCH model is to incorporate further dynamics in the conditional variance equation since the ARCH model might not adequately capture these even with more lags. It is clear from the results of Figure 4 that all lag coe¢ cients are statistically signiÖcant and the inclination would be to add even more lags. A GARCH speciÖcation is a parsimonious way of achieving this.  For the GARCH model here we

have:

a t(2)     =   a0 + a15t(2))1 + a25t(2))2 + β1 a t(2))1

=   a0 + a15t(2))1 + a25t(2))2 + β1  [a0 + a15 )2t(2) + a25 )3t(2) + β1 a t(2))2]  =   (1 + β1 )a0 + a15 )1t(2) + (a2 + β1 a1 ) 5t(2))2 + β1 a25t(2))3 + β1(2)a t(2))2

=   (1 + β1 )a0 + a15 )1t(2) + (a2 + β1 a1 ) 5t(2))2 + β1 a25t(2))3

+β1(2)  [a0 + a15 )3t(2) + a25 )4t(2) + β1 a t(2))3]

=   1 + β1 + β1(2)a0 + a15 )1t(2) + (a2 + β1 a1 ) 5t(2))2

+β1 (a2 + β1 a1 ) 5t(2))3 + β1(2)a25t(2))4 + β1(3)a t(2))4

=   1 + β1 + β1(2)a0 + a1 5t(2))1 + β15t(2))2 + β1(2)5t(2))3

+a2 5t(2))2 + β15t(2))3 + β1(2)5t(2))4+ β1(3)a t(2))4

 

=    + a1匕(&) β 1(i))15t(2)) i + a2匕(&) β 1(i))15t(2)) i)1: [1pt]

Given that a1 +a2 +β1  < 1 and a1 ; a2 ; β 1  ≥ 0 it is the case that β 1  < 1 so that the above expression shows that a t(2)  has an inÖnite (decaying) memory of past terms of 5t(2) .

b. Using the information in Figures 4 and 5 evaluate which out of the GARCH and ARCH

models you would opt for. Explain your reasoning and metrics that you used.  (2pts)

Answer: We notice that models GARCH and ARCH are non-nested since there is no set of restric- tions on the parameters of the GARCH model that can be imposed to obtain the ARCH model. For this reason comparison between the performance of the two models needs to

be determined by use of the Akaike Information Criterion (AIC) deÖned as AIC = -2LT  ╱ 、 + 2(p) ;

where LT    is the likelihood of each model which is penalised for additional parameters

p. Comparing the AIC from Figures 4 and 5 we see that ARCH has a value of -5.78 and GARCH has a value of -5.82.  The GARCH model outperforms since it has the lowest AIC reading.

4. Next, the researcher considers a GJR-GARCH speciÖcation and re-estimates his model. The results are shown in Figure 6.

a. What is his motivation for considering this new model for the variance equation? Write the theoretical model speciÖcation that is implied by regression output in Figure 6 and interpret the coe¢ cient estimate of the threshold parameter.   Is its sign reasonable? Brieáy explain.  (2pts)

Answer:  The researcher must have evidence to suggest that there is asymmetry in the e§ect that past news have on the current value of volatility. In this case, the model can be written as:

a t(2) = a0 + a15 )1t(2) + a25 )2t(2) + 9 It)15 )1t(2)+ β1 a t(2))1 ;

where

It)1 = 

Parameter 9 measures the additional e§ect that negative news has on a t(2) . Given how It)1 is speciÖed, this implies that a positive value for 9 means that the e§ect of a negative news shock has an incremental e§ect on a t(2) .  In Figure 6,  = 0:146 > 0 which makes sense.

b. Using the information in Figures 5 and 6, evaluate which out of the GARCH and GJR- GARCH models you would opt for.  Explain your reasoning and metrics that you used. Provide all steps in your testing procedure to obtain full credit.  (3pts)

Answer: In this case the two models are nested so in order to assess which model performs best we will proceed using the Likelihood Ratio test. We have:

H0     :   a t(2) = a0 + a15t(2))1 + a25t(2))2 + β1 a t(2))1

H1     :   a t(2) = a0 + a15 )1t(2) + a25 )2t(2) + 9 It)15 )1t(2)+ β1 a t(2))1 or

H0     :   9 = 0

H1     :   9  0:

The LR statistic is given by:

LR = 2 !LT  GJR - LT  GARCH] ;

which has a x1(2)-distribution under the null. From Figures 5 and 6 we have

LRcalc     =   2[14572:01 - 14514:06]

=   115:9:

Comparing with x1(2)-distribution at 5% signiÖcance level (= 3:84), LRcalc  > x1(2)(0:05) so that we reject the null hypothesis and opt for the GJR-GARCH model with asymmetric news e§ects on current volatility.

Figure 4

 

Figure 5

 

Figure 6

 

Question 4 (15 marks)

Let Pt  be a random walk process:

Pt = Pt)1 + "t ;

where "t ~ WN 0; a2.

1.  Show that for an initial condition P0 = 1 we have that:

t

Pt = P0 +"i ;

i=1

and compute E (Pt).  (2pts)

Answer: We have:

P0     =   P0


P2     =   P1 + "2 = P0 + "1 + "2

 

t

Pt    =   P0 +"i:

i=1

Then

t

E (Pt) = E (P0) +E ("i) = P0 = 1;

i=1

since E ("i) = 0 for all i by assumption.

2.  Show that yk = Cov (Pt; Pt) k) = (t - k) a2 . Brieáy comment on this result.  (3pts)

Answer: We have:

yk     =   Cov (Pt; Pt) k) = E [(Pt - E (Pt))(Pt) k - E (Pt) k))]

=   E [(Pt - P0)(Pt) k - P0)]

=   E ┌╱ "i ← ╱ "i ←!

=   E [("1 + "2 + : : : + "t)("1 + "2 + : : : + "t) k)]

=   E [〉"1(2) + "2(2) + : : : + "t(2)) k] = (t - k) a2 ;

since E ("i"j) = 0; i  j , V ("i) = E "i(2)- E ("i)2  = E "i(2)= a2 , and E ("i) = 0. This result implies that Pt  is non-stationary since the covariance function depends on time.

3. Assume the corresponding log-return is distributed as follows: rt ~ N Ar; ar(2):

a.  Show that the simple net return has a log-normal distribution with: E (Rt) = eu +0:5祁(2)  - 1:

(4pts)

[Hint: Use lnE (a) = E [ln(a)] + 0:5V [ln(a)].]

[Hint: Recall that rt = ln(1 + Rt).]

A1n.swer: We have:

ln[E (1 + Rt)]   =   E [ln(1 + Rt)] + 0:5V [ln(1 + Rt)]

=   E (rt) + 0:5V (rt)

=   Ar + 0:5ar(2)

Then taking exponential on each side we have:

E (1 + Rt) = eu +0:5祁(2)

or

E (Rt) = eu +0:5祁(2)  - 1:

b.  Show that the simple net return has a log-normal distribution with: V (Rt) = e2u + 祁(2)  e 祁(2)  - 1:

(6pts)

[Hint: Recall that rt = ln(1 + Rt) and start with deriving lnE (1 + Rt).]

[Hint: Use the fact that lnE (a) = E [ln(a)] + 0:5V [ln(a)].]

[Hint: Recall that V (Rt) = E Rt(2)- E (Rt)2 .]

Answer: We have that

V (Rt) = E Rt(2)- E (Rt)2 :

We need to obtain E Rt(2). Following similar steps to Q4.3.a. we have:

ln !E (1 + Rt)2]   =   E !ln(1 + Rt)2] + 0:5V !ln(1 + Rt)2]

=   2E ln[(1 + Rt)] + 0:5V [2ln(1 + Rt)] =   2E (rt) + 0:5 x 4V (rt)

=   2Ar + 2ar(2)

Then we have:

E !(1 + Rt)2] = E [〉1 + Rt(2) + 2Rt] = e2u +2 祁(2):

Hence:

Rt(2)   =   e2u +2 祁(2)  - 1 - 2E (Rt)

=   e2u +2 祁(2)  - 1 - 2 eu +0:5祁(2)  - 1

=   e2u +2 祁(2)  - 1 - 2eu +0:5祁(2)  + 2

=   e2u +2 祁(2)  - 2eu +0:5祁(2)  + 1:

Therefore:

V (Rt)   =   e2u +2 祁(2)  - 2eu +0:5口祁(2)  + 1 - eu +0:5口祁(2)  - 12                         =   e2u +2 祁(2)  - 2eu +0:5祁(2)  + 1 - e2u + 祁(2)  - 2eu +0:5祁(2)  + 1

=   e2u +2 祁(2)  - e2u + 祁(2)  = e2u e 祁(2)  e 祁(2)  - 1= e2u + 祁(2)  e 祁(2)  - 1: óóóóó END OF EXAMINATION óóóóó