Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECMT: Econometric Applications Problem

Set 5 Solutions

Semester 2 2022

Question 1. Computer Exercise: Racial Discrimination in the US Market for Home Loans

(i)  If there is discrimination in loan approvals against minorities, and the appropriate factors have been controlled for, then the sign of β1  is expected to be positive.  This would indicate that,

other things equal, white are more likely to receive loan approval.

(ii)  OLS estimation results:

arove = 0.7143 + 0.1856 white

(0.0260) (0.0284)

n = 1000,     R2  = 0.0411,     2  = 0.0402

The coefficient on white means that, in the sample of 1000 loan applications, an application submitted by a white person was 18.56 percentage points more likely to be approved than that of a non-white applicant. To check statistical significance:

Test:

0  : β 1  = 0

1  : β 1  > 0

Test Statistics:

βˆ1       

se (βˆ1 )

0.1856

= 0.0284

= 6.54

Rejection Rule:  Reject 。0  in favour of 。1  if t  >  c, where t is the t-statistic and c is the critical value for the t-distribution with df = 1000 − 1 − 1 and a 1% significance level. Now t = 6.54 and c = 2.326.

Decision:  Since t  > c we reject the null in favour of the alternative at the 1% significance level.

Conclusion: There is a statistically significant higher probability that whites will be approved over others.

The difference in probability of loan approval for whites compared to others is also practically large – 18.56% is large (the average approval rate for whites is 0.8999 and for non-whites is 0.7143).  Is this evidence of discrimination?  It may reflect discrimination or it may reflect differences in credit risk etc.  that differ between whites and non-whites. We probably can’t claim this is discrimination as other factors that may be related to a non-discriminatory loan

approval process have not been controlled for in the model.

(iii)  Model estimates, where the dependent variable is approve, are:

Table 1: OLS Results

 

Variable

OLS

WLS (viii)

β

S.E.

Robust S.E.

β

S.E.

Robust S.E.

white

0.1612    (0

.0284)

[0.0375]

0.1079    (0

.0825)

[0.0541]

obrat

0.0040    (0

.0012)

[0.0015]

0.0011    (0

.0010)

[0.0031]

loanprc

0.2404    (0

.0553)

[0.0551]

0.3542    (0

.0435)

[0.1119]

unem

0.0091    (0

.0047)

[0.0053]

0.0029    (0

.0059)

[0.0092]

male

0.0108    (0

.0285)

[0.0287]

0.0579    (0

.0219)

[0.0284]

married

0.0449    (0

.0242)

[0.0255]

0.0182    (0

.0229)

[0.0290]

dep

0.0087    (0

.0099)

[0.0107]

0.0081    (0

.0084)

[0.0226]

sch

0.0215    (0

.0250)

[0.0262]

0.0322    (0

.0279)

[0.0325]

cosign

0.0070    (0

.0647)

[0.0596]

0.0947    (0

.0415)

[0.0582]

constant

1.0585    (0

.0720)

[0.0793]

1.0481    (0

.1053)

[0.1132]

 

n = 1000

 

 

n = 1000

 

 

R2  = 0.0850

 

 

R2  = 0.0931

 

 

2  = 0.0767

 

 

2  = 0.0849

 

 

When we add the variables obrat, loanprc, unem, male, married, dep, sch and cosign as controls, we obtain βˆ1  = 0.1612, se (βˆ1 ) = 0.0284. The coefficient has fallen because we are now controlling for factors that should affect loan approval rates, and some of these differ by

race.  On average, this model suggests that white people have financial characteristics, such as higher incomes and stronger credit histories, that make them appear to have better loan risks. However, the race effect is still very strong and highly statistically significant (t-statistic = 5.68).

(iv)  The 95% confidence intervals for β1 using:

a)  Non-robust standard errors:  βˆ1  ± tn 1,0.025  × se (βˆ1 )  = 0.1612 ± 1.96 × 0.0284  = [0.1055, 0.2169].

b)  Robust standard errors: 0.1612 ± 1.96 × 0.0375 = [0.0877, 0.2347].

The robust standard error for βˆ1 is 0.0375 which is higher than the non-robust standard error (0.0284).  The heteroskedasticity-robust 95% CI is [0.0877, 0.2347], which is wider than the nonrobust 95% CI of [0.1055, 0.2169]. Even so, the robust CI still excludes the value zero by some margin.

(v)  Steps for the BP test include:

1.  Keep the OLS residuals () from the estimation in (iii).


2.  Generate the variable 2 and run the regression:

 = δ0 + δ1 white + δ2 obrat + · · · + δ9 cosign + v

3.  Homoskedasticity requires that δ 1  = 0, . . . , δ9  = 0. Test this joint hypothesis using an F-test of these 9 restrictions from this regression model for  (call the R2 for this model Ruˆ(2)2 ).  If the null of homoskedasticity is rejected we conclude that heteroskedasticity is present.

Test:

H0  : δ 1  = 0, δ2  = 0, . . . , δ9  = 0

H1  : H0  is false

Test Statistics:

F =                Ruˆ(2)2 /q               

(1 Ruˆ(2)2 )/ (n 1)

               Ruˆ(2)2 /9               

(1 Ruˆ(2)2 )/ (n 9 1)

0.0645/9               

=

(1 − 0.0645) / (1000 − 10)

0.0072

= 0.9355/990

= 7.58

Note: the p-value for this test statistic reported in STATA < 0.0001.

Rejection Rule: Reject H0 in favour of H1 if F > c, where F is the test statistic and c is the critical value for the F-distribution with df = (9, 990) and a 5% significance level. F = 7.58 and c = 1.88

Decision: Since F > c we reject the null of homoskedasticity in favour of the alternative at the 5% significance level.

Conclusion: There is evidence that heteroskedasticity is present.

(vi)  Steps for the White test include:

1.  Keep the OLS residuals () and fitted values (yˆ) from the estimation in (iii).

2.  Generate the variables 2 and yˆ2 , and run the regression:   = δ0 + δ1 yˆ + δ2 yˆ2 + ν

3.  Homoskedasticity requires that δ1  = 0, δ2  = 0. Test this joint hypothesis using an F-test

of these 2 restrictions from this regression model for  (call the R2 for this model Ruˆ(2)2 ).

Test:

H0  : δ 1  = 0, δ2  = 0

H1  : H0  is false

Test Statistics:

F =                Ruˆ(2)2 /q               

(1 Ruˆ(2)2 )/ (n 1)

           Ruˆ(2)2 /2           

(1 Ruˆ(2)2 )/ (n − 3)

0.0636/2              

=

(1 − 0.0636) / (1000 − 3)

0.0318

= 0.9364/997

= 33.84

Note: the p-value for this test stat reported in STATA is < 0.0001.

Rejection Rule: Reject H0 in favour of H1 if F > c, where F is the test statistic and c is the critical value for the F-distribution with df = (2, 997) and a 5% significance level. F = 33.84 and c = 3.00.

Decision: Since F > c we reject the null of homoskedasticity in favour of the alternative at the 5% significance level.

Conclusion: There is evidence that heteroskedasticity is present.

(vii)  There are no fitted values from the model in (iii) less than zero.  There are 71 fitted values which exceed 1.  As a result, we cannot apply WLS using weights equal to 1/h where h  = arove × (1 − arove), as some of these weight values will be negative. To proceed with WLS, it is necessary to replace fitted values that exceed 1 with another value less than 1.

(viii)  The WLS estimates are presented in the Table 1. Differences between OLS (with robust se) and WLS? We see that there are quite a few. The coefficient on white is smaller (and insignificant at the 10% level).  The magnitude, and individual significance of some of the other variables has changed. The WLS estimator is preferable it has superior statistical properties to OLS.

However, we also have estimates of WLS with robust standard errors; the standard error for

the coefficient on white is smaller and the the estimate is statistically significant. It appears that white is important; though exactly how we allow for heteroskedasticity matters.  As a research strategy before making a definitive conclusion we could use some alternative estimators – such as the probit model to check whether we get similar estimated effects of

race.

(ix)  Key here is to explain your reasoning.  Issue of whether there is evidence of discrimination

rests on whether it is credible that the OLS and/or WLS models satisfy the ZCM assumption, and how we take account of heteroskedasticity.  If ZCM holds then the coefficient on the race indicator variable corresponds to a causal effect which is statistically and economically significant for the WLS estimator with robust standard errors.