Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ETF2020 Statistical Foundations of Business Analytics

Assignment 2 — On A Dataset of US Large Banks

Important notes: 

1. This is an individual assignment.  This assignment is worth 20% of this unit’s total mark. Marks will be deducted for late submission on the following basis:  20% for each day late, up to a maximum of 3 days.  Assignments more than 3 days late will not be marked.

2.  Submission deadline for coursework is 11:55pm, Friday, 6/Oct/2023.  Please submit a soft copy and your R script through Moodle.  Name the soft copy as follows:  student ID Name.pdf (or .doc) . Pdf file is preferred, but word file is also fine. Name the R script in the same fashion.  Also, on the title page, please make sure you provide the student ID and name correctly.

3.  Please  add sufficient description to your code,  so the markers  can read the code easily. Penalty may occur without doing so.  Notations used in the assignment need to be typed correctly and properly. Incorrect notations will be treated as wrong answers.

Background

In this assignment, we aim to conduct some simple analysis to study the effects of geograph- ical deregulation on the returns to scale of commercial banks in the U.S. Until the middle of the 1970’s banking in the U.S. was heavily regulated at the state level.  Generally, there were three different types of state regulations on bank branching:  “unit banking”, where banks were only permitted to operate in one location; “limited branching”, where the branching abilities of individual banks were limited to a portion of the state; and “statewide branching”, where individual banks were permitted to branch statewide.  In the mid-1980s individual states be- gan to loosen regulations on intrastate branching, often moving from unit banking to limited branching and then to statewide branching.  It is worth noting that different states changed their regulatory restrictions on expansion at different times.  This deregulation process eventu- ally culminated in the passage of the Riegle-Neal Interstate Banking and Branching Efficiency of 1994, which permitted nationwide branching as of June 1997 (Jayaratne and Strahan, 1997). In sum, commercial banks in the U.S. undergone four branch banking regimes in the 1980s and 1990s: (1) unit banking, (2) limited branching, (3) statewide branching, and (4) full interstate branching, thus offering researchers a unique opportunity to study the effects of geographical deregulation on the returns to scale of commercial banks in the U.S. In our data set (i.e., “large bank.xlsx”),  the four regimes are presented as  1 to 4 respectively  under column K with a title “POLICY” .

The data used in this application are obtained from the Reports of Income and Condition (Call Reports) published by the Federal Reserve Bank of Chicago.   The  sample covers the period 1986-2005, a period that includes the four policy regimes. We examine only continuously operating large banks with assets of at least $1 billion (in 1986 dollars) to avoid the impact of entry and exit and to focus on the performance of a core of healthy, surviving institutions.  This gives some banks over 20 years (i.e.  80 quarters).  To select the relevant variables, we follow the commonly-accepted intermediation approach (Sealey and Lindley, 1977).  To be specific, three input prices and three output quantities are identified for our study as follows.

. Inputs:1

1. w1  – the wage rate for labour;

2. w2   the interest rate for borrowed funds;

3. w3  – the price of physical capital.

.  Outputs:2

1.  y1  – consumer loans;

2. y2  – non–consumer loans, consisting of industrial and commercial loans and real estate loans;

3. y3  – securities, including non–loan financial assets, i.e., all financial and physical assets minus the sum of consumer loans, non–consumer loans, and equity.

In our data set, these variables are given in columns D to I. The rest columns of the dataset are as follows:

1.  Column A: Each Bank’s Unique ID

2.  Column B: Each Bank’s Asset at Each Time Period

3.  Column J: Time Periods, t = 1, 2, . . . , 80. In particular,

t = 1 means Q1 of 1986

t = 2 means Q2 of 1986

t = 3 means Q3 of 1986

t = 4 means Q4 of 1986

t = 5 means Q1 of 1987

t = 6 means Q2 of 1987

···

t = 79 means Q3 of 2005

t = 80 means Q4 of 2005

Questions:

1.  Find out how many banks are running under either Policy 1 or Policy 2 at each quarter for each year.  (Report Percentages using values between 0 and  1).  Summarize your results in a table properly. Keep four decimals for each number.  [6 points]

2.  How many banks were running under Policy 2 in Q2 1990, but not operating under this policy any more in Q3 1990. Report the percentage using values between 0 and 1, and keep four decimals.  [4 points]

3. Let’s rate the polices (unit banking, limited branching, statewide branching, and full inter- state branching) by 1, 2, 3, and 4 respectively, which actually has been done in the dataset. Here 1 means the worst, and 4 means the best.

(a)  Report the mean and the standard deviation of the rating for each quarter of each year in a table. Keep four decimals for your calculation.  [3 points]

(b) Write down the formulas you use in order to calculate the mean and standard deviation for each quarter of each year.  [2 points]

4.  We observe a set of data x1 ,..., xn , which are scalars.  Moreover, x1 ,..., xn  only take k distinct values, say, x1 , . . . , xk , and form the following frequency table: 

Absolute frequencies    Relative frequencies

x1                         h(x1 )                           f(x1 )

.                      .                                   .

.                      .                                   .

.                      .                                   .

xk                 h(xk )                           f(xk )              

Σj(k)=1 h(xk ) = n         Σj(k)=1 f(xk ) = 1     

The mean of the squared deviations of the observed values from a certain fixed point c is called the mean squared error (MSE):

MSE(c) = (xj   c)2 f(xj ).

(a) Prove that j(k)=1 (xj   x)f(xj ) = 0,where x =   xi.  [2 points]

(b) Prove that MSE(c) is minimized at the point c = x.  [3 points]

Remark:

1. You may find “which()” is helpful.

2.  Please use the correct notations in your writing.

References

Berger, A. N. and Mester, L. J. (2003), ‘Explaining the dramatic changes in the performance of U.S. banks: Technological change, deregulation, and dynamic changes in competition’, Journal of Financial Intermedia- tion 12(1), 57–95.

Jayaratne, J. and Strahan, P. E.  (1997),  ‘The benefits of branching deregulation’,  Economic  Policy  Review 3(4), 13–29.

Sealey, C. W. and Lindley, J. T. (1977), ‘Inputs, outputs, and a theory of production and cost at depository financial institutions’, Journal of Finance 32(4), 1251–1266.

Stiroh, K. (2000), ‘How did bank holding companies prosper in the 1990s?’, Journal of Banking  and Finance 24(11), 1703–1745.