Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECONS205

DATA ANALYTICS WITH BUSINESS APPLICATIONS

PRACTICE MIDTERM TEST

SECTION A. MULTIPLE CHOICE QUESTIONS [40 marks]

Choose the one alternative that best completes the statement or answers the question

Use the following EXCEL output to answer Questions 1-4

You are an analyst who has been assigned the task of examining drivers of corporate profitability. To perform this exercise you examine a sample of New Zealand listed companies on the New Zealand stock exchange (NZX). The following table provided summary statistics on profits (in $ billion) in

2016.

Table 1. Corporate Profitability of NZ listed companies on NZX

Profits ($ Billion)

Mean

Standard Error

Median

Mode

Standard Deviation

Sample Variance

Kurtosis

Skewness

Range

Minimum

Maximum

Sum

Count

Confidence Level (95%)

0.471 0.095 0.104 0.249 1.146 1.314 20.546 4.298 7.942 0.004 7.946 68.780 146

0.187

1.   The point estimate for the average profit of NZ companies listed on the NZX in 2016 was:

a.   $ 0.10 billion

b.   $ 0.25 billion

c.    $ 0.47 billion

d.   $ 68.78 billion

2.   Select the correct statement.

a.   On average, profit values deviate from the mean by $0.249 billion

b.   The mean is greater than the median, indicating that there is a large negative skew

c.    The most common reported profit of NZ companies listed on the NZX was $0.104 billion

d.   The range of the profits in 2016 was $7.94 billion, indicating there may be some outliers in the data

e.   All of the above are correct

3.   The 95% confidence interval for the mean profit of NZ listed companies on the NZX is approximately:

a.   between $ 0.23 and $ 0.66 billion

b.   between $ 0.004 billion and $ 7.946 billion

c.    $ 0.187 billion

d.   none of the above

4.   If we change a 95% confidence interval estimate in Question 3 to a 98% confidence interval estimate instead, we can expect that:

a.   Width of the confidence interval to increase

b.   Width of the confidence interval to decrease

c.   Width of the confidence interval to remain the same

d.   Sample size to increase

You believe that the size of a company (that is, whether it is a small, medium or large organization) and the type of stock (as defined by whether it is a growth” stock a stock that has sustained a high growth rate – or a “value” stock – a stock that is underpriced; a bargain for an investor) will determine the profitability of the companies in your sample. You split your data into groups defined by size of company and type of stock. Below is a summary of the data you obtain.

Table 2. Number of Kiwi Companies on the NZX by size and type of stock

Size of Companies

Type of stock

large

medium small

Grand

Total

Growth

Value

19

12

37

43

2

33

58

88

Grand Total

31 80                      35

146

5.   Based on the information provided in Table 2 above, select the correct statement.

a.   Proportion of companies fall into the value-stock category is 0.40

b.   Proportion of companies are small in size and are growth stocks is 0.25

c.   Proportion of companies that would not fall in the medium-size category is 0.45

d.   All of the above are correct

6.   From a population that is normally distributed with an unknown standard deviation, a sample of of 10 is selected. For the interval estimation of µ , the appropriate distribution to use is the:

a. z distribution

b.   standard normal distribution

c. t distribution with 11 degrees of freedom

d. t distribution with 9 degrees of freedom

7.   The purpose of statistical inference is to provide information about the:

a.   Sample based upon information contained in the population

b.   Population based upon information contained in the sample

c.   Population based upon information contain in the population

d.   Mean of the sample based upon the mean of the population

8.   Which of the following information is NOT relevant for calculating the required sample size for an interval estimate µ when the population standard deviation is known?

a.   desired margin of error

b.   confidence level

c.   population standard deviation

d.   degrees of freedom

9.   As the number of degrees of freedom for a t-distribution increases:

a.   the dispersion of the distribution decreases

b.   the shape of the distribution becomes narrower and taller

c.   the t-distribution becomes more and more similar to the standard normal distribution

d.   all of the above are correct

10. According to the central limit theorem, if a sample size of 100 is drawn from a population with a mean of 64, the mean of all sample means would equal:

a.   7

b.   100

c.   64

d.   0.64

11. The power of a test is the probability that it will lead us to:

a.   reject the null hypothesis when it is true

b.   reject the null hypothesis when it is false

c.    fail to reject the null hypothesis when it is true

d.   fail to reject the null hypothesis when it is false.

12. Suppose you intend to test the claim that a typical high school student in Auckland spends more than $50 a week on  mobile phone calls. Which hypotheses are used to test the claim?

a. H0  : µ ≠ 50. H1  : µ < 50.

c. H0  : µ ≠ 50. H1  : µ = 50.

b. H0  : µ = 50. H1  : µ ≠ 50.

d. H0  : µ = 50. H1  : µ > 50.

13. In a criminal trial, a Type II error is made when :

a.   a guilty defendant is acquitted

b.   an innocent person is convicted

c.    a guilty defendant is convicted

d.   an innocent person is acquitted

14. When testing for differences of means, you can base statistical inference on the:

a.   Student t distribution in general

b.   Normal distribution regardless of sample size

c.   Student t distribution if the underlying population distribution is normal, the two groups have the same variances and you use the pooled standard error formula.

d.   Chi-squared distribution with (na+nb-2) degrees of freedom

15. In the simple linear regression model, the regression slope:

a.   represents the elasticity ofY on X.

b.   indicates by how many units Y increases, given a one unit increase in X.

c.   when multiplied with the explanatory variable will give you the predicted Y.

d.   indicates by how many percent Y increases, given a one percent increase in X.

16. The correlation coefficient:

a.   lies between zero and one

b.   is a measure of linear association

c.    is close to one if X causes Y

d.   takes on a high value if you have a strong nonlinear relationship

17. The OLS residuals, , are defined as follows:

a. Yi

b. Xi

c. Yi βo β1Xi d. (Yi Y )2

18. To decide whether the slope coefficient indicates a largeeffect ofX on Y, you look at the:

a.   magnitude/size of the slope coefficient

b.   regression R2

c.   value of the intercept

d.   all of the above

19. If you wanted to test using a 5% significance level, whether or not a specific slope coefficient is equal to one, then you should:

a.   subtract 1 from the estimated coefficient, divide the difference by the standard error, and check if the resulting ratio is larger than 1.96.

b.   add and subtract 1.96 from the slope and check if that interval includes 1.

c.    see if the slope coefficient is between 0.95 and 1.05.

d.   check if the R2 is close to 1.

20. In the equation Consumptioni = α + βIncomei + εi . What is the residual for the 5th observation if C5  = $500 and Cˆ 5  = $475?

a. $975

b. $300

c. $25

d. $5

SECTION B. SHORT ANSWERS [60 marks total]

21. [25 marks] A charity-based non-government organization (NGO) in a developing country buys sheets of clear glass, which they manufacture into contact lens. The contact lenses are then given away to poor people whose sight is failing. The glass sheets have to be 0.05 cm thick because thinner sheets could produce weak contact lens that break, causing permanent damage to a person’s eyes. Lens made from sheets thicker than 0.05 cm are slightly more costly to make, since they use more material. The NGO takes a random sample of 100 sheets of glass from a particular supplier and finds that their mean thickness is 0.048 cm, and their standard deviation is 0.01 cm.

(a) Set up and carry out a hypothesis test to decide whether the NGO should buy glass sheets from this supplier. Be sure to carefully state your null and alternate hypotheses, and make your decision based on the α=10% level of significance. Show all steps in your working and state

the decision that you recommend for the NGO.                                                              (10 marks)

(b) In this problem, are you more averse to Type I or Type II errors? Fully explain your answer

with the aid of a table.

(c) The NGO wanted to see how better eyesight for people using its contact lenses was valued in the labour market. They surveyed wages of people waiting to receive their contact lenses and of people who had received new lenses within the past year. The following table shows the Excel printout for the t-test for testing if there was a difference in weekly wages between the two groups:

t-Test: Two-Sample Assuming Unequal Variances

Waiting Got lenses

Mean                                                    12.221       15.486

Variance                                              23.720       56.774

Observations                                              14               70

Hypothesized Mean Difference                 0

df                                                                   27

Stat                                                     -2.062

P(T<=t) one-tail 0.024

t Critical one-tail                                  1.703

P(T<=t) two-tail 0.049

t Critical two-tail                                  2.052

i)       Are the samples independent or dependent? Justify your answer.                               (2 marks)

ii)     Use the information in the table to test at the α=0.05 level whether there is a significant difference in mean wages of the two groups using either the appropriate t-values or the p-value method. Make sure you clearly state the hypothesis and conclusion to your test.                      (5 marks)

iii)     According to the p-value, what is the minimum level of significance you would accept your null

hypothesis?

22. [35 marks] The Hamilton City Council (HCC) is very concerned about the amount of water that is required by Hamilton residents in the hot summer months. Data has been collected on water use W, in millions of litres and on daily temperatures T, in centigrade, for 15 days in January 2019. The following Excel Output (with two deliberate omissions) show the results from a simple regression  that  can be used to predict  the  amount  of water required by Hamilton residents depending on expected temperature for that day.

SUMMARY OUTPUT

Regression Statistics

Multiple R

R Square

Adjusted R Square

Standard Error

Observations

0.91

A

0.81

6.68

15

ANOVA

df

Regression                                                 1         2667.2     2667.2                   59.7      3.2591E-06

Residual                                                   13           580.6         44.7

Total                                                       14         3247.7

Coefficients

Standard Error

Stat

P-value

Lower 95%

Upper 95%

Lower

99.0%

Upper

99.0%

Intercept 15.6

Temp 2.1

6.7

0.3

2.3

B

0.036 3.26E-06

1.203

1.541

30.077 2.736

-4.49

1.305

35.77

2.972

a)   State the equation showing that water use is a function of the daily temperature. Give a brief interpretation of the equation and use it to predict how much water will be required if Hamilton

if the temperature is  400 C.

b)  Calculate the missing value B

( 2 marks)


c)   Is the slope coefficient consistent with the hypothesis that the higher the daily temperature, the more water is required? Clearly state the hypotheses you have actually tested. Briefly justify your answer using any two of the two methods shown in lectures.                             ( 6 marks)

d)  What is the 95% confidence interval for the coefficient on temperature? What is the 99% confidence interval? Why do they differ?                                                                    ( 5 marks)