Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECMT5001: Final Examination (2021s2)

1.  [Total:  18 marks] Mimi owns a store which sells umbrellas.  To understand about the cyclical nature of his business, he runs a linear regression of sales on rainfall, using 36 monthly observations over January 2018 - December 2020. The regression model is given by

S = "0 + "1R + u;

where S is the monthly sales (in $1,000) and R is the monthly average rainfall in mm. The estimated model is given by (standard errors in parenthesis):

 = 3:2 + 0:12R:                                                     (1)

(1:6)      (0:07)

(a)  [2 marks] What is the predicted monthly sales when the monthly rainfall is averaged

at 100 mm?

(b)  [5 marks] Mimi claims that more rainfall increases the sales of umbrella. Test Mimiís

claim at the 5% signiÖcance level. Show all your steps.

(c)  Baobao, Mimiís assistant, suggests to include seasonal e§ects by considering the fol- lowing regression model:

S = ' + "R + (1 Q1 + (2 Q2 + (3 Q3 + (4 Q4 + v;                         (2)

where Qi  is the time dummy for quarter i (i = 1; 2; 3; 4).  Baobao attempted to run the regression on Stata, but an error was produced.

i.  [3 marks] Explain why Stata produced an error. Which least-squares assumption does regression (2) violate?

ii.  [2  marks] How can Baobao modify regression  (2) so that it becomes a valid regression?

(d)  [6 marks] Simon recommends Mimi to run the following regression S = '0 + '1R + '2P + w;

where P is the average unit price of umbrella in a given month.

From past business records, Mimi tends to set a higher price on rainy days, and a lower price on sunny days. It is also clear that umbrella is a normal good (such that higher price is associated with lower sales, and vice versa).

Do you think the OLS estimator of " 1  in regression (1) overestimated or underesti- mated the marginal impact of rainfall on umbrella sales? Justify your answer.

2.  [Total:  22 marks] Carol is interested in studying the housing market in Sydney.  She considers the following regression

ln(price) = '0 + '1 ln(income)+ u;                                       (3)

where price is the price of the house (in million dollars), and income is the annual income of the buyer as a household (in thousand dollars).  We use natural logarithm throughout this question.

(a)  [3 marks] Interpret the coe¢cient '1 .

(b)  [4 marks] An extract of the ANOVA table is displayed below:

Explained sum of squares = 0.351

Residual sum of squares = 0.582

Number of observations = 20

Compute R2  and the adjusted 2 .

(c)  [6 marks] Based on the sample Carol collected, the estimated regression line is given by

ln(pri(d)ce) = 0:9+0:3ln(income):

Little Bob, Carolís assistant, messed up with the data by mistakenly multiplying all observations (including all house prices and household incomes) by two.  What will be the estimated regression line on the modiÖed data? Show your steps that lead to your answer.

(d)  To examine the geographic impact on house prices, Carol introduces a dummy variable north, which takes the value one if the house is located in northern Sydney, and zero otherwise. Using the original sample Carol collected (not the one modiÖed by Bob), the following regression was obtained:

ln(pri(d)ce) = 0:8 +  0:2  ln(income)+ 0:3north + 0:12 ln(income) ! north:       (4)

(0:6)      (0:14)                                (0:2)                   (0:06)

i.  [4 marks] Suppose a homebuyer in northern Sydney earns an annual income of $200,000.  What is the predicted house price according to regression (4)?  Show your computation.

ii.  [5 marks] Construct a 95% conÖdence interval of the coe¢cient of the interaction term ln(income) ! north.  Then, using the constructed conÖdence interval, test the following claim at the 5% signiÖcance level:  ìThe relationship between house price and household income is di§erent in northern region compared to the rest of Sydney.î

3.  [Total:  20 marks] Bob is conducting a survey on whether customers were satisÖed with food delivery services.  To this end, he collected a random sample of 50 customers with the following variables:

"  score : customer satisfaction score (over 0 to 5)

"  dtime : delivery time (in minutes)

"  ctime : cooking time (in minutes)

"  atime = dtime + ctime

"  bill : bill amount (in dollars)

Bob ran three di§erent regression models.   The three models and selected outputs are displayed below.

Model 1:      score   =   "0 + "1 dtime + "2 ctime + u

SSE   =   1:239;   SSR = 1:847

score = '0 + '1 atime + '2 ctime + v

 

'0

'1

'2

OLS estimate

3.8

-0.021

-0.020

standard error

1.4

0.010

0.015

Model 3:    score   =   =0 + =1 dtime + =2 ctime + =3 bill + w

R2     =   0:44

Test the following claims at the 5% signiÖcance level. If the above information is insu¢cient for you to test a claim, simply write ìinsu¢cient informationî as the answer.

(a)  [5 marks] ìCooking time can a§ect the customer satisfaction score.î

(b)  [5 marks] ìDelivery time and/or cooking time can a§ect the customer satisfaction

score.î

(c)  [5 marks]  ìDelivery time and cooking time have di§erent marginal impacts on the customer satisfaction score.î

(d)  [5 marks] ìThe bill amount can a§ect the customer satisfaction score.î