Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECMT1020 Introduction to Econometrics

2021S1

Midterm Questions with Answers

1    Probability

1. A random variable X is defined to be the difference between the higher value and the lower value when two fair dice are thrown, and if the two values are the same then X takes value zero. Below is the probability distribution of X:

Value of X

0

1

2

3

4

5

Probability

6/36

10/36

8/36

6/36

4/36

2/36

What is the expected value of X?

Answer:  1.94. Apply the definition of expected value/expectation.

2. A random variable X is defined to be the difference between the higher value and the lower value when two fair dice are thrown, and if the two values are the same then X takes value zero. Below is the probability distribution of X:

 

Value of X

0

1

2

3

4

5

Probability

6/36

10/36

8/36

6/36

4/36

2/36

 

What is the population variance of X?

Answer:  2.05. Apply the definition of variance and variance rules.

3. Let X be a random variable. Suppose we know that E(X) = 1.37 and E(X2) = 5.83. What is the population standard deviation of X?

Answer:  1.99. Apply the definition of variance and standard deviation.

4. Let X,Y,Z be three random variables.  We know that Cov(X,Y) = 3 and Cov(X,Z) = 5.

Define a new random variable W = 2Y + 0.5Z + 13. What is the value of Cov(2X,W)? Answer:  17. Apply the covariance rules.

5. Let X,Y,Z be three random variables. We know that Y = a + bX where a and b are positive constants. Select the correct statements(s).

(a) The population mean of Y is b times the population mean of X .

(b) The population variance of Y is b times the population variance of X .

(c) The covariance between Y and X is b2  times the variance of X .

(d) The correlation between Y and X is one.

(e) The correlation between X and Z is the same as the correlation between Y and Z .

Answer:   (d) and  (e).   Apply the expected value rule, variance rules, covariance rules, and definition of correlation coefficient.

6. X is a random variable indicating the face value when a single, unfair dice is thrown.  The probability distribution of X is given by

Pr(X = x) =   21   ,    x = 1, 2,..., 6.

We define another random variable Y as Y = 2X + 6. Answer the following questions.

(i) What is the expected value of X?

(ii) What is the expected value of Y?

(iii) What is the expected value of Y2?

(iv) What is the variance of Y?

(v) What is the value of E(XY)?

(vi) what is the covariance of X and Y?

(vii) What is the median of Y?

(viii) The distribution of Y is symmetric. (True of false)

 

Answers: (i) 2.67; (ii) 11.33; (iii) 137.33; (iv) 8.89; (v) 34.67; (vi) 4.44; (vii) 10; (viii) false.

 

2    Statistics

1. A random variable X has a continuous uniform distribution over the interval from 0 to α, where α is an unknown parameter. A sample of n observations, X1,...,Xn, is generated. Select the correct statement(s).

(a) The largest observation in the sample is an unbiased estimator for α .

(b) The sample mean is an unbiased estimator for α .

(c) The sample mean is a consistent estimator for α .

(d) The largest observation in the sample is a consistent estimator for α .

Answer:  (d). See textbook Exercise R.41.

2. A random variable X has population mean µ and population variance σ2. Given a sample of n independent observations X1,...,Xn, the estimator

P X

P Xi

is consistent for µ. (True or False)

Answer:  False. See textbook Exercise R.40.

3. A random variable X has population mean µ and population variance σ2. Given a sample of n independent observations X1,...,Xn, the estimator

n2 + 5n + 2 XXi

is consistent for µ. (True or False)

Answer:  True. See textbook Exercise R.40.

4. A random variable X  has population mean µ and population variance σ2.   A sample of n observations, X1,...,Xn, is generated. Select the correct statement(s).

(a) The average of even-numbered observations as an estimator for µ is unbiased. (b) The inverse of the sample mean is a consistent estimator for 1/µ .

(c) The average of even-numbered observations as an estimator for µ is not consistent.

(d) The average of odd-numbered observations as an estimator for µ is consistent.

Answer:  (b) and (d). See textbook Exercise R.38.

5. Suppose we have two estimators of an unknown population parameter. We always prefer to use the estimator with the smaller variance. (True or False)

Answer:  False. The estimator with the smaller variance may have a lot larger bias.

6. We will reject the null hypothesis of a two-sided t test when

(a) The confidence interval does not cover the hypothetical true value.

(b) The absolute value of the test statistic is less than the critical value.

(c) The confidence interval covers the hypothetical true value.

(d) The p-value is less than the significance level.

(e) The p-value is greater than the significance level.

Answer:  (a) and (d).

7. Suppose that a random variable X with hypothetical mean 14 may be assumed to follow a normal distribution with variance 81. Given a sample of 196 observations, the sample mean X is calculated. Select the correct statement(s). 

(a) The rejection region is X less than 12.34 or greater than 15.66 for a 5% test. (b) The rejection region is X less than 12.34 or greater than 15.66 for a 1% test. 

(c) The rejection region is X less than 12.74 or greater than 15.26 for a 1% test. 

(d) The acceptance region is X between 12.74 and 15.26 for a 1% test. 

(e) The acceptance region is X between 12.74 and 15.26 for a 5% test. 

(f) The acceptance region is X between 12.34 and 15.66 for a 5% test.

Answer:  (b) and (e). We first derive the variance of the sample mean as the population variance divided by the sample size, from which we obtain the standard deviation of the sample mean.

Given X follows a normal distribution and standard deviation is known, this is a z test and the test statistic follows the standard normal distribution under the null.

• For a 5% test, the rejection regions start 1.96 standard deviations from the hypothetical mean.

• For a 1% test, the rejection regions start 2.58 standard deviations from the hypothetical mean.

 

3    Regression

1. Suppose we run a regression of Y on X, and obtain the estimate of slope coefficient as 2.381. Now we change the units of measurement of X so that the new measure is 12 times the original one. What is the new estimate of the slope coefficient if we run the regression of Y on X with the new measurement?

Answer:  0.20 = 2.381/12. See textbook Exercise 1.13.

2. The Gauss-Markov theorem states that the least squares estimator is

(a) the best linear estimator with the smallest variance.

(b) the best unbiased estimator with the smallest variance.

(c) the best linear unbiased estimator with the smallest variance.

(d) the only linear estimator that is unbiased.

Answer:  (c).

3. In a simple regression model with intercept, which of the following values can be different from zero?

(a) Sample correlation between the disturbance term and the regressor

(b) Sample correlation between the fitted value and the residual

(c) Sum of the residuals

(d) Sample correlation between the residual and the regressor

Answer:  (a).

4. When we regress a variable Y on another variable X, which of the following would not lead to a wider confidence interval for the slope coefficient (holding other factors constant)?

(a) Choosing a larger significance level

(b) A smaller sample variance of X

(c) A larger standard error for the slope coefficient estimate

(d) A smaller sample size

Answer:  (a).

5. The R2  of a regressiono is 0.85. The total sum of squares of the regression is 250. What is the value of the below quantity?

n

X(Yi − i)2?

i=1

Answer:  37.5. This quantity is RSS. We use RSS=(1 − R2) × TSS.

6. Using the house sales data from Darlington in 2019, a researcher regress the house price (in AUD dollars) on house size (in square meters) and the number of bedrooms of the house:

Hourse price = β1 + β2Size + β3Bedrooms + u.

How would you interpret β3?

(a) Adding one bedroom would increase the house price by β3  Australian dollars, if we take

into account the effect of adding the extra bedroom on size of the house.

(b) Adding one bedroom would increase the house price by 100β3%, if size of the house is kept

unchanged.

(c) Adding one bedroom would increase the house price by β3  Australian dollars, if size of the house is kept unchanged.

(d) Adding one bedroom would increase the house price by 100β3%, if we take into account the effect of adding the extra bedroom on size of the house.

Answer:  (c).

7. Consider the following multiple regression

Y = β0 + β1X1 + β2X2 + β3X3 + u.

We will not be able to compute the OLS estimators when

(a) the correlation between X1  and X3  is one.

(b) the correlation between Y and X1 + X2 + X3  is one.

(c) the correlation between Y and u is one.

(d) the correlation between X2  and 2X3 − 3X1  is one.       (e) the correlation between X2  and u is greater than zero.

Answer:  (a) and (d). We will not be able to compute the OLS estimators when there is perfect multicollinearity among regressors.


 

 

8. A researcher estimates the following population regression model to predict annual earnings based on education:

= β1 + β2Education + u

using U.S. labour market data, the researcher regresses earnings (measured in thousands of dollars) on education (measured in years) and obtains the above Stata output (some values have been deliberately removed).

(i) What are the following missing Stata output values?

• Number of observations:

•  RSS (Residual SS):

• R-squared:

• Std. Err. (for education):

Answers:  171; 78708.52; 0.29; 0.61.

(ii) What is the economic interpretation of the estimated slope coefficient?   Complete the

sentence below by choosing from the drop-down boxes.

“The slope coefficient indicates that a (5.02 dollar/5021 dollar/1 year/5.02 year) decrease in (earnings/education) results in an expected (5.02 dollars/5021 dollars/1 year/5.02 year) (increase/decrease) in (earnings/education).”

Answer:  “The slope coefficient indicates that a (1 year) decrease in (education) results in an expected (5021 dollars) (decrease) in (earnings).”

(iii) Suppose you want to test whether the estimated coefficient is positive at the 1% level.

State the correct null and alternative hypotheses:

(a) H0 (b) H0 (c) H0 (d) H0 (e) H0 (f) H0

: β2 : β2 : β2 : β2 : β2 : β2

≤ 0, ≤ 0, > 0, < 0, = 0,  0,

Ha Ha Ha Ha Ha Ha

: β2 : β2 : β2 : β2 : β2 : β2

> 0

< 0

≤ 0

≥ 0

 0

= 0


Answer:  (a)

(iv) What is the critical value you should use for the above hypothesis test?

Answer:  2.35.

(v) What is the result of the hypothesis test? Select all the correct responses.

(a) Reject the null because the test statistic is greater than the critical value of the test

statistic.

(b) Reject the alternative because the test statistic is greater than the critical value of the

test statistic.

(c) Do not reject the null because the test statistic is less than the critical value of the test statistic.

(d) Do not reject the alternative because the test statistic is less than the critical value of the test statistic.

(e) Reject the null because the p-value is less than the significance level.            (f) Reject the alternative because the p-value is less than the significance level. (g) Do not reject the null because the p-value is less than the significance level.

(h) Do not reject the alternative because the p-value is less than the significance level. Answer:  (a) and (e).



1. If an independent variable in a multiple linear regression model is an exact linear combination of other independent variables, the model suffers from the problem of
        .

(a) perfect collinearity

(b) homoskedasticity

(c) an excessive number of observations

(d) omitted variable bias Answer:  (a).

2. Suppose a multiple regression resulted in R2 = 0.71. What can we say about the sum of squares in this regression?

(a)  ESS<RSS<TSS

(b)  RSS<ESS<TSS

(c)  RSS<TSS<ESS

(d)  ESS<TSS<RSS Answer:  (b).

3. Which of the following scenarios would make us more likely to make a Type I error when testing the null hypothesis of β2  ≥ 0?

(a) Switching from a 5% significance level to a 10% significance level.

(b) Increasing the sample size.

(c) Both (a) and (b).

(d) Neither (a) nor (b)

Answer:  (a).

4. If we have a random sample of a random variable X ∼ N(µ,σ2) with sample size n.  Let 2 denote the sample variance estimator for σ2. Which of the following statement is incorrect?

 

(a)  (X − µ)/σ is normally distributed.

(b)  (X − µ)/ follows a t distribution with degrees of freedom n − 1.

 

(c)  (X − µ)/σ always has mean zero and variance one.

(d) The standard deviation of the sample mean is / . Answer:  (d).

5. In the regression model Y = β1 + β2X + u, we find the estimate βˆ2  = 0.6 with standard error 0.4, based on a sample with 25 observations.  Compute a 95% confidence interval for β2.  The relevant critical value can be found in the following table.

 

df     tdf,0 025

22         23         24         25         26         27   2.074    2.069    2.064    2.060    2.056    2.052


(a)  ( −0.228, 1.428)

(b)  ( −0.224, 1.424)

(c)  (0.434, 0.766)

(d)  (0.435, 0.765)



Answer:  (a).

6. Which of the following will cause the standard error of βˆ2  in the simple regression to go down (holding other factors constant)?

(a) A lower intercept

(b) A smaller sample size

(c) More variation of the regressor.

(d) More variance of the error term Answer:  (c).

7. In the classical linear regression model (CLRM), we sometimes assume that the disturbance term ui  follows a normal distribution.  Does this imply that the slope coefficient estimate βˆ2 also follows a normal distribution?

(a) Yes, it does. Because the regressors are assumed to be fixed in the CLRM. (b) Only if Xi  follows a normal distribution too.

(c) Only if β2  follows a normal distribution too.

(d) No. βˆ2  follows a t distribution. Answer:  (a).

8. Select the correct statement(s) about a population parameter and a sample statistic.

(a) The sample statistic has a double structure, while the population does not.

(b) The sample statistic changes each time you try to measure it, but the population parameter

remains fixed.

(c) The population parameter changes each time you try to measure it, but the sample statistic remains fixed across samples.

(d) The population parameter is random variable because it is unknown; the sample statistic

is not a random variable because it can be calculated from data.

Answer:  (a) and (b).

9. Data on hourly earnings (EARNINGS) in dollars and years of schooling (S) from 540 individuals in US in 2005 are used to estimate a regression of earnings on schooling.  Note that ‘XXXX’ indicates a number has been intentionally removed from the output.

 

 

Based on the above output of regression, which of the following conclusions is valid?

(a) There is a positive, statistically significant (at a 5% significance level) relationship between

years of schooling and hourly earnings.


(b) There is a negative, statistically significant (at a 5% significance level) relationship between

years of schooling and hourly earnings.

(c) There is a positive, statistically insignificant (at a 5% significance level) relationship between years of schooling and hourly earnings.

(d) There is a negative, statistically insignificant (at a 5% significance level) relationship be- tween years of schooling and hourly earnings.

(e) There is insufficient information to make any firm conclusion.

Answer:  (a).

10. What is the correct rejection rule for a positive one-sided hypothesis test for β2  in the model Y = β1 + β2X + u with 64 observations and a 5% significance level?

(a) t > t63 ,0 .05

(b) t < t62 ,0 .05

(c) t > t62 ,0 .05

(d) t < t63 ,0 .05

(e) t > t62 ,0 .025

(f) t > t63 ,0 .025

Answer:  (b).

11. We run a regression of VISIBILITY  (measured in km) on relative HUMIDITY  (measured as a percentage). The observations are daily observations over a seven month period. A day with

15 kms of visibility and a relative humidity of 25% would be entered as (15, 25) in the data set.

 

 

 

Let β1  and β2 be the parameters for the intercept and slope coefficient, respectively; and let βˆ1 and βˆ2  be the corresponding OLS estimators. Based on the above output of regression, answer the below questions.

(i) Which of the following alternative hypotheses would we use to test the claim that on the days with zero humidity, the visibility is more than 10 kms?

(a) βˆ1  > 10

(b) β1  > 10

(c) βˆ2  > 10

(d) β2  > 10

Answer:  (b).

(ii) Suppose U is the upper end of the 90% confidence interval for the slope coefficient. Which

of the following is definitely true?

(a)  U > −0.033

(b)  U < −0.033

(c)  U > 12.37

(d) Not enough information Answer:  (b).

(iii) Suppose L is the lower bound of the 99% confidence interval for the slope coefficient.

Which of the following is definitely true?


(a) L = −0.058

(b) L > −0.058

(c) L < −0.058

(d) Not enough information Answer:  (c).