Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

ECON6001:  Microeconomic Analysis

Part 3:  Choice under Uncertainty

To this moment our consumer has dealt with choice in perfectly certain situations.  However, this is not the case in the real world. Even when a person plans grocery shopping, she cannot be 100% certain about her breakfast preferences in an upcoming week. In this part we will discuss different models that result in expected utility, see how it is contradicted in the experiments and discuss possible explanations for that.

1    Three Formulations of Expected Utility

To start we need to find a way to represent an uncertain prospect and define preference on the set of those uncertain prospects. We will begin with three (actually, two and the mixture of both) ways of doing so. The two polar cases differ mostly through whether the uncertainty is objective or subjective. The third way allows both types.

1.1    vNM model

The von Neumann-Morgenstern (vNM) sees uncertainty as objective in the sense that the proba- bilities of different outcomes are "publicly" known.  For example, if there are 70 students in class and the professor randomly picks one, the probability of a specific student to be picked is objective and it is .

Formally, let Z be a finite set of prizes and P a set of probability distribution on Z , i.e., p ∈ P : Z → [0, 1] and zZ p(z) = 1. Then we can define preference relation on the set of probability distributions P .

Example: Z = {−10, 0, 100} is a fixed set of prizes and p = (0.2, 0.5, 0.3) means that the consumer losses $10 with probability 0.2 and gains $100 with probability 0.3.  If we define also lottery  q = (0.1, 0.6, 0.3), then we can say that q 〉p. So the consumer is able to compare different probability distributions and hence has preference ordering on the set P .

vNM specify axioms for on P for the following expected utility representation:

There is a function u : Z R such that p q if and only if zZ p(z)u(z) >zZ q(z)u(z).


Example: Suppose vNM consumer’s utility on prizes is u(x) = 2x, then U(p) = 0.2 * (2 * (−10)) + 0.5 * (2 * 0) + 0.3 * (2 * 100).

1.2    Savage model                                                                                               The Savage model sees uncertainty as subjective in the sense that there is no externally imposed probabilities.  For example, probability that the Spanish team wins the next football World Cup. Probabilities are part of the representation, however, they are unobserved and can be recovered from the preference relation.                                                                                                                Suppose Z is the set of prizes as before and S is the set of mutually exclusive states of the nature that represent the uncertainty.  We denote by F the set of all functions f : S → Z , so formally F = ZS  and we call its elements acts. In the Savage model the consumer has preference relations over the acts.

Example: Suppose Z = {0, 100} and S = {rain, sun}, then F = {(0, 0), (0, 100), (100, 0), (100, 100)} where act f = (100, 0) means that the consumer receives $100 if it rains and does not receive any-  thing if there is sun.                                                                                                                               Savage specifies a set of axioms for on F and obtains a representation similar to the following:

There exists a function p : S → [0, 1] such that sSp(s) = 1 and a function u : Z → R such that f 〉g if and only if sS p(s)u(f(s)) >sS p(s)u(g(s)).

Example:  Suppose Savage consumer’s utility on prizes is u(x) = 2x and has a subjective prior that P (rain) = 0.4 and P (sun) = 0.6, then U(f) = 0.4 * (2 * 100) + 0.6 * (2 * 0).

1.3    Anscombe-Aumann model                                                                         The Anscombe-Aumann (AA) or "horse lottery roulette wheel" model allows for both types of uncertainty and is currently the most used due to being more general than vNM and a lot simpler (in terms of axioms and math) than Savage. Currently, the AA model is implied when economists mention Subjective Expected Utility (SEU).                                                                                       Suppose that Z is a set of prizes and S is a set of states as before. However, now acts are functions from states to probability distributions on prizes  instead of just prizes.  Intuitively, the consumer receives an objective lottery after the subjective uncertainty is resolved.   Let  P  be the set of probability distributions on Z , then the act set is H = PS .

Example: Suppose Z = {0, 100}, S = {rain, sun} and act f = , where


element (0.3, 0.7) is a lottery that pays $100 with probability 0.7.

AA provide a set of axioms for on H and obtain the following representation:

There exist functions π : S t [0, 1] withsS π(s) = 1 and u : Z t R such that f g if and only if sS π(s) zZ f(s)(z)u(z) >sS π(s) zZ g(s)(z)u(z).

Example:  Suppose AA consumer’s utility on prizes is  u(x)  = 2x, the subjective prior is that P (rain) = 0.4 and P (sun) = 0.6, then U(f) = 0.4 * (0.3 * 0 + 0.7 * 100) + 0.6 * (0.5 * 0 + 0.5 * 100).

2    Axiomatization

In this section we will discuss axioms that deliver the AA representation. To do so, first, we need to define what a mixture of two acts on H is.

Definition: For any f, g ∈ H and α ∈ [0, 1], define act αf + (1 − α)g as

(αf + (1 − α)g)(s) = αf(s) + (1 − α)g(s).

Example: Suppose that the state space S = {s1 , s2 } and there are two acts f and g as in the figure below.

Figure 1: Acts f and g

To calculate the mixture act 0.25f + 0.75g, first, we consider state s1 .

Next, we calculate the mixture lottery in s2 .

Figure 3:  (0.25f + 0.75g)(s2 )

Hence, the final value of the mixture act 0.25f + 0.75g is

Figure 4: 0.25f + 0.75g

As for the representation, we start with the set of already familiar axioms.

Axiom 1: is complete, transitive and not degenerate 1 .

Axiom 2: For all f, g H, if f(s) g(s) for all s S, then f g .

Axiom 2 is a monotonicity axiom, it says that if one act is better than another in every state, then it must be better overall too.

Axiom 3: For all f, g, h H, if f g h, then there exist λ (0, 1) such that g λf + (1 λ)h.

Axiom 3 is called Archimedean or continuity axiom. It basically says that any act can be substituted by a mixture of a better and a worse acts.  This axiom usually makes people to express doubts, however, this is not the axiom that causes the main problems with the theory. Imagine a constant act f that pays $100 in any state, act g that pays $10 in any state and act h that guarantees that a consumer dies with certainty.  Clearly, f 〉g 〉h.  You may argue that there is no such small probability of death λ that you would exchange $10 for $100 with probability 1 − λ and death with probability λ . However, we can reformulate the statement a little bit:  "Would you pay $10 to drive for 3 minutes and receive $100?" Driving involves very small chance of a deadly accident and most of people are willing to carry this risk.  So continuity axiom does not create too much trouble if formulated in a specific way.

Axiom 4: For all f, g, h ∈ H and λ ∈ (0, 1]: λf + (1 − λ)h λg + (1 − λ)h if and only if f g .

Axiom 4 is called Independence of Irrelevant Alternatives. At first glance, the axiom seems reason- able: we are comparing two "packages" that are composed from two parts, one of which is the same for both.  Hence, it makes sense to compare only the different parts and establish the preference based on that.  If λ outcome happens then the left act is better, if it does not happen then the consumer gets h in both cases and would be indifferent.  So the left  "package" must be better. However, this is just a story and we will soon see that in many situations it does not make sense.

Representation Theorem:  A binary relation on H satisfies axioms 1 –4 if and only if there exist functions π : S → [0, 1] with sS π(s) = 1 and u : Z → R such that f g if and only if sS π(s) XZ f(s)(z)u(z) > sS π(s) XZ g(s)(z)u(z) .  Moreover, the probability distribution π is unique, and u(∙) is unique up to a positive affine transformation 2 .

The proof of the Representation theorem is outside of the scope of this class.  Interested students should refer to the Kreps textbook.

3    SEU and Asset Market

We have described how to represent preferences of a consumer in situations that carry uncertainty. Now we will discuss how this consumer makes choices in the asset market.  For simplicity we will assume that consumer’s utility depends only on one good consumption (or money) in different states of the world. Note that this is Savage’s framework. Suppose there are K states of the world, i.e., S = {s1 , . . . , sK }.

Definition: An Arrow security is an instrument that pays one unit of numerary good (or $1) in a specified state and nothing in other states.

Suppose Arrow securities for all states are available on the market, p = (p1 , . . . , pK ) are the prices of the Arrow assets, P (si ) denotes the (subjective or objective) probability of state si and I is income. Then the SEU consumer will face the following problem:

K

m x a P (si )u(xi )

i=1

K

s.t. pixi  = I .

i=1

As long as u(∙) is concave (we assume so), the FOC will look as follows.

2 Positive affine transformation means that if there is some other function ( ∙ ) that represents the above preference, then it must be the case that (x) = au(x) + b.

L =工(K)P (si )u(xi ) + λ (I 工(K)pi xi )

i=1                                                     i=1

= P (si )u\ (xi ) λpi  = 0 u\ (xi ) = for each si .

The solution to this problem will deliver us demand for each type of Arrow security.

However, what do we do if the Arrow securities are not directly available on the market? Well, the answer is very straightforward if the asset market is complete.

Definition:  A unit of an asset is a title to receive an amount ri  of the numerary good (or $1) if state si  occurs. An asset is characterized by its return vector (r1 , r2 . . . , rK )\ .

Definition: An asset market that consists of T assets with a K × T return matrix R is complete if rk(R) = K .

Example:  Suppose that S  = {s1 , s2 , s3 } and there are two assets in the market.  Asset 1 is a riskless bond that pays (1, 1, 1)\ , while asset 2 return is (2, 1, 0)\ . Note that such asset market is not complete, because

l1   2

rk    1    1    = 2 < 3 = K.

1   0

However, if there is asset 3 with the return vector (0, 1, 1), then the market is complete.

l1   2   0

rk    1    1    1    = 3 = K.

1   0   1

On the other hand, if asset 3 would be (3, 2, 1), i.e., linear combination of asset 1 and asset 2, then the rank of the returns matrix would still be 2, so the market would be incomplete.

If the market is complete, then the asset structure is the linear combination of Arrow securities. Hence, we can recover one structure from another.  To obtain Arrow security prices, we just need to apply the corresponding linear transformation to the price vector.

Example:  Asset 1 is (1, 1, 1), asset 2 is (2, 1, 0) and asset 3 is (0, 1, 1).  Suppose asset prices are (q1 , q2 , q3 ) and we want to obtain Arrow prices  (p1 , p2 , p3 ).  We construct the following system of equations:

1 * p1 + 1 * p2 + 1 * p3  = q1

2 * p1 + 1 * p2 + 0 * p3  = q2

0 * p1 + 1 * p2 + 1 * p3  = q3 .

The solution is the vector of Arrow prices:

p1  = q1 − q3

p2  = −2q1 + q2 + 2q3

p3  = 2q1 − q2 − q3 .

Now suppose the consumer chooses the consumption vector (4, 3, 2), which means she would like to purchase 4 units of the Arrow asset for state s1 , 3 units of the Arrow asset for state s2 , and 2 units of the Arrow asset that pays in state s3 .  However, Arrow assets are not directly available in the market, so the consumer needs to figure out which combination of the available assets she should buy in this case. Suppose she purchases x1  units of asset 1, x2  units of asset 2 and x3  units of asset

3. Then

x1 * 1 + x2 * 2 + x3 * 0 = 4

x1 * 1 + x2 * 1 + x3 * 1 = 3

x1 * 1 + x2 * 0 + x3 * 1 = 2,

which results in the solution x1  = 2, x2  = 1 and x3  = 0. Thus, the consumer buys 2 units of asset

1 and 1 unit of asset 2.

However, note that the solution might produce negative numbers.  For example, consider the con- sumption vector (1, 2, 3), in this case the solution would be x1  = 3, x2  = −1 and x3  = 0.  How is this possible?  This simply means that the consumer buys 3 units of asset 1 and  sells  1 unit of

asset 2.

4    Risk Attitude

Each lottery (or risky situation in general) can be characterized by its expected value and also a degree of risk it carries. For example, lotteries (−$1, 0.5; $1, 0.5) and (−$1, 000, 0.5; $1, 000, 0.5) have the same expected values; however, the majority of people would strongly prefer the first lottery over the second due to the lower risk.  In this section, we will discuss different types of attitude

toward risk and how it can be measured.

4.1    Certainty Equivalent

For analysis in this section, we will assume that an individual has some initial wealth  w0  and is offered a lottery that pays xi  with some probability distribution p(xi ). In addition, the individual is an expected utility maximizer, implying that the value from the lottery would be

n

V (w0 + x) = p(xi )u(w0 + xi ).

i=1

A natural question to ask is how much certain (with probability 1) wealth would deliver the same level of utility as the initial wealth combined with the lottery. The amount of the equivalent certain wealth is called a certainty equivalent, and we will denote it as wCE . By definition,

n

u(wCE ) = p(xi )u(w0 + xi )

i=1

wCE  = u1  (工(n)p(xi )u(w0 + xi )) .

i=1

Example 1: Suppose the agent has state-utility u(x) = ^x, initial wealth w0  = $100, and is offered the following lottery:

xi

p(xi )

$80

0.3

+$40

0.4

+$120

0.3

What is the lotterys certainty equivalent?

The expected value of the lottery is

V (w0 + x) = 0.3^20 + 0.4^140 + 0.3^220 10.52.

Hence, by definition of CE, we have

implying that the individual would be indifferent between participating in the lottery and having the total wealth of $110.759 for certain.

Example 2: Now consider the same lottery and the initial wealth, but different utility u(x) = x2 . In this case, the expected value of the lottery is

V (w0 + x) = 0.3 * 202 + 0.4 * 1402 + 0.3 * 2202  = 22, 480 = wC(2)E ,

implying the certainty equivalent wCE 149.93.

Note that in both examples the initial wealth and the lottery are the same; however, the perception of the lottery (certainty equivalent) is different. This suggests that a difference in the state-utility reflects a difference in attitude toward risk.

4.2    Risk Attitude

Another interpretation of the certainty equivalent is what would be the fair terms of exchange between uncertainty  (w0  + x) and certainty  (wCE ).   This interpretation allows us to define the asking price of the lottery, pa , as pa  = wCE − w0 . Note the asking price is the minimum price, for which the individual is willing to sell the lottery (in fact, she is indifferent between selling it and not).

Examples: In both example situations from the above, the asking price is positive:

pa(1)  = 110.76 100 = 10.76

pa(2)  = 149.93 100 = 49.93.

This fact means that both individuals evaluate the lottery as having positive effect on their wealth. However,  it can be the case that the asking price of a lottery is negative.   Consider a lottery (−$50, 0.5; $50, 0.5) and consumer with utility u(x) = ^x and the initial wealth $100.  The CE would be

^wCE  = 0.5 * ^50 + 0.5^150 9.66 wCE 93.3,

implying that the asking price is pa  = 93.3 − 100 = −6.7. The negative asking price means that the consumer is willing to pay up to $6.7 to anyone willing to accept the lottery.  Hence, the negative asking price is the situation when the consumer is willing to buy insurance for certain risks.

Theorem:  If an individual’s utility is linear in wealth, then the asking price of a lottery equals to its expected value, i. e., pa  = Ex.

Proof:  Denote u(w) = a + bw . Note the following:

V (w0 + x) = E(a + b(w0 + x)) = a + bw0 + bEx

and

u(wCE ) = a + bwCE ,

hence,

a + bwCE  = a + bw0 + bEx ⇒ pa  = wCE  − w0  = Ex.

The above theorem implies that the agent with linear utility values lottery based on its expected value and without taking into account the risk” (variance and/or other moments). Such individual is called risk neutral.

Definition:  Risk premium π is the value assigned to risk in comparison with a risk-neutral individual, i.e.,

π = E(w0 + x) − wCE  = Ex − pa .

If the risk premium is positive, we say that the individual is risk averse because she needs to be paid to accept the risk. If the risk premium is negative, we say that the individual is  risk loving because she is willing to pay to accept the risk. If the risk premium is zero, the individual is  risk neutral.

Examples: The expected value of the lottery from the above examples is

Ex = 0.3 * (−80) + 0.4 * 40 + 0.3 * 120 = 28,

implying that the individual with u(x) = ^x evaluates the risk premium as π 1  = 28−10.76 = 17.24, whereas the individual with u(x) = x2  evaluates the risk premium as π2  = 28 − 49.93 = −21.93. Hence, the first agent is risk averse, whereas the second agent is risk loving.

Theorem:  If the strictly increasing utility of an individual is strictly concave  (convex), then the risk premium of any lottery is positive (negative) .

Proof:  Remember the Jensen’s inequality:  If X is a random variable and f is concave (convex), then f(EX) > (<)E(f(X)).

Now suppose that u is concave (convex case goes by analogy). In this case, we have

u(wCE ) = Eu(w0 + x) < u(E(w0 + x)) = u(w0 + Ex),

Figure 5: Asking price and risk premium

Now we will illustrate all the concepts graphically with the following example.

Example:  Suppose u(x) = ^x, initial wealth w0  is $5 and the lottery is x = (−$4, 0.2; +$4, 0.8). Expected utility of the total wealth is E(u(w0 + x)) = 0.2 * ^1 + 0.8 * ^9 = 2.6.  Hence, the CE would be ^wCE  = 2.6 ⇒ wCE  = 6.76 and the asking price is pa  = wCE  − w0  = 1.76.

Expected value of the lottery is Ex = 0.2 * (−4) + 0.8 * 4 = 2.4, and hence the risk premium is π = Ex − pa  = 0.64.

4.3    Absolute Risk Aversion

Note the following:

u(wCE ) = u(w0 + pa ) = Eu(w0 + x).

First, by the Taylor approximation, we have

u(w0 + pa ) ≈ u(w0 + Ex) + (w0 + pa − (w0 + Ex))u\ (w0 + Ex) = u(w0 + Ex) − πu\ (w0 + Ex).

In addition, we can obtain

u(w0  + x) ≈ u(w0  + Ex) + (x − Ex)u\ (w0  + Ex) +                      u  (w\\0  + Ex) .

By taking the expectation of the above, we have

Eu(w0 + x) ≈ Eu(w0 + Ex) + E(x − Ex)u\ (w0 + Ex) +                    u\\ (w0 + Ex)

= u(w0 + Ex) + 0.5σ u (w2\\0 + Ex),

where σ2  = E(x Ex)2  is the variance of the lottery.

Finally, by equating (2) and (3) (because of (1)), we derive

−πu\ (w0 + Ex) = 0.5σ2u\\ (w0 + Ex)

π = 0.5σ2  ( ) .

Note that risk premium π depends on two components:  (1) the variance of the lottery σ 2 , which is the measure of the amount of risk;  (2) the component  − , which reflects the attitude of the individual toward risk.  In fact, A(w) = − is called the degree of  absolute  risk  aversion .

The absolute risk aversion explains why two different individuals might have different risk premia in an identical risky situation.

Example:  If we consider two individuals with utilities u1 (x) = x and u2 (x) = x , then their degrees of absolute risk aversion would be

u (w) 1

u(w)     2w

u(w) 2

u(w)     3w .

Given that for any fixed level of wealth w , A2 (w) > A1 (w), then we can say that for that level of

wealth, individual 2 is more risk averse than individual 1. In fact, individual 2 is 1.33  (=2(3) ) times

more risk averse than individual 1.

5    Revealed Preference and SEU

In this section, we introduce the conditions that the (Savage’s) SEU model imposes on the limited data set in the case of the asset market that we have just studied. These conditions for the case of the risk-averse SEU were introduced by Echenique and Saito (2015).

To demonstrate the idea, suppose there are only two states,  S = {s1 , s2 }, and two data points

available, (x1 , p1 ) and (x2 , p2 ). The FOC for an observation j and state si  requires P (si )u (x\i(j)) = λjpi(j) .

Note that p and x are observable, while P (si ), u\ (x) and λj  are not. We have two observations, so in total it gives us four FOCs. However, note that the FOCs for the same state allow us to cancel out P (si ), while the FOCs for the same observation will allow us to cancel out λj . Hence, we obtain the following condition:

u\ (x1(1)) u\ (x2(2)) u\ (x1(2)) u\ (x2(1))

=

P (s1 )u\ (x1(1)) P (s2 )u\ (x2(2)) λ 1p 1(1) λ2p2(2) p 1(1) p2(2)

P (s1 )u\ (x1(2)) P (s2 )u\ (x