Hello, dear friend, you can consult us at any time if you have any questions, add WeChat: daixieit

STOR 515

Dynamic Decision Analytics

Assignment #2 – due Friday, February 3, 2023

1. You’re an engineer at Telsa, Inc., where you’re putting together a prototype for Leon Umsk’s next big project, the CyberVan.  Your prototype will consist of I components that must be constructed and assembled in sequence for the prototype to function properly.  Limitations on the size of your team (it’s just you) mean that only one component can be worked on at any one time.  Each of your I components requires roughly τ days of work to construct, and your presentation to the higher-ups is scheduled for N . τ days from now, with N > I . This sounds straightforward enough, but you’re a subpar automotive engineer, and there’s a chance that you’ll spend τ days constructing a component only to have it fail and need to be reconstructed from scratch.

Here’s how component construction works:  each time you start work on a new component, you allocate y dollars, where y e [0, Y], to construction. The completed component will work with probability P (y), where P is a continuous, non-decreasing function satisfying P (0) = 0 and P (Y) < 1. If the component works, you can move on to constructing the next component in the sequence; if not, you must start work again on that component from scratch during the next τ-day period.   If your presentation time rolls around and you are j  components short of the I components required for the full assembly, Leon will tweet in frustration about the CyberVan coming along slower than expected and Telsa will lose C(j) dollars of investor money.   Show how the problem of minimizing total expected cost could be expressed and solved as a nite-horizon MDP by

(a) defining an appropriate 5-tuple (T,  S,  A, pt(. ls, a), rt(s, a)),

(b) writing out the optimality equations and boundary condition in terms of the functions ut(*)(s), t = 1, 2, . . . N .

2.  Consider a slightly ramped up” version of the inventory problem we saw in class with  M = 15,    h(b) = 10b,    f (b) = 120b,    C(b) =  ,    g(b) = 60b.

Use Python to nd an optimal ordering policy π *  for the next 6 months when monthly demand follows the distribution below:

k

0

1

2

3

4

5

6

7

8

9

10

11

12

pk

0.01

0.03

0.06

0.1

0.15

0.21

0.19

0.13

0.05

0.03

0.02

0.01

0.01

The file MDP incomplete .py on Canvas provides a helpful starting point. Include a screenshot of your Python code in your homework submission.

Once you’ve found them, express the optimal decision rules dt(*) , t = 1, . . . , 6 in the (Σt, σt) form seen in Lecture 3.  Which starting inventory level s, 0 < s < 15, has the highest total expected reward?