Odabir strategije u uvjetima rizika (ako su dostupne vjerojatnosne informacije). Metode za odabir alternativa u uvjetima rizika i nesigurnosti. Generalni principi. Teorija igara Kriteriji za odabir najboljih strategija u neizvjesnosti

Neizvjesnost o stanju sustava mogu uzrokovati dvije okolnosti: nedostatak jasnoće, kad nisu poznata sva moguća stanja, i nedostatak povjerenja, kada su poznata sva stanja, ali nije moguće točno naznačiti koje se od njih provodi.

Nesigurnost također podrazumijeva nedostatak informacija o raspodjeli vjerojatnosti stanja. Inače, odnosi se na rizičnu situaciju.

Kako možete donositi odluke u situaciji neizvjesnosti?

Ako je nesigurnost uzrokovana nedostatkom jasnoće, tada je praktički nemoguće donijeti formaliziranu objektivnu odluku. Alternative se ne mogu precizno procijeniti kad se ne zna što bi se uopće moglo dogoditi. Slijedom toga, potrebno je, ako ne eliminirati nesigurnost, onda je barem svesti na nedostatak samopouzdanja. To se može učiniti na dva načina:

Ili istražite fenomen koji stvara nesigurnost, naučite više o njemu i identificirajte sva moguća stanja,

· Ili pretpostavite da ograničava skup mogućih stanja (na primjer, ukupnost svih poznatih stanja). Naravno, takvo pojednostavljenje utječe na pouzdanost donesenih odluka, ali često je to jedini mogući izlaz.

Ako je nesigurnost uzrokovana nemogućnošću preciznog predviđanja stanja mogućeg, tada postoje i dva načina:

Ili primijenite formalizirane metode odlučivanja u uvjetima neizvjesnosti koji pružaju optimalan izbor samo na temelju dostupnih podataka o ishodima;

Ili pokušajte svesti na rizičnu situaciju dobivanjem podataka o raspodjeli vjerojatnosti ishoda istraživanjem ili pretpostavkama. Tada postaje moguće primijeniti metode donošenja odluka na temelju rizika koje daju uravnoteženije rezultate, pod uvjetom da je pretpostavljena raspodjela bliska stvarnoj.

Jedna od metoda donošenja odluka u uvjetima neizvjesnosti su takozvane "igre", proučavane u okviru matematičke teorije igara. U osnovi postoje dvije glavne vrste takvih igara:

strateške igre i

poigravanje prirodom.

Aparat strateških igara koristi se za donošenje odluka u kontekstu interakcije. Tamo je neizvjesnost povezana s postupcima drugih koji namjerno žele maksimalizirati svoj dobitak. Donositelj odluke ne zna točno što će učiniti protivnici. Međutim, može razumno pretpostaviti da svjesno biraju strategije koje su najbolje za sebe, a najgore za druge (uključujući i za našeg donositelja odluka). Metode strateških igara omogućuju vam da odaberete optimalnu strategiju suočene s takvim protivljenjem.

Ako nema svrhovitog protudjelovanja, a neizvjesnost je povezana s objektivnim (neovisno o volji konkretnih subjekata) okolnostima, tada se koristi aparat "igara s prirodom". Istodobno, "priroda" ne znači nužno živu ili neživu prirodu (biosfera, atmosfera itd.). To može biti tržište ili drugi skup subjekata koji nisu u sukobu s našim donositeljem odluka, već jednostavno izvršavaju radnje koje su za njega nepredvidive. Takva je "priroda" ravnodušna prema dobitku ili gubitku donositelja odluke i ne pokušava svoje pogrešne procjene okrenuti u svoju korist. Prirodno, logika donošenja odluka u takvim uvjetima nešto se razlikuje od logike strateških igara.

Razmotrimo neke odredbe teorije igara.

Teorija igara je znanost koja proučava strateške odluke ljudi, tvrtki, vlada i drugih agenata.

Strateške odluke su odluke koje uzimaju u obzir postupke drugih agenata i koje utječu na korisnost drugih agenata.

Situacije u kojima djelovanje nekih agenata utječu na druge agente - odnosno situacije u kojima agenti donose strateške odluke - nazivaju se strateškim interakcijama (ili igrama). Agenti koji sudjeluju u tim interakcijama nazivaju se igračima. Vrste strateških interakcija prikazane su na sl. 20.

Lik: 20. Vrste strateških interakcija.

Igre se mogu predstaviti u normalnom obliku (matrica), kada se odluke donose istodobno, i u proširenom obliku (stablo), kada se odluke donose dosljedno. Razmotrimo obje metode.

Uvjete rizika i nesigurnosti karakteriziraju takozvani uvjeti višestrukih vrijednosti očekivanja buduće situacije u vanjskom okruženju. U tom slučaju, donositelj odluke mora odabrati alternativu (Ai), nemajući točnu predodžbu o čimbenicima okoliša i njihovom utjecaju na rezultat. Pod tim uvjetima, ishod, rezultat svake alternative je funkcija uvjeta - čimbenika okoliša (funkcija korisnosti), što nije uvijek u stanju predvidjeti donositelja odluke. Za predstavljanje i analizu rezultata odabranih alternativnih strategija koristi se matrica odluka, koja se također naziva matrica plaćanja,ili matrična igra... Primjer matrice dan je u tablici. 2.

tablica 2

A1, A2, A3 - alternativne strategije djelovanja; S1, S2, S3 - stanje gospodarstva (stabilnost, recesija, rast itd.); E11; E12; E13; E21; ... E33; ... - rezultati odluka.

Brojevi u ćelijama matrice predstavljaju rezultate provedbe Eij strategije Ai pod uvjetima Sj. Istodobno, u uvjetima rizika poznata je vjerojatnost pojave Sj - wj (Sj). Metode odlučivanja o riziku koriste teoriju izbora, koja se naziva teorija korisnosti. U skladu s ovom teorijom, donositelj odluke bira Ai iz skupa (Ai) (i \u003d 1 ... n), što maksimizira očekivanu vrijednost njegove korisne funkcije E, j. U kontekstu rizika, prilikom donošenja odluke, glavna je stvar odrediti vjerojatnost početka stanja okoliša Sj, tj. Stupanj rizika. Nakon utvrđivanja vjerojatnosti wj (Sj) početka stanja okoliša Sj, odredite očekivani trošak provedbe svake alternative, a to je ponderirani prosječni trošak E (Ai):

Imajte na umu da u problemima koje razmatramo za donošenje odluka kao ishode E ij razmotrit ćemo pokazatelje koje je poželjno maksimizirati - dobitak, prihod, dobit. Za njih vrijedi princip "što više to bolje". Svi principi za odabir optimalne alternative bit će formulirani upravo za takve pokazatelje.

Ako je u matrici igre kao ishode potrebno prikazati pokazatelje koji podliježu minimizaciji - gubici, troškovi, gubici, tada postoje dva moguća načina:

1) predstaviti ih u matrici kao negativne vrijednosti. Tada možete koristiti formule, postupke usporedbe i principe za određivanje optimalne alternative dane kasnije u knjizi bez promjena;

2) predstaviti ih u matrici kao pozitivne vrijednosti. U ovom je slučaju potrebno promijeniti formule dane u knjizi: operacije maksimizacije do minimizacije i obrnuto, operacije usporedbe u određivanju optimalnih alternativa od "veće od" i "veće ili jednako" do "manje" i "manje ili jednako", i obrnuto.

Stablo odlučivanja koristi se kada je potrebno donijeti sekvencijalni niz odluka. Stablo odlučivanja grafička je metoda koja omogućuje povezivanje točaka odlučivanja, mogućih strategija Ai, njihovih posljedica Ei, j s mogućim čimbenicima, uvjetima okoliša. Izgradnja stabla odluka započinje ranijom odlukom, zatim se prikazuju moguće radnje i posljedice svake radnje (događaja), zatim se ponovno donosi odluka (izbor smjera djelovanja) itd., Sve dok se ne iscrpe sve logične posljedice rezultata. Stablo odluke gradi se pomoću pet elemenata:

1. Trenutak donošenja odluke.

2. Točka nastanka događaja.

3. Odnos između odluka i događaja.

4. Vjerojatnost nastanka događaja (zbroj vjerojatnosti u svakoj točki mora biti jednak 1).

5. Očekivana vrijednost (posljedice) - kvantitativni izraz svake alternative koji se nalazi na kraju grane.

Najjednostavnije rješenje je izbor dvije mogućnosti - "Da" ili "Ne" (slika 20).

Lik: 20. Najjednostavnije stablo odluke

Nakon što je strateška interakcija formalno opisana, odnosno postavljena je igra, ovu igru \u200b\u200btreba riješiti. Što znači "riješiti igru"? Rješavanje igre znači pronaći strategijski profil koji će se igrati. Pritom vjerujemo da se igrači ponašaju racionalno.

Prilikom rješavanja igara mogu se primijeniti različiti koncepti ravnoteže, poput,

1. Ravnoteža u dominantnim strategijama.

2. Ravnoteža dobivena isključivanjem strategija kojima dominira.

3. Nashova ravnoteža.

Razmotrimo prvi slučaj.

Neka postoji igra n-igrača u normalnom obliku i (s 1, ..., S n) - neki profil strategija. Za bilo koji i \u003d 1 ,. ... ... , n stavimo s− \u003d (s 1, ..., s i-1, s i + 1, ..., s n).

Drugim riječima, s -i je skup strategija svih igrača, osim one i, iz profila (s 1, ..., s n). Skup svih mogućih skupova strategija svih igrača, osim one i, označit će se sa S -i.

Tablica A

Neka je i \u003d 2 (tablica A). Tada za bilo koji profil strategija (s 1, s 2) s -2 označava strategiju prvog igrača s 1. Skup S -2 u ovoj igri ima sljedeći oblik: S -2 \u003d (a 1, a 2).

strogo dominantnaako je za bilo koju drugu strategiju i-tog igrača s ′ i ∈ S i i bilo koji skup s -i ∈ S -i strategija preostalih igrača nejednakost

u i (s i, s -i)\u003e ui (s ′ i, s -i).

Za bilo koje strategije drugih igrača, uplata koju igrač i prima igrajući strategiju s i veća je od isplate koju prima igrajući strategiju s ′ i.

U tablici primjera A

· Strategija a 1 prvog igrača strogo je dominantna, jer za bilo koju strategiju drugog igrača donosi prvom igraču strogo veće plaćanje od bilo koje druge strategije.

· Strategija b 1 drugog igrača strogo je dominantna, jer za bilo koju strategiju prvog igrača donosi drugom igraču strogo veće plaćanje od bilo koje druge strategije.

Pozvana je strategija i-og igrača s i ∈ S i slabo dominantanako je za bilo koju drugu strategiju i-tog igrača s ′ i ∈ S i i bilo koji skup s -i ∈ S -i strategija preostalih igrača nejednakost

u i (s i, s -i) ⩾ u i (s ′ i, s -i).

Slabo dominantne strategije moraju zadovoljiti nešto slabiji uvjet od strogo dominantnih.

Ako u tablici A ispravimo uplatu drugog igrača 2 sa 7 (ćelija a 1, b 2), tada strategija b 1 za drugog igrača više neće biti strogo slabodominantna, budući da postoji još jedna strategija b 2, čije je plaćanje ekvivalentno.

Nazvan je profil strategija (s 1, ..., S n) ravnoteža u strogo dominantnim strategijama, ako je za svakog igrača i, i \u003d 1 ,. ... ... , n, strategija s i je strogo dominantna.

U tablici A profil strategija (a 1, b 1) ravnoteža je u strogo dominantnim strategijama, budući da su strategije a 1 i b 1 strogo dominantne.

Slično tome, profil strategija (s 1, ..., S n) naziva se ravnotežom u slabo dominantnim strategijama ako je za svakog igrača i, i \u003d 1 ,. ... ... , n, strategija s i je slabo dominantna.

Ako igrač ima striktno dominantnu strategiju u nekoj igri, tada postoje svi razlozi za vjerovanje da će igrati upravo ovu strategiju: ako igra ovu strategiju, tada će mu dobitak biti maksimalan. Ali igre u kojima svaki igrač ima strogo dominantnu strategiju su rijetke: ravnoteža u strogo dominantnim strategijama koncept je rješenja koji nije prikladan za sve igre.

Razmotrimo poznati primjer igre - zatvorenikova dilema.

Pozadina: Policija je uhvatila dvije osobe osumnjičene za počinjenje pljačke, ali protiv njih nema dovoljno dokaza. Kako bi prikupila dokaze, policija je osumnjičenike razdvojila u odvojene ćelije, onemogućujući im razmjenu informacija, te ih je ispitivala.

Svaki igrač ima dvije strategije:

Šutjeti

· Dogovorite se s istragom i predajte partnera.

Uplate igrača:

· Ako oba zatvorenika šute, policija će poslati svakog od njih u zatvor pod blagim člankom na 1 godinu.

· Ako jedan zatvorenik izruči drugog, a drugi šuti, onaj protiv koga su svjedočili ići će u zatvor na 10 godina, a drugi na slobodu.

· Ako se oba zatvorenika slože s dogovorom s istragom, policija će moći optužiti obojicu za pljačku, ali će svaki od njih biti smanjen na 5 godina.

Matrica igre:

Imaju li igrači dominantne strategije?

Prvi zatvorenik ima strogo dominantnu strategiju - strategiju izdaje.

Drugi zatvorenik također ima strogo dominantnu strategiju - strategiju izdaje.

Profil strategije (Izdaja, Izdaja) je ravnoteža u strogo dominantnim strategijama. I također - ravnoteža u slabo dominantnim strategijama.

Za strateški profil s kaže se da Pareto dominira strateškim profilom s ′ ako:

u i (s) ⩾ u i (s ′) za bilo kojeg igrača i;

u i (s)\u003e u i (s ′) za najmanje jednog igrača i.

Poziva se strateški profil s ∗ Pareto-optimalanako nema profila s ′ kojim Pareto dominira s ∗. Je li profil ravnoteže (Betray, Betray) Pareto optimalan? Ne! Njegov profil kojim dominiraju Pareto (Tišina, Šutnja): ako su oba igrača šutjela, tada bi svaki dobio veću isplatu nego u ravnoteži. Jesu li drugi strateški profili Pareto optimalni? Da. Ravnoteža u zatvoreničkoj dilemi jedini je strateški profil koji nije Paretov optimalan!

Sada razmotrimo ravnotežu po iznimke strogo (ili slabo) dominirane strategije.

2) Strategija i i igrača i strogo dominira strategijom i i igrača i ako

u i (s i, s -i)\u003e u i (s ′ i, s -i) za bilo koji skup strategija preostalih igrača s -i ∈ S -i.

2) Strategijom s i igrača i strogo dominira strategija s i i igrača i ako

u i (s i, s -i)< u i (s′ i , s -i) для любого набора стратегий остальных игроков s -i ∈ S -i .

Oznaka: s i ≺ s ′ i.

3) Strategija i i igrača i slabo dominira strategijom i i igrača i ako

u i (s i, s -i) ⩾ u i (s ′ i, s -i) za bilo koji skup strategija preostalih igrača s -i ∈ S -i.

4) Strategijom i i igrača i slabo dominira strategija s i i igrača i ako

u i (s i, s -i) ⩽ ui (s ′ i, s -i) za bilo koji skup strategija preostalih igrača s -i ∈ S -i.

Oznaka: s i ≼ s ′ i.

Strategija s i igrača i naziva se strogo dominiranom ako postoji strategija s i igrača I koja strogo dominira strategijom i.

Strategija si igrača i naziva se slabo dominiranom ako postoji strategija s ′ i igrača i koja slabo dominira strategijom i.

Ako igrač ima strogo dominiranu strategiju, tada ga, budući da je racionalan, nikada neće igrati: to će mu sigurno donijeti manje od nekih njegovih drugih strategija, koje također može igrati. Oba igrača razumiju da se strogo dominirana strategija nikada neće igrati, ni pod kojim okolnostima, tako da u matričnom zapisu igre možemo ukloniti stupac ili redak koji odgovara ovoj strategiji.

Razmislite o igri

1. Izuzmimo strategiju b 1, budući da je b 2 ≺ b 3.

2. Eliminirajte strategiju a 1, budući da je a 1 ≺ a 2.

3. Izuzimamo strategiju b 3, budući da je b 3 ≺ b 1.

Preostali profil (a 2, b 1) ravnoteža je postignuta isključivanjem strategija kojima se strogo dominira.

Ako u završnoj igri (ako je skup mogućih strategija igrača konačan) u normalnom obliku, kao rezultat uzastopnog uklanjanja strogo dominiranih strategija, ostane matrica 1 × 1, tada se preostali profil naziva ravnotežom dobivenom eliminacijom strogo dominiranih strategija.

Imajte na umu da:

· Ne mogu se sve igre riješiti dosljednim uklanjanjem strategija kojima strogo dominira;

· Redoslijed izuzimanja strogo dominiranih strategija nije važan - u kojem god redoslijedu izuzeli takve strategije, kao rezultat doći ćemo do istog profila;

· Isključujući slabo dominirane strategije u drugom redoslijedu, dobit ćemo različite ravnoteže;

· Ako igra ima ravnotežu u strogo dominantnim strategijama, onda je to i ravnoteža dobivena izuzećem strategija kojima strogo dominira;

· Ravnoteža dobivena uklanjanjem strogo dominiranih strategija nije nužno ravnoteža u strogo dominantnim strategijama.

Nashova ravnotežaJe li još jedna vrsta ravnoteže koja se može dobiti u matrici igre.

Profil (s ∗ 1, ..., s ∗ n) naziva se Nashova ravnoteža (NE) ako je za bilo kojeg igrača i i za bilo koju strategiju s i ∈ S i nejednakost

u i (s ∗ i, s ∗ -i) ⩾ u i (s i, s ∗ -i).

Drugim riječima, nashova ravnotežaprofil strategija naziva se takav da nije profitabilno da bilo koji od igrača odstupa i igra drugu strategiju s fiksnim strategijama drugih igrača.

Nashova ravnoteža dobila je ime po slavnom matematičaru Johnu Nashu, laureatu Nobelova nagrada u ekonomiji 1994 "Za analizu ravnoteže u teoriji nekooperativnih igara" (s Reinhardom Seltenom i Johnom Harsanyijem).

Možemo formulirati algoritam za pronalaženje Nash-ovih ravnoteža u konačnim igrama za dva igrača:

1. Za svaku strategiju drugog igrača točkama označite najbolje odgovore prvog igrača.

2. Za svaku strategiju prvog igrača zvjezdicom označite najbolje odgovore drugog igrača.

3. Profili koji su označeni točkama i zvjezdicama Nash-ove su ravnoteže.

Primjer: igra Bitka spolova

Izjava o igri. Muž i žena samostalno odlučuju kamo će ići navečer: na nogomet ili na balet. Među njima nema veze, pa nitko od njih ne može saznati ništa o tome kamo je drugi odlučio ići. Preferencije supružnika su takve da bi navečer htjeli biti na jednom mjestu, ali supruga više voli balet, a muž nogomet. Bolje je da muž bude sa suprugom na baletu nego samo na nogometu. Bolje je da supruga sa suprugom ide na nogomet nego da sama ide na balet.

Svaki supružnik ima na raspolaganju dvije strategije: otići na nogomet (F) ili na balet (B). Postavke supružnika mogu se postaviti pomoću sljedeće matrice plaćanja:

Kao odgovor na različite strategije supruge, muž ima koristi od igranja različitih strategija. Isto vrijedi i za suprugu.

U našoj matrici plaćanja imamo dvije ćelije u kojima se podudarao mužev najbolji izbor za fiksnu strategiju supruge najbolji izbor supruge s fiksnom strategijom muža.

Profili strategija (F, F) i (B, B) u nekom su smislu bolji od profila strategija (F, B) i (B, F). Ako se muž i žena nađu zajedno na nogometu ili na baletu, nijednom od supružnika nije korisno otići u neko drugo mjesto s odlukom potonjeg da ostane nepromijenjen. Ako su supružnici navečer bili na različitim mjestima, tada bi svakom od njih koristilo odstupanje od prvotno odabrane strategije.

Dakle, profili strategija (F, F) i (B, B) dobiveni od nas su Nashove ravnoteže.

5.3. Metode za odabir alternativa u uvjetima rizika i nesigurnosti.
Kriteriji za odabir odluke

U situaciji neizvjesnosti postoji nekoliko mogućih stanja, a različite alternative u njima pružaju različite koristi. Odnosno, imamo nekoliko alternativa, od kojih je svaka skup ishodišnih vrijednosti za odgovarajuća stanja prirode. Te se skupove ne može jednostavno matematički usporediti "u cjelini" pomoću pojmova "više ili manje". Ova se operacija može izvesti samo na pojedinim članovima ovih skupova.

Ako ne postoje strogo ili slabo dominantne alternative, to znači da u različitim prirodnim stanjima različite alternative pokazuju najbolje rezultate. Kako se ti skupovi vrijednosti mogu međusobno uspoređivati \u200b\u200bi kako odabrati optimalni? Tu se javljaju tzv kriteriji izbora ili samo kriteriji.

Glavna ideja bilo kojeg kriterija je zamijeniti čitav niz vrijednosti jednim numeričkim pokazateljem koji karakterizira ovaj skup s određenog gledišta, a zatim samo numerički usporediti te pokazatelje međusobno. Koji će postaviti ovaj numerički pokazatelj biti "bolji" (više ili manje - ovisi o vrsti kriterija i situaciji), što će se smatrati optimalnim za ovaj kriterij.

Ideja je jednostavna, ali učinkovita. Međutim, značajan nedostatak bilo kojeg kriterija je "gubitak informacija". Zbog "kompresije" cijelog skupa vrijednosti u jedan jedini broj, neka svojstva (značajke) skupa postaju vidljiva, a druga nisu vidljiva.

To je poput prosuđivanja osobe samo po principu (tj. Kriteriju) "loše" ili "dobro". Ovdje su sve osobine, karakterne osobine i pogledi osobe opisani jednom riječju. To je lako zapamtiti, ali ovdje nema detaljnih podataka. Štoviše, može biti iskrivljeno. Prvo, nisu sve osobine loše osobe možda lošije od osobine dobre osobe (može biti zdravije ili čak pametnije). Drugo, značenje "lošeg" ili "dobrog" odgovara pogledu određenog subjekta ili skupine koja je osobu ocjenjivala prema svojoj subjektivnosti. I, vrlo vjerojatno, drugi ljudi imaju vlastite pristupe dodjeljivanju značenja "loš" ili "dobar". Stoga takva ocjena nije točna i univerzalna.

Općenito postupak primjene kriterija kako slijedi:

1) u prvoj fazi odabire se kriterij prema kojem će se izvršiti izbor;

2) vrijednost odabranog kriterija izračunava se za svaku alternativu. Zapravo se svakoj alternativi dodjeljuje jedna numerička vrijednost kriterija (njegova kvantitativna procjena);

3) alternative se uspoređuju uobičajenom numeričkom usporedbom odgovarajućih vrijednosti kriterija;

4) prema rezultatima usporedbe alternativa se prepoznaje kao optimalna, koja ima najbolju vrijednost kriterija. Ono što se smatra "najboljim" - maksimalna ili minimalna vrijednost kriterija - ovisi o tome što pokazuju ishodi alternativa (dobit, dobitak ili gubitak, troškovi) i po kojem se kriteriju vrši usporedba.

Razmotrimo šest glavnih kriterija koji se mogu koristiti prilikom usporedbe alternativa u situaciji neizvjesnosti:

· Waldov kriterij;

· Kriterij "maximax";

· Laplaceov kriterij;

· Divljački kriterij;

· Hurwitzov kriterij;

· Općeniti Hurwitzov kriterij.

Waldov kriterij je najviše "oprezan". Prema njegovim riječima, optimalna alternativa bit će ona koja pruža najbolji ishod među svim mogućim alternativama u najgorim okolnostima.

Ako ishodi odražavaju pokazatelje koje treba minimizirati (gubici, troškovi, gubici, itd.), Tada se Waldov kriterij usredotočuje na "minimax" (najmanje među maksimalnim vrijednostima gubitaka svih alternativa).

Ako su ishodi alternativa pokazatelji dobiti, dohotka i drugi pokazatelji koje treba maksimizirati (prema principu "što više to bolje"), tada "maksimin" dobitak (maksimalan među minimalnim dobicima). U nastavku ćemo za sve kriterije u tekstu razmotriti upravo takav slučaj kada ishod pokaže određenu dobit.

Prema Waldovom kriteriju, procjena ja Th-a je najmanja isplata:

W i \u003d min ( x ij), j \u003d 1..M

Optimalna alternativa je ona s najvećom lošom isplatom:

A * \u003d A k, W k \u003d max ( W i), i \u003d 1..N

Primjer primjene Waldovog kriterija

Postoje dva projekta X 1 i X 2 , koja u tri mogući scenariji razvoj regije ( j \u003d 1..3) osiguravaju različitu dobit. Vrijednosti dobiti prikazane su u tablici 2.2. Potrebno je odabrati projekt za provedbu.

Tablica 3

Početni podaci

Ako se izbor optimalnog projekta provodi prema Waldovom kriteriju, tada donositelj odluke mora izvršiti sljedeće radnje:

1. Pronađi minimum ishodi za svaku alternativu. Ovo su vrijednosti Waldovog kriterija:

W 1 \u003dmin (x 1j), j \u003d 1..3 \u003d\u003e W 1 \u003dmin (45, 25, 50) = 25

W 2 \u003dmin (x 2j), j \u003d 1..3 \u003d\u003e W 2 \u003dmin (20, 60, 25) = 20

2. Usporedite vrijednosti Waldovog kriterija i pronađite najveću vrijednost. Alternativa sa maksimalna vrijednost kriterijasmatrat će se optimalnim:

25\u003e 20 \u003d\u003e W 1\u003e W 2 \u003d\u003e X * \u003d X 1

Ako je odluka donesena samo prema Waldovom kriteriju, donositelj odluke odabrao je projekt za provedbu X 1 , budući da je dobit koju će ovaj projekt pružiti s najgorim razvojem situacije veća.

Odabravši optimalnu alternativu prema Waldovom kriteriju, donositelj odluke jamči sebi da u najgorim okolnostima neće dobiti manje od vrijednosti kriterija. Stoga se i ovaj pokazatelj naziva kriterij zajamčenog rezultata.

Glavni problem Waldovog kriterija je njegov pretjerani pesimizam i, kao posljedica toga, ne uvijek logičan rezultat. Tako, na primjer, pri odabiru prema ovom kriteriju između alternativa A (100; 500) i B (90; 1000) treba se usredotočiti na opciju I ... Međutim, u životu bi bilo logičnije odabrati NA budući da je u najgorem slučaju NA samo malo gore I , dok je u dobrim okolnostima NA pruža mnogo veću isplatu.

Dijametralna suprotnost Waldovom kriteriju je takozvani kriterij "maximax". Ako je Wald odražavao pogled krajnjeg pesimista, onda "maksimaks" odgovara stavu krajnjeg optimizma. Sva se pažnja posvećuje samo najboljim ishodima, stoga i procjeni ja -th alternativa prema ovom kriteriju je njegov najveći dobitak M i :

M i \u003d maks (x ij), j \u003d 1..M

Optimalna alternativa je ona s najvećom najvećom isplatom:

X * \u003d X k, M k \u003d max ( M i), i \u003d 1..N

Primjer primjene kriterija "maximax"

U uvjetima primjera iz tablice. 3 radnje donositelja odluke koje koriste kriterij "maximax" za donošenje odluke bit će sljedeće:

1. Pronađi maksimum ishodi za svaku alternativu:

M 1 \u003dmaks (x 1j), j \u003d 1..3 \u003d\u003e M 1 \u003dmaks (45, 25, 50) = 50

M 2 \u003dmaks (x 2j), j \u003d 1..3 \u003d\u003e M 2 \u003dmaks (20, 60, 25) = 60

2. Usporedite pronađene vrijednosti i odredite alternativu s maksimum vrijednost kriterija:

50 < 60 => M 1< М 2 => X * \u003d X 2

Prema kriteriju maximax, projekt je optimalan X 2 ., koji u najboljim okolnostima može osigurati najveći profit.

Kriterij "maximax" ne uzima u obzir nikakve druge ishode osim najboljih. Stoga njegova uporaba, prvo, može biti vrlo opasna, a, drugo, baš kao i Waldov kriterij, može dovesti do nelogičnih odluka. Na primjer, među alternativama A (-100; 0; 500) i B (200; 300; 400) s pozicije "maximax" najbolje je I međutim, on također nosi opasnost od gubitaka ( -100 ), i općenito su svi osim najboljih ishoda puno lošiji NA ... stoga praktična upotreba kriterij "maximax" vrlo je ograničen.

Laplaceov kriterij temelji se na načelo nedovoljne opravdanosti... Budući da su vjerojatnosti stanja nepoznate u okviru informacijskog pristupa u situaciji neizvjesnosti, nema razloga tvrditi da su one različite. Stoga možemo pretpostaviti da su isti.

Po laplaceov kriterij prosječna isplata koristi se kao procjena alternative:

Optimalna alternativa je maksimalna prosječna isplata:

X * \u003d X k, L k \u003d max ( L i), i \u003d 1..N

Primjer primjene Laplaceova kriterija

Za uvjete primjera iz tablice. 3 upotreba Laplaceova kriterija izgledat će ovako:

1. Pronađi prosječno vrijednost ishoda za svaki projekt. To je procjena alternative prema Laplaceovom kriteriju:

L 1 \u003d (x 11 + x 12 + x 13) / 3 \u003d (45 + 25 + 50) / 3 \u003d 40

L 2 \u003d (x 21 + x 22 + x 23) / 3 \u003d (20 + 60 + 25) / 3 \u003d 35

2. Usporedite izračunate vrijednosti i pronađite alternativu s maksimum vrijednost kriterija:

40\u003e 35 \u003d\u003e L 1\u003e L 2 \u003d\u003e X * \u003d X 1

Prema Laplaceovom kriteriju, optimalni projekt je X 1 , koji ima najveći prosječni profit.

Podlo je prilično popularna mjera u uvjetima nesigurnosti, pa čak i rizika, ali ne uzima u obzir širenje rezultata u odnosu na ovu vrijednost. Tako, na primjer, alternative A (400; 600) i B (0; 1000) su ekvivalentni prema Laplaceovom kriteriju (L A \u003d L B \u003d 500) međutim alternativa NA više je "rizično", jer podrazumijeva mogućnost da se ništa ne dobije u lošim okolnostima.

Kriterij Savage donekle se razlikuje od svih ostalih. Procjena alternativa ne provodi se prema izvornoj matrici, već prema tzv "matrica žaljenja" ili, kako se to također naziva u nekim izvorima, "matrica rizika".

Za proizvoljnu alternativu i određeno prirodno stanje, veličina "žaljenja" jednaka je razlici između onoga što dana alternativa pruža i koliko se u tom stanju može postići maksimum. S ekonomskog gledišta, iznos "žaljenja" može se protumačiti kao izgubljena dobit (ili izgubljena dobit) u usporedbi s maksimalno mogućim u danom stanju prirode.

Razmotrite kako odabrati najbolju alternativu, vodeći se Savageovim kriterijem.

1. OPĆA TEHNIKA ZA OBLIKOVANJE KRITERIJA

Bit predložene metodologije za formiranje kriterija je provedba sljedećih točaka.

1) Iz dobitaka aij, i \u003d 1,…, m; j \u003d 1,…, n, igrač A sastavlja matricu A, pod pretpostavkom da zadovoljava gornje uvjete: m³2, n³2 i da ne sadrži dominirane (posebno duplicirane) retke.

Isplate aij igrača A, predstavljene u obliku matrice A, omogućuju bolji prikaz rezultata izbora strategija Ai, i \u003d 1, ..., m, od strane igrača A za svako prirodno stanje Pj, j \u003d 1, ..., n.

2) Fiksiramo raspodjelu vjerojatnosti qj \u003d p (Pj), j \u003d 1, ..., n, stanja prirode Pj, j \u003d 1, ... n, zadovoljavajući uvjet (1), naravno, ako su poznati. Stoga je klauzula 2 uključena u metodologiju oblikovanja kriterija u slučaju da se odluka donosi pod rizikom.

3) Na temelju točaka 1 i 2 odabiremo prirodni broj l, 1 £ l £ n i na određeni način konstruiramo matricu


Nazovimo ih koeficijentima kriterija koji se formira. Oni su dizajnirani da igraju ulogu kvantitativnih procjena nekih subjektivnih manifestacija igrača A (donositelja odluka), naime, stupnja povjerenja u raspodjelu vjerojatnosti prirodnih stanja i stupnja njegovog pesimizma (optimizma) pri donošenju odluka.

5) Koristeći matricu B i koeficijente l1, ..., ll, za svaku strategiju Ai, i \u003d 1, ..., m, igrač A dodijelimo broj


7) Odredite optimalnu strategiju.

Optimalna strategija je strategija Ak s pokazateljem maksimalne učinkovitosti, drugim riječima, strategija čiji se pokazatelj učinkovitosti Gk podudara s cijenom igre G:


Jasno je da takva definicija optimalne strategije ne podrazumijeva njezinu jedinstvenost.

Imajte na umu da prema logici ove točke igrač A, odabirom optimalne strategije, maksimizira pokazatelj Gi (vidi (5)). Ova okolnost opravdava ono što smo taj pokazatelj nazvali (u stavku 5.) pokazateljem učinkovitosti.

2. OBLIKOVANJE NEKIH POZNATIH KRITERIJUMA - POSEBNIH SLUČAJEVA OPĆE TEHNIKE

Bayesov kriterij (,,,).

1) Neka je A matrica isplate igrača A.

2) Poznate su vjerojatnosti qj \u003d p (Pj), j \u003d 1,…, n, stanja prirode Pj, j \u003d 1,…, n, koje zadovoljavaju uvjet (1). Slijedom toga, dolazi o donošenju odluke u uvjetima rizika.

3) Stavili smo l \u003d n i matrica B je izabrana jednaka matrici A, tj.

bij \u003d aij za sve i \u003d 1,…, m i j \u003d 1,…, n.

4) Koeficijenti l1, ..., ln, odabrani su jednaki odgovarajućim vjerojatnostima q1, ..., qn, tj. ll \u003d qi, i \u003d 1,…, n. Ovime igrač A izražava puno povjerenje u istinu raspodjele vjerojatnosti q1, ..., qn, prirodnih stanja.

Iz (1) proizlazi da koeficijenti lj, j \u003d 1,…, n zadovoljavaju uvjet (3).

5) Pokazatelj učinkovitosti strategije Ai prema Bayesovom kriteriju označava se s Vi, a nalazimo je formulom (3):


Očito je Bi ponderirani prosječni dobitak za strategiju Ai s ponderima q1,…, qn.

Ako se strategija Ai protumači kao diskretna slučajna varijabla koja uzima vrijednosti isplata za svako prirodno stanje, tada će vjerojatnosti tih isplata biti jednake vjerojatnostima prirodnih stanja, a tada je Bi matematičko očekivanje ove slučajne varijable (vidi (6)).

6) Cijena igre prema Bayesovom kriteriju, koji označavamo s B, određuje se formulom (4):

7) Optimalna strategija među čistim strategijama prema Bayesovom kriteriju je Ak strategija, za koju je pokazatelj učinkovitosti maksimalan:

Laplaceov kriterij (,,,).

2) Na temelju teorijskih ili praktičnih razmatranja, navodi se da nijedno od mogućih stanja prirode Pj, j \u003d 1, ..., n, ne može imati prednost. Stoga se sva prirodna stanja smatraju jednako vjerojatnima, t.j. qj \u003d n-1, j \u003d 1,…, n. Taj se princip naziva Laplaceovim principom "nedovoljnog razuma". Vjerojatnosti qj \u003d n-1, j \u003d 1,…, n, zadovoljavaju uvjet (1).

Budući da su vjerojatnosti prirodnih stanja poznate: qj \u003d n-1, j \u003d 1, ..., n, tada smo u situaciji donošenja odluka u uvjetima rizika.

3) Neka je l \u003d n, a kao matricu B možemo uzeti matricu dobivenu iz matrice A, ako je svaki njezin redoslijed zamijenjen proizvoljnom permutacijom njegovih elemenata. Konkretno, možemo staviti B \u003d A. U općenitom slučaju, elementi matrice B imaju oblik bij \u003d aikj (i), i \u003d 1,…, m; j \u003d 1,…, n, gdje je aik1 (i), aik2 (i),…, aikn (i) neka permutacija elemenata ai1, ai2,…, ain i-ti redak matrice A.

4) Neka su koeficijenti lj \u003d n-1, j \u003d 1,…, n. Očito, oni zadovoljavaju uvjet (2).

Izbor koeficijenata lj, j \u003d 1, ..., n, time potvrđuje puno povjerenje igrača A u Laplaceov princip nedovoljne osnove.

5) Prema formuli (3), pokazatelj učinkovitosti strategije Ai prema Laplaceovom kriteriju, koji označavamo s Li, jednak je:


7) Optimalna strategija Ak prema Laplaceovom kriteriju je strategija s pokazateljem maksimalne učinkovitosti:

Imajte na umu da će, kako slijedi iz (7) i (8), pokazatelj učinkovitosti Li biti maksimalan ako i samo ako je zbroj maksimalan, te stoga, kao pokazatelj učinkovitosti strategije Ai, možemo uzeti u obzir broj, a kao cijenu igre - broj.

Tada će optimalna strategija biti ona s maksimalnim dobicima.

Waldov kriterij (-).

1) Pretpostavimo da je A matrica isplate igrača A.

2) Vjerojatnosti prirodnih stanja su nepoznate i ne postoji način da se dobiju statistički podaci o njima. Stoga je igrač A u situaciji donošenja odluka u neizvjesnosti.

3) Neka je l \u003d 1 i


4) Neka je koeficijent l1 \u003d 1. Očito je uvjet (2) zadovoljen.

5) Označimo pokazatelj učinkovitosti strategije Ai prema Waldovom kriteriju kao Wi. Na temelju (9) i vrijednosti koeficijenta l1 \u003d 1, prema formuli (3) imamo:


Dakle, pokazatelj učinkovitosti strategije Ai prema Waldovom kriteriju je minimalna isplata igrača A kada primijeni ovu strategiju.

6) Cijena igre prema Waldovom kriteriju, označavamo je W, nalazi se po formuli (4):

7) Optimalna među čistim strategijama prema Waldovom kriteriju je Ak strategija s pokazateljem maksimalne učinkovitosti:

Drugim riječima, prema Waldovom kriteriju, optimalna strategija među čistim strategijama je ona čista strategija u kojoj je minimalna isplata maksimalna među minimalnim isplatama svih čistih strategija. Dakle, optimalna strategija prema Waldovom kriteriju jamči za bilo koja prirodna stanja dobitak ne manji od maksimina:


Na temelju (10) Waldov kriterij kriterij je krajnjeg pesimizma igrača A, a kvantitativni izraz ovog krajnjeg pesimizma je vrijednost koeficijenta l1, jednaka 1. Igrač A, donoseći odluku, djeluje prema načelu najvećeg opreza.

Iako arapska poslovica kaže: "Tko se boji vlastite sjene, nema mjesta na suncu", ipak je ovaj kriterij prikladan u slučajevima kada igrač A ne želi toliko pobjeđivati \u200b\u200bkoliko ne želi izgubiti. Korištenje Waldovog principa u svakodnevnom životu potvrđuju izreke poput "Mjeri sedam puta - jednom izreži", "Bog štiti voljenog", "Bolje pticu u rukama nego pita na nebu".

Hodge-Lehmannov kriterij.

1) Pretpostavimo da je matrica isplate igrača A matrica A.

2) Poznate su vjerojatnosti qi \u003d p (Pj), j \u003d 1,…, n, prirodnih stanja Pj, j \u003d 1,…, n, koje zadovoljavaju uvjet (1).

Dakle, na igraču A je da donese odluku pod uvjetima rizika.

3) Neka je l \u003d 2,


· Pokazatelj učinkovitosti strategije Ai prema Bayesovom kriteriju.

Matrica B poprimit će oblik


Očito ti koeficijenti zadovoljavaju uvjet (2).

5) Prema formuli (3), uzimajući u obzir (11), (12) i (13), pokazatelj učinkovitosti strategije Ai prema Hodge-Lehmannovom kriteriju jednak je:

Gi \u003d libi1 + l2bi2 \u003d (1-l) Wi + lBi \u003d (1-l) aij + i \u003d 1,…, m.

S desne strane formule (14), koeficijent l koeficijent kvantitativni je pokazatelj stupnja pouzdanosti igrača A ova raspodjela vjerojatnosti qi \u003d p (Pj), j \u003d 1, ..., n, prirodna stanja Pj, j \u003d 1, ..., n, a koeficijent (1-l) kvantitativno karakterizira stupanj pesimizma igrača A. Što je igrač A više pouzdan u ovu raspodjelu vjerojatnosti stanja prirode, što manje pesimizma i obrnuto.

6) Cijena igre prema Hodge-Lehmannovom kriteriju nalazi se po formuli (4):

7) Optimalna strategija prema Hodge-Lehmannovom kriteriju je Ak strategija s najvećim pokazateljem učinkovitosti:

Imajte na umu da je Hodge-Lehmannov kriterij kao da je posredni kriterij između Bayesovih i Waldovih kriterija. Za l \u003d 1, iz (14) imamo: Gi \u003d Bi i stoga se Hodge-Lehmannov kriterij pretvara u Bayesov kriterij. A za l \u003d 0, iz (14): Gi \u003d Wi i, prema tome, iz Hodge-Lehmannovog kriterija dobivamo Waldov kriterij.

Germeierov kriterij.

1) Neka je matrica A matrica isplate igrača A.

2) Dane su vjerojatnosti qi \u003d p (Pj), j \u003d 1,…, n, prirodnih stanja Pj, j \u003d 1,…, n, zadovoljavajući uvjet (1).

Tako igrač A je u situaciji odlučivanja u uvjetima rizika

veličina m x 1.

4) Stavili smo l1 \u003d 1. Uvjet (2) je očito zadovoljen.

5) Pokazatelj učinkovitosti strategije Ai prema Germeierovom kriteriju određuje se formulom (3) uzimajući u obzir (15) i činjenicu da je l1 \u003d 1:


Ako se igrač A drži strategije Ai, tada je vjerojatnost da će dobiti aij prema ovoj strategiji i prema prirodnom stanju Pj, očito, vjerojatnost qj ovog prirodnog stanja. Stoga formula (16) pokazuje da je pokazatelj učinkovitosti strategije Ai prema Germeierovom kriteriju minimalni dobitak za ovu strategiju, uzimajući u obzir njezinu vjerojatnost.

6) Cijena igre prema Germeierovom kriteriju određuje se formulom (4):

7) Optimalnom strategijom prema Germeierovom kriteriju smatra se Ak strategija s najvišim pokazateljem učinkovitosti:

Imajte na umu da se Germeierov kriterij može tumačiti kao Waldov kriterij primjenjiv na igru \u200b\u200bs matricom


Germeierov kriterij, poput Waldova, kriterij je krajnjeg pesimizma igrača A, ali, za razliku od Waldovog, igrač A, donoseći odluku s najvećom obazrivošću, uzima u obzir vjerojatnosti prirodnih stanja.

U slučaju jednolike raspodjele vjerojatnosti prirodnih stanja: qj \u003d n-1, j \u003d 1, ..., n, pokazatelj učinkovitosti strategije Ai, prema formuli (16), bit će jednak Gi \u003d n-1aij i, prema tome, Germeierov kriterij ekvivalentan je Waldovom kriteriju , tj. strategija koja je optimalna prema Germeierovom kriteriju optimalna je i prema Waldovom kriteriju, i obrnuto.

Kriterij djela.

1) Neka matrica isplate igrača A bude matrica A, čiji su svi elementi pozitivni:

aij\u003e 0, i \u003d 1,…, m; j \u003d 1,…, n.

2) Vjerojatnosti qj \u003d p (Pj), j \u003d 1,…, n, stanja prirode Pj, j \u003d 1,…, n, poznate su i zadovoljavaju uvjet (1).

3) Neka je l \u003d 1 i


veličina m x 1.

4) Neka je l1 \u003d 1. Uvjet (2) je zadovoljen.

5) Pokazatelj učinkovitosti strategije Ai prema kriteriju proizvoda u skladu s formulama (3) i (17) jednak je

.

6) Cijena igre prema kriteriju proizvoda izračunava se po formuli (4):

7) Optimalna strategija prema kriteriju proizvoda je Ak strategija s najvećim pokazateljem učinkovitosti:

Imajte na umu da je za kriterij proizvoda bitno da su sva stanja vjerojatnosti prirodnih stanja i sve isplate igrača A.

Kriterij Maximax (.-).

2) Vjerojatnosti stanja su nepoznate. Odluka se donosi pred neizvjesnošću.

3) Neka je l \u003d 1 i


veličina m x 1.

4) Odabiremo koeficijent l1 jednak 1: l1 \u003d 1. U ovom je slučaju uvjet (2) očito zadovoljen.

5) Pokazatelj učinkovitosti strategije Ai prema kriteriju maximax označava se s Mi, a definiramo ga formulom (3) uzimajući u obzir (18) i činjenicu da je l1 \u003d 1:


Dakle, pokazatelj učinkovitosti strategije Ai prema kriteriju maximax najveći je dobitak za ovu strategiju.

6) Cijena igre prema maksimaksnom kriteriju, koji smo označili kroz M, određuje se formulom (4):


Očito je da je ovo najveći element matrice A.

7) Optimalna strategija prema kriteriju maximax je Ak strategija s najvećim pokazateljem učinkovitosti:

Iz formule (19) zaključujemo da je kriterij maximax kriterij krajnjeg optimizma igrača A. To se kvantitativno izražava činjenicom da je l1 \u003d 1. Ovaj je kriterij suprotan Waldovom kriteriju. Igrač A, koristeći kriterij maksimaksa, pretpostavlja da će priroda P za njega biti u najpovoljnijem stanju i, kao posljedica toga, ponaša se vrlo neozbiljno, "otrcano" raspoloženje, jer je siguran u najveći dobitak. Istodobno, u nekim se slučajevima ovaj kriterij koristi namjerno, na primjer, kada se igrač A suoči s dilemom: ili dobiti najveći dobitak ili bankrotirati. Svakodnevno odražavanje takvih situacija ilustrirano je izrekama: “Pomakni se ili nestani”, “Tko ne riskira, ne pobjeđuje” itd.

Optimalna strategija za maksimalan kriterij jamči igraču A mogućnost pobjede jednake maksimumu.

.

Kriterij Hurwitza pesimizam-optimizam s eksponentom optimizma lÎ (-).

1) Neka je A matrica isplate igrača A.

2) Vjerojatnosti prirodnih stanja su nepoznate i ne postoji način da se dobiju pouzdani statistički podaci o njima.

Dakle, odluka o izboru optimalne strategije donijet će se u uvjetima neizvjesnosti.

3) Stavite l \u003d 2. Elementi matrice B


4) Koeficijenti l1 i l2 odabiru se kako slijedi:


U formuli (22) l je pokazatelj optimizma, a (1-l) pokazatelj pesimizma igrača A kada odabere optimalnu strategiju. Što je indikator optimizma bliži jednom, indikator pesimizma je bliži nuli, a više optimizma i manje pesimizma. I obrnuto. Ako je l \u003d 0,5, tada je 1-l \u003d 0,5, tj. pokazatelji optimizma i pesimizma su isti. To znači da je igrač A neutralan pri odabiru strategije.

Dakle, broj l se bira u rasponu od 0 do 1, ovisno o sklonosti igrača A optimizmu ili pesimizmu.

6) Cijena igre prema Hurwitzevom kriteriju N određuje se iz formule (5):


7) Optimalna strategija Ak prema Hurwitzevom kriteriju odgovara pokazatelju učinkovitosti

Hurwitzov kriterij je srednji između Waldovog i maximax kriterija i pretvara se u Waldov kriterij pri l \u003d 0 i - u maximax kriterij pri l \u003d 1.

Generalizirani Hurwitzov kriterij s koeficijentima l1,…, ln (,).

1) Neka je A matrica isplate igrača A.

2) Vjerojatnosti prirodnih stanja nisu poznate. Dakle, odluka se donosi pred neizvjesnošću.

3) Matrica B dobiva se iz matrice A permutiranjem elemenata svakog od njezinih redova nenamanjujućim redoslijedom:

bi1 £ bi2 £… £ kanta, i \u003d 1,…, m.

Dakle, u 1. stupcu matrice B nalaze se minimalne, a u n. Stupcu maksimalne isplate strategija. Drugim riječima, 1. stupac matrice B sadrži pokazatelje učinkovitosti strategija prema Waldovom kriteriju, a n. Stupac sadrži pokazatelje učinkovitosti strategija prema kriteriju maximax.

4) Koeficijenti l1, ..., ln odabiru se zadovoljavajući uvjete (2), odnosno različiti stupanj sklonosti igrača A optimizmu. U ovom je slučaju pokazatelj pesimizma igrača A broj


gdje je cjelobrojni dio broja, a pokazatelj optimizma igrača A broj


Očito je lr + l0 \u003d 1.

5) Pokazatelj učinkovitosti strategije Ai prema generaliziranom Hurwitzevom kriteriju određuje se formulom (3):


6) Cijena igre prema generaliziranom Hurwitzevom kriteriju određuje se formulom (4):

7) Optimalne strategije nalaze se na standardni način: Ak je optimalna strategija ako je Gk \u003d G.

Imajte na umu da generalizirani Hurwitzov kriterij uzima u obzir sve dobitke za svaku strategiju, što je neophodno za potpuniju sliku učinkovitosti strategija. Također primjećujemo da su neki od gore navedenih kriterija posebni slučajevi generaliziranog Hurwitzovog kriterija.

Imajte na umu da ako je B \u003d A, tada se koeficijenti lj, j \u003d 1, ..., n, mogu formalno protumačiti kao vjerojatnosti prirodnih stanja, a u ovom slučaju, generalizirani Hurwitzov kriterij podudara se s Bayesovim.

Ako je lj \u003d n-1, j \u003d 1,…, n, tada se generalizirani Hurwitzov kriterij pretvara u Laplaceov kriterij.

Ako je l1 \u003d 1, l2 \u003d ... \u003d ln \u003d 0, tada je generalizirani Hurwitzov kriterij Waldov kriterij.

Za l1 \u003d… \u003d ln-1 \u003d 0, ln \u003d 1, iz generaliziranog Hurwitzovog kriterija dobivamo kriterij maksimaksa.

Ako je l1 \u003d 1-l, l2 \u003d… \u003d ln-1 \u003d 0, ln \u003d l, gdje je lÎ, tada je generalizirani Hurwitzev kriterij Hurwitzov kriterij.

Ako su B \u003d A i qi \u003d p (Pj), j \u003d 1, ..., n vjerojatnosti prirodnih stanja koja zadovoljavaju uvjete (1), tada biranje koeficijenata lj, j \u003d 1, ..., n, kako slijedi: l1 \u003d 1- l + lq1, lj \u003d lqj, j \u003d 2,…, n, gdje lÎ, dobivamo Hodge-Lehmannov kriterij iz generaliziranog Hurwitzovog kriterija.

3. PROBLEM POD UKUPNOM SIGURNOŠĆU

Recimo da investitor odluči sagraditi određenu vrstu stanovanja na određenom mjestu. Investitor posluje u uvjetima nesigurnosti (neprozirnosti informacija) na tržištu stanova. Da bi stvorio ideju o situaciji na tržištu stanova u trenutku završetka gradnje, mora uzeti u obzir cijene nekretnina, konkurenciju na tržištu stanova, omjer ponude i potražnje, tečajeve i još mnogo toga. Statistički podaci pokazuju da je jedna od glavnih komponenti troškova stanovanja njegovo mjesto.

Razmotrimo matematički model ove situacije. Imamo igru \u200b\u200bs prirodom, gdje je igrač A investitor, priroda P je skup mogućih situacija na tržištu stanova u trenutku završetka gradnje, iz kojih se, na primjer, može formirati pet država P1, P2, P3, P4, P5 prirode. Poznate su približne vjerojatnosti tih stanja q1 \u003d p (P1) »0,30; q2 \u003d p (P2) "0,20; q3 \u003d p (P3) "0,15; q4 \u003d p (A4) "0,10; q5 \u003d p (P5) »0,25. Pretpostavimo da igrač A ima četiri (čiste) strategije A1, A2, A3, A4, koje predstavljaju izbor određenog mjesta za izgradnju kuće. Mnogo je tih mjesta ograničeno urbanističkim odlukama, vrijednošću zemljišta itd. Atraktivnost ulaganja projekt se definira kao postotak rasta dohotka u odnosu na iznos kapitalnih ulaganja, čija je procjena poznata za svaku strategiju i svako stanje prirode. Ovi podaci su predstavljeni u sljedećoj matrici isplate za igrača A:


veličine 4 x 5, u posljednjem, dodatnom retku naznačene su vjerojatnosti prirodnih stanja. Matrica (24) ne sadrži dominirane (posebno duplicirane) retke i svi su njezini elementi pozitivni.

Investitor će morati odabrati zemljište kako bi ulaganje iskoristio najučinkovitije.

Izračunajmo pokazatelje uspješnosti strategija

Prema Bayesu, Germeier i kriterij proizvoda, pod uvjetom da investitor A vjeruje u danu raspodjelu vjerojatnosti prirodnih stanja,

Prema Laplaceovom kriteriju, ako investitor A ne vjeruje danoj raspodjeli vjerojatnosti prirodnih stanja i ne može dati prednost niti jednom od razmatranih prirodnih stanja,

Prema Hodge-Lehmannovom kriteriju s koeficijentom pouzdanosti u vjerojatnosti prirodnih stanja, na primjer l \u003d 0,4,

· Prema Waldovom kriteriju, kriterijumu maksimaksa, Hurwitzevu kriterijumu pesimizam-optimizam s pokazateljem optimizma, na primjer, l \u003d 0,6, a prema generaliziranom Hurwitzovom kriteriju s koeficijentima, na primjer, l1 \u003d 0,35; l2 \u003d 0,24; 13 \u003d 0,19; l4 \u003d 0,13; l5 \u003d 0,09.

Rezultati izračuna pokazatelja uspješnosti i optimalne strategije predstavljeni su u sljedećoj tablici:

Tablica pokazatelja uspješnosti i optimalne strategije

Strategija

Kriteriji

Khoja-Lehman

Germeiger

Proizvodi

Maxi-max

Generalizirani Hurwitz s koeficijentima

l1 \u003d 0,35
l2 \u003d 0,24
l3 \u003d 0,19
l4 \u003d 0,13
l5 \u003d 0,09

Optimalno. strategija


Imajte na umu da, budući da je u Hodge-Lehmannovom testu pokazatelj pouzdanosti igrača A u raspodjeli vjerojatnosti stanja naznačenih u posljednjem redu matrice (24) l \u003d 0,4, pokazatelj pesimizma igrača A iznosi 1-l \u003d 0,6.

U Hurwitzevom kriteriju, pokazatelj optimizma igrača A jednak je l \u003d 0,4, pa je, prema tome, pokazatelj njegovog pesimizma također 1-l \u003d 0,6.

U generaliziranom Hurwitzevom kriteriju prema formuli (23), indeks pesimizma

\u003d 0,35 + 0,24 + 0,5 × 0,19 \u003d 0,685

i, prema tome, pokazatelj optimizma l0 \u003d 1-0,685 \u003d 0,315.

Dakle, u svim primijenjenim kriterijima, uzimajući u obzir pojedinačne manifestacije igrača A prema pesimizmu i optimizmu, igrač A je skloniji pesimističnoj procjeni situacije nego optimističnoj, s približno istim pokazateljima.

Kao rezultat primjene devet kriterija, vidimo da je optimalna strategija A1 3 puta, strategija A3 - 6 puta i strategija A4 - 1 put. Stoga, ako investitor A nema opravdanih ozbiljnih prigovora, tada se strategija A3 može smatrati optimalnom.

Savageov kriterij (kriterij minimalnog rizika).

Kriterij Hurwitza.

Odluka.

1. Waldov maksiminov kriterij.max min a ij

Izračunajmo minimalne vrijednosti po redovima min a ij , a zatim odaberite maksimum od njih.

Tako dobivamo N \u003d max min a ij \u003d 15 i J

Odgovor: optimalna strategija 1. igrača A je

strategija A 4.

Uzmemo parametar Hurwitz jednak γ =0,6: γ \u003d min a ij + (1-γ) max a ij

5 10 18 255 25 5*0,6+0,4*25=13

A \u003d 8 7 8 23 7 23 7 * 0,6 + 0,4 * 23 \u003d 13,4

21 18 12 21 12 18 12*0,6+0,4*18=14,4

20 22 19 1515 22 15*0,6+0,4*22=17,8

Dobivamo H \u003d max \u003d 17,8

strategija A 4.

Potrebno je izgraditi matricu rizika.

Za ovo:

1) izračunajte maksimalne vrijednosti u stupcima

2) izračunati matricu rizika: r ij \u003d max a ij - a ij

21-5 22-10 19-18 25-25 16 12 1 0

r ij \u003d 21-8 22-7 19-8 25-23 = 13 15 11 2

21-21 22-18 19-12 25-21 0 4 7 4

21-20 22-22 19-19 25-15 1 0 0 10

3) izračunajte maksimalne vrijednosti po redovima i odaberite red s najmanjom vrijednošću iz njih:

r ij \u003d 0 4 7 4 7

Dobivamo H \u003d minmax r ij \u003d 7 prilikom primjene strategije A 3.

Odgovor: Optimalna strategija prvog igrača je

strategija A 3.

4. Laplaceov kriterij. n

Izračunajte aritmetičku sredinu preko redaka [ 1 / n ∑ a ij ]

5 10 18 25 0.25 (5+10+18+25)=14.5 j \u003d 1

A \u003d 8 7 8 23 0,25 (8 + 7 + 8 + 23) \u003d 11,5

21 18 12 21 0.25 (21+18+12+21)=18

20 22 19 15 0.25 (20+22+19+15)=19

Dobivamo H \u003d maks [ 1 / n ∑ a ij ] =19 prilikom primjene strategije A 4.

Odgovor: Optimalna strategija prvog igrača je

strategija A 4.

V 1 V 2 V 3 V 4 n

A 1 5 10 18 25 H \u003d max∑P j a ij

A 2 8 7 8 23 i j \u003d 1

A 3 21 18 12 21

A 4 20 22 19 15

Vjerojatnosti strategija drugog igrača.

U 1 AT 2 U 3 AT 4
0.2 0.15 0.35 0.3

5*0.2+10*0.15+18*0.35+25*0.3=16.30

8*0.2+7*0.15+8*0.35+23*0.3=12.35

21*0.2+18*0.15+12*0.35+21*0.3=17.40

20*0.2+22*0.15+19*0.35+15*0.3=18.45

Dobivamo H \u003d 18,45 prilikom primjene strategije A 4.

Odgovor: Optimalna strategija prvog igrača je

strategija A 4.

PRIMJER # 2

Poduzeće ima mogućnost samostalnog planiranja količine sezonskih proizvoda A 1, A 2, A 3. Proizvodi koji se ne prodaju tijekom sezone kasnije se prodaju po sniženoj cijeni. Podaci o troškovima proizvodnje, prodajnim cijenama i količinama prodaje ovisno o razini potražnje dani su u tablici:



Potreban:

1) dati opisanoj situaciji shemu igre, naznačiti prihvatljive strategije strana, sastaviti matricu plaćanja

Indikacija. Da biste smanjili dimenziju matrice plaćanja, pretpostavimo da je razina potražnje jednaka za sve tri vrste proizvoda istovremeno:

povećana, srednja ili smanjena.

U igri sudjeluju 2 igrača: A - proizvođač, B - potrošač.

Igrač A nastoji svoje proizvode prodavati na takav način da ostvari maksimalan profit. Strategije igrača A su:

A 1 - prodavati proizvode s povećanim stanjem potražnje

I 2 - prodajte proizvode s prosječnim stanjem potražnje

I 3 - prodajte proizvode u smanjenom stanju potražnje

Igrač B nastoji kupiti proizvode po najnižoj cijeni. Strategije igrača B su:

B 1 - za kupnju proizvoda s povećanim stanjem potražnje

V 2 - kupujte proizvode s prosječnim stanjem potražnje

V 3 - kupujte proizvode sa smanjenom potražnjom

Igrači A i B imaju suprotne interese. Odredimo cijenu proizvoda tijekom sezone i nakon umanjenja cijene:

Izračunajte elemente matrice plaćanja

Rečenica zahtijevajte
strategija Povećana potražnja 14 + 38 + 24 Prosječna potražnja 8 + 22 + 13 Smanjena potražnja 5 + 9 + 7
Povećana potražnja 14 + 38 + 24 14*0,8+38*0,5+ 24*1,3=61,4 8*0,8+(14-8) *0,2+ 22*0,5+(38-22)*(-5) +13*1,3+(24-13)*0,2 =29,7 5*0,8+(14-5)*0,2+ 9*0,5+(38-9)*(-5)+ 7*1,3+(24-7)=8,3
Prosječna potražnja 8 + 22 + 13 8*0,8+22*0,5+ 13*1,3=34,3 8*0,8+22*0,5+ 13*1,3=34,3 5*0,8+(8-5)*0,2+ 9*0,5+(22-9)*(-5)+ 7*1,3+(13-7)*0,2 =12,9
Smanjena potražnja 5 + 9 + 7 5*0,8+9*0,5+7*1,3 =17,6 5*0,8+9*0,5+ 7*1,3=17,6 5*0,8+9*0,5+ 7*1,3=17,6

Matrica plaćanja poprimit će oblik

Strategija U 1 AT 2 U 3 α i \u003d min a ij j
A 1 61.4 29.7 8.3 8.3
A 2 34.3 34.3 12.9 12.9
A 3 17.6 17.6 17.6 17.6
β j \u003d max a ij i 61.4 34.3 17.6

α \u003d max α i \u003d 17,6 β \u003d min β j \u003d 17,6

Jer α \u003d β \u003d ν \u003d 17,6,tada se nađe sedlasta točka. Optimalno rješenje znači: A 3; U 3

Proizvođač (igrač A) dobit će zajamčenu dobit od 17,6 novčanih jedinica ako svoje proizvode prodaje na smanjenoj razini potražnje u iznosu od 5,9 i 7 jedinica. odnosno proizvodi A 1, A2 i A 3

Kontrolna pitanja:

1. Dajte definiciju konfliktne situacije.

2. Kako se zove matematički model konfliktne situacije?

3.Kako se nazivaju dionici u teoriji igara?

4. Koja se igra naziva antagonistička? Navedi primjer.

5. Dajte definiciju pojmu "strategija".

6. Što se podrazumijeva pod ishodom sukoba?

7. Dajte definiciju pojmu "dobitak".

8. Na koje se razrede dijele igre, ovisno o broju igrača?

9. Koji je cilj igrača A pri odabiru strategije?

10. U čemu je bit maksimin principa optimalnosti i kako se zove isplata dobivena u skladu s tim principom?

11. Zašto se maximin α naziva najnižom cijenom igre?

12. Koji je cilj igrača B pri odabiru strategije?

13 zašto minimax β naziva vrhunskom cijenom igre?

14. Zašto je nejednakost α < β ?

15. Dajte definiciju cijene igre u čistim strategijama.

16. Koja se igra naziva mješovitom strateškom igrom?

17 kako pronaći optimalno mješovita strategija igrača A i cijena igre 2 x n geometrijski?

18. Što se pod pojmom "priroda" podrazumijeva u teoriji igara?

19. Navedite primjere u kojima se odluka donosi u uvjetima nesigurnosti povezane s nesvjesnim prihvaćanjem različitih čimbenika.

20. Koja je razlika između izbora optimalnih strategija igrača u igrama s prirodom i antagonističkih igara?

21. Što se podrazumijeva pod rizikom igrača u igri s prirodom i kako se formira matrica rizika,

22. Dajte definiciju Waldovog kriterija i kako se njime određuje isplata?

23. Dajte definiciju kriterija Savage i kako se njime određuju dobici?

24. Dajte definiciju Laplaceova kriterija i kako se njime određuje isplata?

25. Dajte definiciju Bayesova kriterija i kako se njime određuje isplata?

26. Koji je princip odabira optimalne strategije u osnovi kriterija pesimizma - Hurwitzev optimizam u vezi s dobicima?

8. Predavanje. Sustavi čekanja.

U uvjetima neizvjesnosti, u najopćenitijem slučaju, moguća su dva pristupa donošenju strateške odluke.

Prvi je pristup kada menadžer može upotrijebiti dostupne informacije ili iskustvo kako bi utvrdio svoje pretpostavke o vjerojatnosti mogućih vanjskih uvjeta u kojima će se naći njegova tvrtka. U slučaju kada je vjerojatnost stanja objektivnih uvjeta nepoznata, u skladu s Bayes-Laplaceovim kriterijem, treba poći od njihove jednakosti. Odnosno, u nedostatku razloga za suprotno, potrebno je pretpostaviti jednakost vjerojatnosti pojave uvjeta koji vode do svakog od mogućih rezultata. Primjena ovog kriterija omogućuje smanjenje problema na varijantu s cjelovitim informacijama o stanju objektivnih uvjeta, uvjeti nesigurnosti postaju slični uvjetima rizika.

U drugom pristupu, kada je stupanj nesigurnosti previsok, upravitelj radije ne iznosi pretpostavke o vjerojatnostima različitih vanjskih uvjeta. Primjenom ovog pristupa za procjenu predloženih strategija mogući su sljedeći kriteriji za donošenje odluke:

· Kriterij krajnjeg optimizma;

· Waldov kriterij, koji se naziva i maksimin;

· Alpha-Hurwitzov test;

· Savageov kriterij, koji se naziva i minimalni kriterij odbijanja.

Izbor kriterija unaprijed je određen specifičnim okolnostima, kao i subjektivnim psihološkim karakteristikama, temperamentom i općenitim izgledima uprave tvrtke (optimistični ili pesimistični; konzervativni ili progresivni). Razmotrimo ove kriterije u sljedećem primjeru.

Primjer 4 Na prodaju po cijeni od 50 rubalja. za 1 jedinicu određena količina pokvarljivog proizvoda kupuje se po cijeni od 30 rubalja. za jedinicu. Iz zapažanja je poznato da se prodaja proizvoda može dogoditi na razini od 1 jedinice, 2 jedinice, 3 jedinice. i 4 jedinice. Ako se proizvod ne prodaje dnevno, na kraju dana prodaje se po sniženoj cijeni od 20 rubalja. za jedinicu. Potrebno je utvrditi koliko jedinica menadžer treba kupiti kako bi njegovo rješenje bilo optimalno u skladu s različitim kriterijima optimalnosti.

Prodajom svake jedinice proizvoda ostvarit će se dobit od 20 rubalja. (50 -30). Kada se svaka jedinica kupljenog proizvoda proda po sniženoj cijeni, gubitak prodaje iznosit će 10 rubalja. (30 - 20).

Napravimo stol. 8.5 koji ilustrira moguće rezultate trgovanja.

Tablica 8.1. Mogući prihodi u različitim scenarijima

Moguća opcija kupnje, jedinice
-10

Horizontalno ćemo rasporediti moguće mogućnosti potražnje za proizvodima dnevno, okomito - moguće opcije za donositelje odluka o kupnji proizvoda. U svakoj ćeliji tablice izračunavamo dobit (sa znakom plus) ili gubitak (sa znakom minus) od prodajnih operacija.



Kriterij krajnjeg optimizma diktira menadžeru strategiju djelovanja u kojoj dobiva priliku da ostvari maksimalan prihod. To će se dogoditi ako upravitelj kupi najveću moguću količinu proizvoda i proda ih sve tijekom dana:

4 x (50 - 30) \u003d 80 (trljati).

Ova je strategija najrizičnija, jer će u slučaju minimalne prodaje (1 jedinica) menadžer dobiti i najveći gubitak:

1 x (50 - 30) + 3 x (20 - 30) \u003d -10 (trljati).

Waldov kriterij rješenja -kriterij krajnji pesimizampretpostavlja najoprezniju strategiju ponašanja koja jamči maksimaliziranje minimalnog dohotka. Na primjer, minimalni prihod za razne opcije kupnje može biti 20, 10, 0 ili -10 rubalja. Ako upravitelj kupi 1 jedinicu. proizvoda, tada minimalni dobitak od 20 rubalja. zajamčena mu.

Ovaj kriterij usmjerava donositelja odluke na najgore uvjete i preporučuje odabir strategije za koju je dobitak najveći. U drugim povoljnijim uvjetima, upotreba ovog kriterija dovodi do gubitka učinkovitosti sustava ili rada. Budući da je kriterij konzervativan, posebno je pogodan za mala poduzeća čiji opstanak ovisi o njihovoj sposobnosti da izbjegnu gubitke.

Divljački kriterij, također poznat kao "divlji princip", princip pogrešnih izračuna, kriterij minimax rizika, princip minimaxa posljedica pogrešnih odluka itd. Savijev kriterij također pesimističan, ali pri odabiru optimalne strategije u skladu s njom, treba se usredotočiti ne na prihod, već na moguće gubitke, uzimajući u obzir izgubljenu dobit.

Podaci o mogućim gubicima prikazani su u tablici. 8.2.

Tablica 8.2.Mogući gubici u različitim scenarijima

Moguća opcija potražnje, jedinice Moguća opcija kupnje, trljajte.

Kao što možete vidjeti iz tablice. 8.2, uz kupnju 2 jedinice. i prodaje 1 jedinicu. po prodajnoj cijeni, drugu prodajemo po sniženoj cijeni, izgubivši 10 rubalja. Pri kupnji 2 jedinice. a potražnja od 3 jedinice. 2 jedinice prodajemo po redovnoj cijeni, dok gubimo izgubljenu dobit zbog nedostatka 1 jedinice. proizvod u iznosu od 20 rubalja.

Maksimalni gubici za svaku od opcija nabave bit će 60, 40, 20 i 30 rubalja. Vođeni kriterijem Savage, potrebno je odabrati između njih minimalnu vrijednost od 20 rubalja. i kupite 3 jedinice. proizvoda.

U skladu s ovim kriterijem, ako je to potrebno u svim uvjetima izbjegavati visokog rizika, tada će optimalno rješenje biti ono za koje se pokaže da je rizik, koji je maksimalan u različitim uvjetima, minimalan. Izvršna vlast, koristeći Savageov kriterij, jasno napušta pokušaje maksimiziranja povrata, odabirom strategije sa zadovoljavajućim prinosom uz niži rizik. Stoga je Savageov kriterij posebno koristan za ocjenu niza projekata tijekom duljeg razdoblja.

Hurwitzov kriterij (pesimizam-optimizam- ovo je kompromisni način donošenja odluka u uvjetima neizvjesnosti. Za svaku od mogućnosti - ostvarivanje maksimalnog i minimalnog prihoda - utvrđuje se vjerojatnost njegovog nastanka. Zbroj vjerojatnosti dviju opcija mora biti jednak jedinici. Tada se vrijednost ciljne funkcije izračunava kao zbroj proizvoda svakog rezultata i vjerojatnost njegovog postizanja. Vrijednosti maksimalnog i minimalnog dohotka preuzete su iz tablice. 8.1. Izračuni su prikazani u tablici. 8.3.

Tablica 8.3. Izračunavanje vrijednosti objektivne funkcije

Pretpostavimo da se stručnom prosudbom utvrdi da je vjerojatnost ostvarivanja maksimalnog dohotka 0,7, a minimalnog 0,3. Zatim za odluku o kupnji 2 jedinice. proizvodnje, vrijednost ciljne funkcije bit će

0,7 x 40 + 0,3 x 10 \u003d 31 (rub.)

Maksimalna vrijednost funkcije cilja je 53 rubalja. postiže se pri odabiru rješenja za kupnju 4 jedinice. proizvoda. Ovo rješenje će biti optimalno prema Hurwitzevom kriteriju. Relativnost takvog izbora određuje se stupnjem objektivnosti u procjeni vjerojatnosti različitih ishoda.

Stablo odlučivanja.U praksi upravljanja često se javljaju situacije kada usvajanje jedne odluke upravitelja ili vlasnika tvrtke stavi pred sljedeći izbor. Kada trebate donijeti nekoliko odluka u neizvjesnosti, a svaka sljedeća odluka ovisi o prethodnoj, za rješavanje takvog problema koristi se shema koja se naziva stablo odluka.

Stablo odlučivanja je grafički prikaz procesa donošenja odluka, koji odražava alternativne odluke i stanja u okolišu, koja odgovaraju vjerojatnostima, i "dobitke" za bilo koju kombinaciju odluka i stanja u okolišu.

Konstrukcija i analiza "stabla odluka" prihvatljiva je u svakom slučaju ako se sekvencijalni niz potencijalnih odluka donosi u kontekstu rizika. Uvjetna odluka je odluka koja ovisi o okolnostima ili mogućnostima koje se pojave kasnije. Izgradnja "stabla odluke" započinje prvom, ili izvornom, odlukom i kreće naprijed kroz vrijeme kroz niz uzastopnih događaja i odluka. Uz svaku odluku ili događaj, ovo „stablo“ ima grane koje pokazuju svaki mogući smjer djelovanja sve dok se konačno ne izvuku svi logički nizovi i proizašle koristi.

Jedan od najvažnijih uvjeta za donošenje učinkovite odluke usmjerene na postizanje cilja u vremenskoj perspektivi je dostupnost odgovarajuće količine relevantnih informacija. Nepotpune informacije, nemogućnost pouzdanog predviđanja budućih događaja i čimbenici koji mogu utjecati na rezultat na koji se donosi odluka znakovi su neizvjesnosti. Dovoljno većina upravljačke odluke donose se u uvjetima neizvjesnosti. Potencijal nesigurnosti vanjsko je okruženje organizacije.

Donošenje odluka u neizvjesnosti povezano je s pojmom rizika i provodi se metodama operativnog istraživanja i teorijom statističkih odluka. NA opći pogled problem donošenja odluke u uvjetima nesigurnosti predstavljen je u obliku tablice učinkovitosti (tablica 1).

Stol 1.

Oko 1 Oko 2 ... O n
str 1 a 11 a 12 ... a 1 n
str. 2 a 21 a 22 ... a 2 n
... ... ... ... ...
p m a m1 a m2 ... a mn

gdje O n - uvjeti situacije, koji se ne znaju točno, ali o kojima se mogu dati n-prijedlozi (potražnja, broj dobavljača, zadovoljstvo materijalima);

P m - moguće strategije, linije ponašanja u odlučivanju.

Svaki par strategije i okruženja ima odgovarajuću isplatu -A mn.

Dobici prikazani u tablici izračunati su pokazatelji učinkovitosti strategije (rješenja) u različitim postavkama.

Predstavljeni zadatak usmjeren je na donošenje odluka pri izradi planova za razvoj poduzeća, razvoju proizvodnih programa, planova za puštanje novih vrsta proizvoda, fokusiranje na inovacije, odabir strategija osiguranja, investicija, fondova itd.

U teoriji statističkih odluka koristi se poseban pokazatelj rizika koji pokazuje isplativost usvojene strategije u datoj situaciji, uzimajući u obzir njezinu neizvjesnost. Rizik se izračunava kao razlika između očekivanog ishoda akcije s obzirom na dostupnost točnih situacijskih podataka i ishoda koji se može postići ako su ti podaci nesigurni. Na temelju ove razlike izračunava se tablica rizika od puštanja nove vrste proizvoda. Tablica rizika omogućuje procjenu kvalitete različitih rješenja i utvrđivanje cjelovitosti provedbe prilika u prisutnosti rizika. Izbor najboljeg rješenja ovisi o stupnju nesigurnosti.

Ovisno o stupnju neizvjesnosti situacije, postoje 3 mogućnosti za donošenje odluka:

1. Odabir optimalnog rješenja kada je vjerojatnost moguće opcije postavka je poznata. Optimalno rješenje određuje se maksimalnim zbrojevima umnožaka vjerojatnosti različitih scenarija P (O 1) odgovarajućim vrijednostima dobitaka A (tablica učinkovitosti 6) za svako rješenje.

2. Odabir optimalnog rješenja kada su vjerojatnosti mogućih scenarija nepoznate.

3. Odabir optimalnog rješenja prema načelima pristupa procjeni rezultata djelovanja.

U uvjetima nepoznate vjerojatnosti situacije mogu se donijeti sljedeće odluke:

a) max-min ili "računaj na najgore" - izbor rješenja koje jamči pobjedu u bilo kojim uvjetima, ne manje od najveće moguće u najgorim uvjetima;

b) min max rizik u bilo kojim uvjetima. Za optimalnu odluku donosi se rizik za koji se čini maksimalan rizik u različitim scenarijima minimalan.

Za optimalno rješenje, ovisno o liniji orijentacije donositelja odluke, donosi se odluka za koju će pokazatelj G (kriterij pesimizma - Hurwitzov optimizam) biti maksimalan:

gdje je minimalna isplata koja odgovara rješenju m;

Maksimalna isplata koja odgovara rješenju m;

k - koeficijent koji karakterizira liniju ponašanja (orijentacije) donositelja odluke ,.

Grafički značenje k u odnosu na liniju ponašanja može se protumačiti na sljedeći način:

vrijednost k


0 0,25 0,5 0,75 1

Orijentacijska crta u izračunu

za najbolje za najgore

Zadatak:

Postoje 3 mogućnosti ulaganja:

1) Uložiti sva raspoloživa sredstva u dionice tvrtke "Oil-AG", što jamči visok prihod u odgovarajućem okruženju;

2) Uložite sva sredstva u GKO s jamstvom niskog i stabilnog dohotka;

3) Uložite dio sredstava u dionice "Oil-AG", dio u GKO - tj. diverzificirati portfelj fondova.

Perspektivu označavaju tri scenarija (ishod događaja).

Donesite odluku o problemu ulaganja, imajući za početne podatke tablicu isplata (tablica 2).

Tablica 2.

Pi / Oi O 1 O 2 O 3
P 1 0.99 0.1
P 2 0.5 0.5 0.3
P 3 0.25 0.7 0.4

P i - opcija rješenja;

O i - varijanta situacije;

O 1 - tvrtka "Oil-AG" - bankrotirala je, GKO - donosi stabilne prihode.

O 2 - tvrtka "Oil-AG" - cvjeta;

O 3 - kriza u gospodarstvu.

Odredimo optimalno rješenje u kojem dobitak u bilo kojim uvjetima neće biti manji od maksimalno mogućeg u najgorim uvjetima (max-min).

Sa stola. 2 za otopinu P 1 najmanji dobitak je 0, za P 2 - 0,3, za P 3 - 0,25.

Najveći mogući dobitak u najgorem mogućem spletu okolnosti bit će 0,3, što odgovara donošenju odluke P 2, t.j. u svakom slučaju, rješenje P 2 neće biti najgore.

Optimalno rješenje, pod uvjetom da se pokaže da je rizik najmanji od njegovih maksimalnih vrijednosti za različita rješenja, određeno je iz tablice 7. Matrica tržišta je unaprijed izračunata. Istodobno, maksimalni rizik pri donošenju odluke je P 1 - 0,5; kod P2 - 0,49; na P 3 - 0,29. Od niza maksimalnih rizika, optimalno rješenje je P 3, koji ima minimalnu razinu rizika od 0,29.

Izračunajmo kriterij pesimizma - Hurwitzov optimizam za različita rješenja, ovisno o vrijednosti usvojenog koeficijenta k.

Za rješavanje P 1

Odluka:

Izračunajmo matricu investicijskih rizika (tablica 3).

Tablica3.

Pi / Oi O 1 O 2 O 3
P 1 0.5-0=0.5 0.99-0.99=0 0.4-0.1=0.3
P 2 0.5-0.5=0 0.99-0.5=0.49 0.4-0.3=0.1
P 3 0.5-0.25=0.25 0.99-0.7=0.29 0.4-0.4=0

Pod uvjetom da su situacije jednako vjerojatne, njihove su vjerojatnosti jednake i iznose:

P (O 1) \u003d P (O 2) \u003d P (O 3) \u003d 0,33

Matematički se očekivanja dobitka, pod uvjetom da su situacije jednako vjerojatne, određuju iz izraza:

W i \u003d P (O i) * A ij,

gdje je P (O i) vjerojatnost buduće situacije;

A ij - dobitak koji odgovara i-tom rješenju u j-toj situaciji.

W 1 \u003d 0,33 * 0 + 0,33 * 0,99 + 0,33 * 0,1 \u003d 0,3597

Š 2 \u003d 0,33 * 0,5 + 0,33 * 0,5 + 0,33 * 0,3 \u003d 0,329

Š 3 \u003d 0,33 * 0,25 + 0,33 * 0,7 + 0,33 * 0,4 \u003d 0,445

U uvjetima jednako vjerojatnosti budućih situacija, najoptimalnije rješenje je P 3.

Za ostale vrijednosti vjerojatnosti situacija rješenje može biti drugačije.

Odabir rješenja prema Hurwitzevom kriteriju:

za rješavanje P 1: G 1 \u003d 0,495;

za rješavanje P 2: G 2 \u003d 0,5 * 0,3 + (1-0,5) * 0,5 \u003d 0,4;

za rješavanje P 3: G 3 \u003d 0,5 * 0,25 + (1-0,5) * 0,7 \u003d 0,475.

Za k \u003d 0,5, optimalno rješenje je P 1.

Vrijednosti G i izračunavaju se na sličan način za ostale vrijednosti koeficijenta.

Dobivene vrijednosti G i sažete su u tablici 4.

Tablica4.

G i za zadani k i
P i / k i 0.00 0.25 0.5 0.75 1.00
P i 0.99 0.743 0.495 0.362
P 2 0.5 0.45 0.4 0.35 0.3
P 3 0.7 0.587 0.475 0.362 0.25
Odabrano rješenje P 1 P 1 P 1 P 1 P 3 P 2

Osoba koja donosi odluku u skladu s odabranim k i donosi optimalnu odluku maksimalna vrijednost G i. S k i \u003d 0,75 - G max \u003d 0,362. Odluka P 1 ili P 3 uzima se kao optimalna.

Slične publikacije