KSB (Koncepcia spoločnej bezpečnosti), svazek II, kapitola 3: SOCIÁLNE PROСESY VO VÝCHODNOM BLOKU. Organizácia celospoločensky prospešného riadenia ekonomiky (19)

KSB (Koncepcia spoločnej bezpečnosti), svazek II, kapitola 3: SOCIÁLNE PROСESY VO VÝCHODNOM BLOKU. Organizácia celospoločensky prospešného riadenia ekonomiky (19)

8.1.2019

předchozí část

 

MDP (Metóda dynamického programovania)

ako algoritmické vyjadrenie DVTR

VM2.kap3.procesIV.-V.časť 19.1.doc (167936)

 

Pri vysvetľovaní metódy dynamického programovania vychádzame z knihy „Kurz teórie automatického riadenia“ (Autor Paul de la Barriere : Francúzske vydanie v r. 1966, r.v. „Strojníctvo“, rok 1973), aj keď tu jeho podanie neopakujeme. Niektoré postoje sú prevzaté z kurzu «Výskum operácií» J. P. Zaichenko («Vyššia škola» r. 1979). Metóda dynamického programovania je použiteľná vtedy, ak formálna interpretácia zadanej úlohy spĺňa nasledujúce podmienky:

 

  1. Skúmanú úlohu možno interpretovať ako n-krokový proces opísateľný vzťahom : Xn + 1 = f(Xn, Un, n), kde je n číslom predstavujúcim jeden z množiny možných stavov, do ktorého sa systém dostáva po zavŕšení n-tého kroku; Xn- je vektor stavu systému, ktorý patrí uvedenej množine «n»; Un – riadenie uskutočnené v n-tom kroku (krokové riadenie), ktoré transformuje systém z jedného z možných stavov množiny «n» do jedného z možných stavov množiny «n+1». Pre názornú interpretáciu si treba pozrieť obrázok č. 4 o ktorom bude ešte neskôr reč.

  2. Štruktúra úlohy sa nemôže meniť zmenou množstva výpočtových krokov N.

  3. Rozmer priestoru parametrov, ktorými sa popisuje stav systému, sa nemá meniť zmenou počtu krokov N.

  4. Voľba riadenia1 na ľubovoľnom kroku nemôže negovať voľbu riadenia v krokoch predchádzajúcich. Inými slovami: optimálna voľba riadenia v ľubovoľnom z možných stavov musí byť určovaná parametrami skúmaného stavu a nie parametrami procesu, pôsobením ktorého sa systém do skúmaného stavu dostal.  

Formálne vzaté: ak jednému stavu zodpovedajú viaceré predchádzajúce procesy jeho vzniku, ktoré by ovplyvnili výber optimálneho spôsobu riadenia, tak táto metóda dovoľuje prevziať popis takýchto predchádzajúcich procesov do vektoru stavu, čo vedie k zväčšeniu rozmeru vektora stavu(stavového vektora) systému. Po takejto operácii sa to, čo bolo predtým opisované ako jeden stav, stáva množinou stavov, ktoré sa vzájomne odlišujú komponentmi vektora stavu, opisujúcimi minulosť procesu.

  1. Kritérium optimálnej voľby(výberu) postupnosti jednotlivých krokov riadenia Un s jemu zodpovedajúcou trajektóriou v priestore formálnych parametrov má tvar :

V = V0(X0, U0) + V1(X1, U1) + …+ VN - 1(XN- 1, UN - 1) + VN(XN) . 

Kritérium V je zaužívané nazývať plná výhra a jeho(jej) jednotlivé položky krokové výhry. Úloha spočíva v nájdení postupnosti krokových riadení(zásahov) Un a trajektóriu, ktorej zodpovedá maximálna z možných tzv. plných výhier2. Vo svojej podstate predstavuje plná «výhra» V - mieru kvality celkového riadenia procesu. Aj keď jednotlivé krokové výhry v konečnom dôsledku tvoria mieru kvality celkového riadenia, tak vo všeObeCnosti nepredstavujú mieru kvality riadenia na jednotlivých im zodpovedajúcich krokoch, pretože táto metóda je určená na optimalizáciu celkového riadiaceho procesu. Efektívne krokové riadenia s veľkou krokovou výhrou, ktoré sú však mimo optimálnej trajektórie, nie sú totiž z pohľadu celkového riadenia zaujímavé. Štruktúra metódy nezakazuje v prípade nutnosti použiť na každom z krokov iné kritérium určenia krokovej výhry Vn, odlišné ako na ostatných krokoch.

 

Index n je ukazovateľom3 množstva možných vektorov stavu4. V reálnych úlohách môže byť s vektorom n spojená nejaká premenná. T.j., napr. meniaci sa parameter ako čas, prejdená dráha, kapacita, výkon, miera spotrebovania zdroja a podobne. To znamená, že metódu možno použiť nie len na optimalizáciu riadenia procesov prebiehajúcich v čase, ale aj na úlohy optimalizácie riešenia mnohovariantných okamžitých, alebo na čase nezávislých úloh, ak takéto «bezčasové», «neprocesné» úlohy umožňujú ich viackrokovú interpretáciu.

 

Teraz sa zameriame na obr. č.8 – č.10, ktoré opakujú súvisiace obrázky č. 40, 41, 42 z kurzu teórie automatického riadenia od autora Paula de la Barriére.

 

Na obr. č.8 je znázornený počiatočný stav systému «0» a množina jeho nasledujúcich možných stavov «1», «2», «3». Taktiež sú tam zobrazené aj možné prechody z každého z možných stavov do ďalšieho z možných stavov. Všetko spolu sa to podobá na detskú hru, pri ktorej sa po hracej ploche premiestňujú figúrky. Každému vykonanému kroku prislúcha jeho kroková výhra. V tretej množine, ktorá proces završuje, je každému zo stavov systému priradené jeho ohodnotenie, umiestnené v príslušnom obdĺžniku na pravo. Principiálny rozdiel je tu v tom, že voľba trajektórie v detskej hre je určovaná hodom kocky, čo v reálnom riadení pripustiť nemožno. Znamenalo by to totiž, že cieľavedomé riadenie predávame do rúk tým silám, ktoré sú schopné riadiť5 hádzanie kockou apod. Teda tým, pre koho je (s ohľadom na ich ciele) takýto vybraný «generátor náhod» dostatočne dobre ovládateľným zariadením.

 

OBR. 8. K podstate MDP(metódy dynamického programovania).

Matrica možností.

 

Ak chceme vyberať optimálne riadenie na prvom kroku, tak je nevyhnutné predvídať všetky jeho dôsledky na nasledujúcich krokov. Preto sa popis algoritmu MDP (Metódy dynamického programovania) zvykne často začínať z popisu výberu riadenia6 na poslednom kroku, vedúcemu k jednému zo želaných stavov, ktorým sa daný riadený proces má zavŕšiť. Vychádza sa pri tom z «pedagogickej praxe», ktorá dokazuje, že vysvetľovanie pri popise algoritmu od záverečného stavu k počiatočnému je proste ľahšie pochopiteľné.

MDP sa tak opiera o nasledujúce faktory:

  1. na začiatku skúmaného kroku akoby už zrealizované podmienky7

  2. zároveň sú už definované aj želané(možné) záverečné stavy zavŕšenia príslušného riadeného procesu.

 

obr 9. K podstate MDP (Metódy dynamického programovania).

analýza prechodov.

 

V súlade s tým sú na obr. 9 ďalej analyzované možné prechody do záverečnej8 množiny9 stavov «3», ktorým predchádzajú všetky z možných stavov množiny „2“. T.j., akoby celá trajektória už bola prejdená a zostávalo už iba optimálnou voľbou konkrétneho riadiaceho zákroku zavŕšiť celý proces. Pri tom sa pre každý zo stavov v množine „2“ určujú všetky plné výhry ako súčet „hodnoty prechodu“ a „hodnoty završujúceho stavu“.

 

V súlade s tým sa ďalej na obrázku 9 analyzujú možné prechody do záverečnej množiny stavov „3“, z každého možného stavu z jemu predchádzajúcej množiny stavov „2“. T.j., akoby bola celá predchádzajúca trajektória už prejdená a zostáva nám iba poslednou voľbou optimálneho kroku riadenia zavŕšiť celý proces.

Pri tom pre každý zo stavov množiny „2“ určujeme

Všetky plné výhry ako

súčet =„odhad10 prechodu“ + “odhad záverečného stavu11

V množine „2“ získame pre každý stav niekoľko možných plných výhier. Z nich si vyberáme a zapamätávame maximálnu plnú výhru a jej zodpovedajúci prechod (úsek12 celkovej trajektórie).

Maximálnu plnú výhru pre každý zo stavov v množine „2“ umiestnime do pravouhlého rámčeka a jej zodpovedajúci prechod označíme šípkou.

Optimálnych prechodov z jedného stavu do stavov druhých, ktorým zodpovedá jedna a tá istá hodnota plnej výhry, môže byť v zásade aj niekoľko.

Takéto prechody sú potom z hľadiska daného kritéria optimálnosti výberu trajektórie v uvedenom priestore parametrov(ktorými je popisovaný dotyčný systém) nerozlíšiteľné a sú vzájomne ekvivalentné.

 

Následne môžeme na množinu „2“ (ktorá stojí pred proces završujúcu množinou „3“) pozerať ako na záverečnú. Známe sú totiž odhady(vyhodnotenia) každého z jej možných stavov (maximálne plné výhry). Tak môžeme následnú optimalizáciu postupnosti krokových riadení a výber optimálnej trajektórie vykonať iba na zatiaľ nepreskúmaných množinách, predchádzajúcich množine “2“ v celkovom optimalizačnom procese (t.j. na množinách “0“ a „1“).

 

Takým spôsobom je procedúra zobrazená na obr.9 funkčná(práceschopná) na každom algoritmickom kroku danej metódy pri prechodoch z množiny n na množinu (n-1). Počínajúc záverečnou množinou N až po počiatočný stav systému.

 

Dôsledkom takéhoto postupného prechádzania cez jednotlivé množiny po pároch, zisťujeme pri prechádzaní celou ich sériou

  1. optimálnu postupnosť jednotlivých po sebe nasledujúcich krokových riadení13,

  2. maximálnu možnú plnú výhru a

  3. im zodpovedajúcu trajektóriu.

 

Na obr.10 je optimálna trajektória pre skúmaný príklad zobrazená hrubou čiarou.

 

Obr. 10. k podstate metódy dynamického programovania(Mdp).

optimálna trajektória.

 

V skúmanom príklade je kritériom optimálnosti súčet krokových výhier.

Avšak ako kritérium optimálnosti možno zvoliť aj súčin jednoznačne nezáporných koeficientov.

 

Pretože sa výsledok (súčet alebo súčin) zmenou poradia sčítancov alebo súčiniteľov nemení14, je algoritmus funkčný aj pri poradí spracovania množín možných stavov opačnom ako je vyššie uvedené skúmané poradie. T.j., od východzej množiny možných stavov smerom k tej záverečnej.

 

Ak sú množiny možných stavov usporiadané v chronologickej postupnosti, znamená to, že schéma výpočtu môže smerovať tak

  1. z reálnej prítomnosti do prognózovanej želanej15 budúcnosti, ako aj

  2. z prognózovanej, želanej(vybranej) budúcnosti do reálnej prítomnosti.

Táto skutočnosť vypovedá o dvoch neformálnych súvislostiach(vzťahoch) reálneho života, ktoré sa nachádzajú mimo tohto algoritmu :

  1. Metóda dynamického programovania formálne algoritmicky neberie do úvahy druh16 príčinno-dôsledkových súvislostí (v podstate nerozlišuje príčinu a dôsledok). Preto musí byť každá konkrétna interpretácia metódy MDP (v úlohách kde bola aplikovaná) podložená neformálnym zohľadnením reálnych súvislostí dôsledkov s ich príčinami.

  2. Ak je prognostika v súlade s hierarchicky vyšším obsiahlejším17 riadením a my(ako ľudia) realizujeme parciálne18 riadenie kvalifikovane v rámci obsiahlejšieho riadenia19 (vďaka čomu proces parciálneho riadenia prebieha v súlade s Hierarchicky vyšším obsiahlejším riadením), POTOM NIET Z POHĽADU RIADENIA VÝZNAMNÉHO ROZDIELU MEDZI REÁLNOU SÚČASNOSŤOU A ZVOLENOU20 BUDÚCNOSŤOU.

 

Celý tento proces je celostný21.

Z toho dôvodu budúCnosť, ktorá sa síce ešte neuskutočnila, ale sme si ju už vybrali (a daný jej variant nie je Zhora zakázaný22), už v súčasnosti ochraňuje na všetkých úrovniach tých, ktorí ju uskutočňujú.

Počínajúc od

A) ochrany ich psychiky pred pokušeniami, až po

Z) ochranu pred cieľavedomou „fyzickou“ agresiou.

T.j., ak je matrica možných stavov (ona je zároveň matricou možných prechodov) zvolená v súlade s Hierarchicky najvyšším najobsiahlejším riadením (HNNR=Bohom), tak sa ona sama stáva ochranou i nástrojom23 = prostriedkom riadenia, s ktorým je spätých všetkých 6 priorít univerzálneho riadenia24.

 

Objektívna existencia matríc možných stavov a prechodov sa prejavuje v tom, že i nechtiac sa dá «zabrdnúť» do nejakých matríc prechodov a môžeme tak priamo na sebe pocítiť niektoré ich objektívne vlastnosti.

Také prípady subjektívne pociťujeme podľa nášho osobného vzťahu k týmto vlastnostiam, ako

  1. Obdobie zriedkavého zvezenia sa na okolnostiach25, či

  2. nudného „vrátenia sa do starého známeho“, alebo

  3. ako obdobie výnimočnej smoly26.

 

Avšak pre používanie Metódy dynamického programovania a pre ju sprevádzajúcu potrebu osvojenia si algoritmicky neformalizovaných životných prejavov matríc prechodu, je potrebné dbať na DODRŽIAVANIE HLAVNEJ podmienky:

Pri úlohách optimalizácie procesov riadenia je Metóda dynamického programovania funkčná len vtedy, ak je stanovený vektor cieľov riadenia.

To znamená, že musíme vybrať cieľový stav27, ktorým sa proces riadenia má končiť.

 

V skutočnosti predstavuje tento vopred stanovený cieľový STAV vlastne obsiahlejší, vyložene stabilný28 a prijateľný PROCES29, objemnejší a nosný vo vzťahu k parciálnemu procesu, optimalizovanému metódou MDP..

 

pokračování

 

poznámky

1 Výber riadiaceho zásahu (pozn. prekl.)

2 Viď zodpovedajúce predchádzajúce kapitoly hlavne I. zväzku VM a špeciálne DVTR a jej prílohy.

3 Definuje (pozn. prekl.)

4 Stavových vektorov (pozn. prekl.)

5 Štatisticky pravdepodobnostne predurčene a/alebo inými metódami, keďže o. i. žiadna kocka nemôže byť pri dostatočnom počte hodov absolútne rovnaká + množstvo „trikov“ riadenia hry (viď predchádzajúce kapitoly na tému – hlavne DVTR + príslušné prílohy). (pozn. prekl.)

6 Konkrétneho riadiaceho zásahu, riešenia (pozn. prekl.)

7 Fiktívnu už uskutočnenú situáciu (resp. simuláciu, analyticko-predikčný mnohovariantný model, na vypracovanie ktorého existujú dnes mnohé softvérové prostredia – kedysi napr. Matlab – Simulink apod., určené na modelovanie, simulovanie prakticky ľubovoľného socionaturálneho procesu) (pozn. prekl.)

8 Proces riadenia završujúcej (pozn. prekl.)

9 Úrovne, eng. tzv. „levelu“ v IT terminológii (pozn. prekl.)

10 Vyhodnotenie (pozn. prekl.)

11 Stavu zavŕšenia procesu (pozn. prekl.)

12 Fragment (pozn. prekl.)

13 Riadiacich zásahov, potrebných „akcii“ (pozn. prekl.)

14 Jedno zo základných matematických pravidiel zo Základnej školy. (pozn. prekl.)

15 Zadefinovanej, pred-určenej. (pozn. prekl.)

16 Povahu, charakter, typ. (pozn. prekl.)

17 Objemnejším (pozn. prekl.)

18 Čiastkové, riadiace „pod“kroky, v súlade s celkovým kontextom, cieľom a metódami riadenia. (pozn. prekl.)

19 V rámci dostatočne rozlíšených(identifikovaných) dlhodobých cieľov Božích a objektívnych socionaturálnych zákonov k nim vedúcich, Zhora daných. Bo to garantuje bezpečnosť nášho konania. Ak totiž nejaký problém nastáva, znamená to, že intuícia naša zlyháva, s emóciami chybnými sa pletie, je nesprávna .. a rozum(inTelekt) Zhora nám taktiež sťa poistka ako dar daný, na korekciu eMocii(algoritmika zvykov po predkoch, zo školy, z médii.. predspracovania informacii do komplexných infomodulov) použiť treba.. Že čas myslieť nastal, bo sTRoj psychiky svojej (RaDio prijímač, commuNíkátor) sme rozladiť dopustili. Na konanie toto nám však dar druhý použiť treba, na scénu prichádza vôľa. Tak sa možno vždy v rámci riadenia a cibulkovej-hierarchickej štruktúry spoločnosti, v prípade zámernej(?) chybovosti akéhokoľvek nadradeného riadenia, na najvyššiu inštanciu odvolať, „sázky zvýšiť“. Avšak gramotne, nie slepou vierou, bo Boh neurobí za nás to, čo sami zrobiť máme. Viď ďalšie zo súboru zlatých praVidiel riadenia: „Ak niečo nemôžeš poriešiť na jednej úrovni, vystúp na ďalšiu(v chápaní)“. To je princíp skutočnej konkurencie gramotnosti – dôvery Bohu, viery v zmysle chápania, poznania – VieRa, čo v časoch dávnych bolo opakom dnešného traktovania, vysvetľovania, keď vieru na slepú poslušnosť a odmietnutie daru rozumu temní zvrátili. Temní, ktorí sa o prsteň moci(poznania, chápania) deliť odmietli a tak prízraku egocentrizmu prepadli, strašnému väzeniu, pasci ega, kde ďalšie obete v hre pyramíd lákajú, kde Panuje bezbožná - nenaplniteĺná falše bieda. Večný smäd po Vode poznania, blízkosti, približovaní sa Bohu, Otcu. Bo pokušenie „hrať sa na Boha“ je pri nedelení sa veľké. Skúška pred bránou do kráľovstva ne-beského posledná. (pozn. prekl.)

20 Vybranou. Viď znova pre zopakovanie starých ľudových národných matríc aj názvy slovenských riek, hôr a miest: Zvolen, Váh, Hron(hrana), Ta3 (3At – po starom sa i doprava písalo), Matra, PoPraď, Sobor-Zobo-zbor, U-horsko, atď.. (pozn. prekl.)

21 Komplexný, jednotný (pozn. prekl.)

22 Pre Boha principiálne neprijateľná (pozn. prekl.)

23 Resp. zbraňou (pozn. prekl.)

24 6 kategórii komunikácie (= univerzálnych zbraňových systémov - v prípade vedenia informačnej vojny). (Pozn. prekl.)

25 Ľudovo povedané: že „nám ide karta“ (pozn. prekl.)

26 Nešťastia, negatívneho efektu „Domino“ (no môže existovať i „Domino“ pozitívne) (pozn. prekl.)

27 V ger. IT term. „Sollwert“ (pozn. prekl.)

28 Jasne, zámerne udržateľný v zmysle predikcie, proGnózy (pozn. prekl.)

29 STAV a PROCES sú v tomto kontexte identické pojmy, kedže vo vesmíre-našom UniVerse niet statiky a všetko sú vzájomne hierarchicky previazané procesy=deje=javy.

Tu si spomeňme na Základnú školu a 1.Newtonov zákon :

„Každý hmotný bod v inerciálnej sústave zotrváva v pokoji alebo v rovnomernom priamočiarom pohybe, kým nie je nútený vonkajšími silami tento svoj stav zmeniť“.. (pozn. prekl.)