Lietišķie algoritmi: Sākumlapa

DatZ4020 Syllabus: 2020.g. rudens (sk. arī 2019.g. rudens).
Prasmju analīze pa nedēļām: Jēdzieni, Vingrinājumi, Programmēšanas piemēri, Matemātiski rezultāti.

Week 1: 2020-09-07 to 2020-09-11

1 Lietot un analizēt bezzudumu saspiešanas algoritmus

1.1 Ieviest jēdzienus saistībā ar ziņojumu saspiešanu Description

Definējam saspiešanas terminus, kopu teorijas un varbūtiskas sakarības; ieviešam arī informācijas saturu un entropiju ziņojumu telpā. Modulis neietver konkrētus saspiešanas algoritmus.
(CMU:Blelloch2013, pp.1-9)Introduction to Data Compression

(Cambridge:MacKay2014A)Entropy and Data Compression (I): Introduction to Compression, Inf.Theory and Entropy. (Cambridge:MacKay2014B)Entropy and Data Compression (II): Shannon's Source Coding Theorem, The Bent Coin Lottery.
1.1.1. Izskaidrot kursa saturu un tajā izmantotās metodes

Izskaidrot sešas satura tēmas jeb priekšmetapgabalus
Identificēt algoritmu paradigmas jeb algoritmu veidošanas principus
Apspriest kursa mācību virsuzdevumus
Skaidrot rīku un metožu piemērotību virsuzdevumu sasniegšanai
Skaidrot kursa priekšnoteikumus un tvērumu

1.1.2. Definēt ziņojumus, kodējumus, bezzudumu un zudumradošo saspiešanu

Aprakstām saspiešanu klasisku kopu un funkciju līmenī bez varbūtiskiem modeļiem.

Pierādīt universāla saspiešanas algoritma neesamību ar Dirihlē principu
Definēt ziņojumus un ziņojumu alfabētu
Definēt kodējumu kā funkciju no ziņojumiem uz bitu virknītēm
Definēt bezzudumu un zudumradošo saspiešanu
Dotajam saspiešanas kontekstam noteikt ziņojumu alfabētu un kodējuma funkciju.
Dotajam alfabētam un ziņojumu virknes garumam noteikt iespējamo virkņu skaitu (t.sk. ar papildu ierobežojumiem).
Atrast varbūtību sadalījumu diskrētam gadījumlielumam (piemēram, ziņojumu kopai) ar nelielu skaitu vērtību, ja zināms ziņojumu ģenerēšanas process.

1.1.3. Definēt varbūtisku ziņojumu modeli, ziņojuma informācijas saturu tajā un vidējo kodējuma garumu.

Piedēvējam ziņojumiem varbūtības un ieviešam saistītos jēdzienus - informācijas saturu un vidējo kodējuma garumu.

Pamatot saspiešanas metodes saistību ar ziņojumu varbūtisko modeli
Aprakstīt n-bitu kodu telpu un tās dalīšanu gabalos
Definēt konkrēta ziņojuma informācijas saturu
Definēt kodējuma vidējo garumu
Atrast viena ziņojuma informācijas saturu.
Aprēķināt entropiju dotajām burtu varbūtībām.
Dotajam gadījumlieluma vērtību skaitam $ n $ atrast entropijas maksimums un minimumus

1.1.4. Definēt diskrēta gadījumlieluma entropiju

Ieviešam entropijas jēdzienu un ieskicējam tā saistību ar informācijas saspiežamību.

Definēt gadījumlieluma entropiju kā vidējo vērtību informācijas saturiem
Definēt nosacīto entropiju.
Definēt divu neatkarīgu gadījumu lielumu pāra entropiju.
Formulēt (bez pierādījuma) entropijas saistību ar datu saspiežamību

1.1.5. Formulēt entropijas īpašības un izpausmes praktiskās situācijās

Nostiprinām entropijas izprašanu, risinot piemērus un teksta uzdevumus,

Definēt koda vidējo garumu un saspiešanas attiecību (compression ratio)
Aprēķināt entropiju monētu svēršanas uzdevumos
Aprēķināt entropiju kartiņu un urnu uzdevumos
Aprakstīt funkcijas definīcijas un vērtību apgabalus, raksturot entropiju algoritma ieejā un izejā.

1.2 Formulēt un pamatot apgalvojumus par prefiksu kodiem Description

Aplūkojam mainīga garuma prefiksu kodus, to teorētiskās īpašības un Hafmana kodu optimalitāti.
(CMU:Blelloch2013, pp.10-15)Introduction to Data Compression (Thanh2020)Demo Projects: Huffman coding

(Cambridge:McKay2014C)Entropy and Data Compression (III): Shannon's Source Coding Theorem, Symbol Codes. (Cambridge:McKay2014D)Entropy and Data Compression (IV): Shannon's Source Coding Theorem, Symbol Codes.
1.2.1. Definēt prefiksu kodus

Aprakstām prefiksu kodus vispārīgajā (ne obligāti Hafmana) veidā. Pieminam “non-prefix-free codes”, bet šādas neparastas lietas kursā neapspriežam.

Parādīt kā neprefiksu kodi rada divdomības
Aplūkot Morzes kodu kā nedivdomīgu kodu un vai tas ir prefiksu kods

1.2.2. Konstruēt prefiksu kokus, zinot burtu parādīšanās varbūtības.

Noskaidrot, kā Hafmana pseidokodā darbojas prioritātes rinda
Uzzīmēt Hafmana koku, ja dots ziņojumu varbūtību sadalījums.
Pārveidot Hafmana koku kanoniskā formā.

1.2.3. Pamatot atkodēšanas viennozīmīgumu, ja kodēšanai izmantots prefiksu koks (neviens kods nav otram prefikss).

Minēt prefiksu koka piemērus (teiksim, UTF-8 kodējums)
Minēt kodējumus, kas nav prefiksu kodi (teiksim, Morzes kods)

1.2.4. Aprakstīt vispārīgu prefiksu saspiešanas metodi.
1.2.5. Aprakstīt Hafmana kodu dabīgu valodu burtiem
1.2.6. Ieviest prefiksu koku vispārēju teoriju

Ieviest kodu telpas jēdzienu
Aprakstīt, kā prefiksu koda garums atšķiras no entropijas.
Izskaidrot entropiju kā saspiešanas teorētisko robežu

1.2.7. Šenona informācijas teorēma

Krafta-Makmilana teorēma
Jensena nevienādība (t.sk. Logaritmu un entropijas novērtējumos)
Teorēma par koda garumu, kas nepārsniedz $ H(S)+1 $
Definēt vidējā prefiksu koda garumu $ M = \sum_{x \in X} p_x\ell_x $.

1.2.8. Pamatot, kāpēc Hafmana algoritms ir optimāls - vidējais koda garums uz vienu simbolu vismazākais, ja salīdzina ar citām prefiksu metodēm.

Week 2: 2020-09-14 to 2020-09-18

1.3 Aprakstīt aritmētisko saspiešanu. Description

Aplūkojam aritmētiskās saspiešanas algoritmu un tā optimalitātes īpašības starp citiem “entropijas kodiem”.
(CMU:Blelloch2013, pp.16-21)Introduction to Data Compression (Said2004)Introduction to Arithmetic Coding - Theory and Practice. Amir Said, HP Labs, 2004.
1.3.1. Izklāstīt aritmētiskā koda pamatideju

Daļskaitļu pieraksts divnieku sistēmā (aritmētiskajam kodam)
Kodēt skaitļu intervālus ar galīgām bitu virknēm
Pamatot optimālā koda garuma nesasniedzamību, kodējot ziņojumus pa vienam
Izmantot kodu telpu optimāli vairāku ziņojumu virknei
Aplūkot metamo kauliņu piemēru aritmētiskai kodēšanai

1.3.2. Piekārtot vārdiem alfabētā intervālus no $ [0;1] $
1.3.3. Pamatot viennozīmīgas atkodēšanas iespēju.
1.3.4. Atrast intervālu garumus un to kodēšanai nepieciešamo bitu skaitu.

Iekodēt ziņojumu virkni ar aritmētisko kodu, ja dotas ziņojumu varbūtības.
Atkodēt aritmētisko kodu, ja dotas ziņojumu varbūtības.

1.3.5. Lietot un analizēt veselo skaitļu aritmētisko kodējumu

Week 3: 2020-09-21 to 2020-09-25

1.4 Lietot LZ77, LZ78 un LZW saspiešanas algoritmus Description

Apakšnodaļā aplūkoti tie saspiešanas algoritmi, kuri līdzās saspiešanai veido datu struktūras ar bieži atkārtojošamies fragmentiem. Tie labi saspiež cilvēku valodas tekstus; ir efektīvi un plaši izmantoti.
(CMU:Blelloch2013, pp.32-36)Introduction to Data Compression
1.4.1. Definēt Markova ķēdes

Aprakstīt ķēdi kā varbūtisku automātu vai Markova modeli ar kārtu $ k $.
Definēt nosacīto varbūtību un nosacīto entropiju
Definēt valodas informācijas avota entropiju (source entropy) kā n-grammu entropiju robežu

1.4.2. Definēt LZ77 saspiešanu un atspiešanu

Aprakstīt LZ77 datu struktūras
Iekodēt un atkodēt ziņojumu virkni ar LZ77 algoritmu, izmantot tā datu struktūru (apzīmēt apakšvirknītes jau iekodētajā apgabalā).

1.4.3. Definēt LZ78 un/vai LZW saspiešanu un atspiešanu

Aprakstīt LZ78 un LZW algoritmu atšķirības, to datu struktūras un soļus
Iekodēt un atkodēt ziņojumu virkni ar LZ78 algoritmu, izmantot tā datu struktūru (tabulu ar pievienojamo virknīšu vārdnīcu).

1.4.4. Aprakstīt Markova ķēdes modeli un tās ziņojumu saspiežamību
1.4.5. Aplūkot "patentētus" algoritmus un failu formātus, vārda brīvību algoritmu pasaulē.
1.4.6. Raksturot LZ saimes rīkus - `gz`, `WinZIP`, GIF, biroja failu formātus.

Arhivēšanas rīku gz/WinZIP, gzip2 u.c. pārskats.
PNG saspiešanas līmeņi

Week 4: 2020-09-28 to 2020-10-02

1.5 Lietot un analizēt Berouza-Vīlera algoritmu. Description

Apakšnodaļā aprakstīts Berouza-Vīlera algoritms un tā variācijas
(CMU:Blelloch2013, pp.37-39)Introduction to Data Compression
1.5.1. Lietot “Move-to-front” iekodēšanu un atkodēšanu
1.5.2. Aprakstīt Berouza-Vīlera transformāciju un tai inverso.
1.5.3. Veidot Berouza-Vīlera transformācijas.

Atšķirt leksikogrāfisko, inversi leksikogrāfisko u.c. virkņu sakārtojumus
Veikt 1 soli Berouza-Vīlera algoritma iekodēšanā vai atkodēšanā (virknēm garumā līdz 20 simboliem).
Veikt pilnu Berouza-Vīlera iekodēšanu vai atkodēšanu (virknēm garumā līdz 8 simboliem).
Analizēt Markova procesus u.c. stohastiskas ķēdes LZ77, LZ78 un Berouza-Vīlera algoritmos.

1.5.4. Minēt BW variantu, kur transformācijas rezultāts ir vienādi garš ar sākuma virkni; nav jāiegaumē sākumpozīcija.
1.5.5. Raksturot BW saimes rīkus, piemēram, `bzip2` u.c.
1.6 Salīdzināt saspiešanas metodes darbībā Description

Agrākajās apakšnodaļās izklāstīto algoritmu kopsavilkums un apsvērumi, kura saspiešanas metode piemērota katrai situācijai
(Haecky2016, CH11)Understanding Compression (Perry2014)A Fictional Compression Metric Moves into the Real World
1.6.1. Analizēt empīriskus novērojumus par bezzudumu saspiešanu

Definēt dabisko valodu entropijas raksturlielumus
Izmantot Kalgari u.c. korpusus saspiešanas metožu salīdzināšanai
Salīdzināt saspiešanas attiecības pēc algoritma un informācijas veida
Definēt “Veismana novērtējumu” saspiešanas algoritmam

1.6.2. Salīdzināt datu saspiešanas scenārijus

Aprakstīt saspiešanu, ja datus arhivē bezsaistē, atarhivē uz klienta (video-satura u.c. piegādes scenārijs – failu izmērs vs. kvalitāte)
Aprakstīt saspiešanu, ja datus arhivē uz klienta, atarhivē mākonī (soctīklu scenārijs – datu apjoma tarifi vs. mobilās ierīces CPU un akumulators)

1.6.3. Raksturot kombinētus bezzudumu saspiešanas rīkus un formātus

Raksturot ZPAQ saspiešanas pakotni
Raksturot bezzudumu attēlu saspiešanu (GIF, PNG, WebP)
Raksturot *File binder* programmas - pašatarhivējošus izpildāmos failus.

1.6.4. Atpazīt saspiešanas algoritmu lietojumus datoru drošībā

Definēt scenārijus, kur “man-in-the-middle” nodarbojas ar atarhivēšanu.
Definēt DLP (datu noplūdes novēršanas) scenāriju, kurā jākontrolē izejošais saturs saspiestos datu pārraides kanālos.
Paredzēt gaidāmo rezultātu, ja arhīva fails datortīklā nosūtīts ne līdz galam vai arī tajā ir daži sabojāti baiti.
Raksturot *polymprhpic engine/polymorphic packer* - kā arhivēties katru reizi citādāk, lai vīrusi kļūtu polimorfi un varētu noslēpties no signatūru skenēšanas ((Mutation Engine, TridenT Polymorphic Engine (MtE), NuKE Encryption Device (NED), Dark Angel's Multiple Encryptor (DAME).)
Atšķirt Antivīrusu rīku metodes, kas ir efektīvas parastiem un polimorfiem vīrusiem.

1.6.5. Lietot programmatūras profilēšanas rīkus, mērīt bibliotēku izsaukumu ilgumu.

Week 5: 2020-10-05 to 2020-10-09

2 Lietot un analizēt zudumradošās saspiešanas algoritmus.

2.1 Ieviest kvantizācijas un mediju datu apstrādes pamatjēdzienus Description

Apakšnodaļa definē dažus zudumradošās saspiešanas jēdzienus un dažas izplatītas noapaļošanas vai kvantizācijas pieejas. Apakšnodaļa definē JPEG algoritma soļus (citiem zudumradošiem attēlu formātiem soļi ir ļoti līdzīgi.
(MIT:Penfield2008, U3)Information and Entropy: Compression (MIT:Polyanskiy2016, CH23)Information Theory: Rate-Distortion Theory (Mozilla2020)Image File Type and Format Guide (Weitz2016)Discrete Cosine Transform

(Weitz2017)Diskrete Kosinustransformation (JPEG-Komprimierung). Die Hochschule für Angewandte Wissenschaften Hamburg.
2.1.1. Vektoru un matricu operāciju atkārtojums; krāsu koordinātes kā vektori

Veikt pāreju no RGB uz YIQ un otrādi (vai citām krāsu plaknēm)

2.1.2. Skalāra vienmērīgā un nevienmērīgā kvantizācija
2.1.3. Loida algoritms un Centroid Vornoi Tesselation
2.1.4. Kvantizācija un noapaļošana ar Senlaga un Donta metodēm
2.1.5. Nepārtrauktas funkcijas Furjē pārveidojums
2.1.6. Formulēt Šenona-Naikvista teorēmu
2.1.7. Diskrētais kosinusu pārveidojums

Definēt ortogonālas funkciju saimes
Aprakstīt rastra attēlu glabāšanai un apstrādei nepieciešamos datus.
Uzrakstīt izteiksmes diskrēto kosinusu transformācijai 1D un 2D gadījumos
Uzrakstīt izteiksmes “wavelet’ pārveidojumam

2.1.8. Atrast krāsas pēc RGB koordinātēm. Definēt alfa caurspīdību kā rastra attēlu superpozīcijas/pārklāšanas koeficientu.
2.1.9. Aprakstīt zudumradošās saspiešanas uzdevumu.
2.1.10. Definēt JPEG un līdzīgiem algoritmiem iespējamos saspiešanas parametrus.
2.1.11. Aprakstīt JPEG saspiešanas algoritmu.

JPEG algoritmā izpildīt plakņu I,Q izretināšanu
JPEG algoritmā izpildīt DFT 8x8 blokiem
JPEG algoritmā kvantizēt DFT koeficientus
JPEG algoritmā savirknēt koeficientus un iegūt starpības
Run-length encoding - kodēšana un atkodēšana

2.1.12. Apskatīt dažus attēlu zudumradošo saspiedumu lietojumus

Krāsu kodēšana, acīm atšķiramas atšķirības, Raw un JPEG dati foto un video aparatūrā.
Pirkstu nospiedumu saspiešana ar “wavelet” pārveidojumu

Week 6: 2020-10-12 to 2020-10-16

2.2 Apskatīt skaņas un video saspiešanas algoritmus Description

Apakšnodaļā aplūko skaņas un video saspiešanas metodes un arī zudumradošos algoritmus darbībā.
(Raissi2002)The Theory behind MP3.
2.2.1. Definēt cilvēka dzirdes matemātisko modeli, kuru lieto MP3
2.2.2. Lietot un analizēt MP3 skaņas saspiešanas pamatsoļus

Aprēķināt MP4 formāta datu saspiežamību, ja zināms, cik tajā ir katra veida freimu, cik kadru sekundē un cik labi katru no tiem var saspiest.
Aprēķināt MP3 formāta datu saspiežamību, ja zināms paraugā esošo frekvenču diapazons un iesaistīto "filterbank" skaits, un bitraide (bit/s).

2.2.3. Lietot un analizēt video saspiešanas algoritmus
2.2.4. Identificēt praktiskai video failu sagatavošanai piemērotus konteineru formātus.
2.2.5. Pārspriedumi par DRM

Patenti saistīti ar saspiešanas algoritmiem
Redzamās un neredzamās ūdenszīmes mediju failos (*watermarking algorithms*); to robustums atkarībā no saspiešanas veida.
Identificēt lietojumus steganogrāfijai (informācijas paslēpšanai ar to nesaistītā failā; t.sk. JPEG).
Skaidrot steganogrāfijas un tās pazīšanas tehnoloģiju iespaidu uz datu noplūdes novēršanas rīkiem (Data Leak Prevention, DLP).

Week 7: 2020-10-19 to 2020-10-23

3 Lietot un analizēt kļūdu korekcijas algoritmus

3.1 Pazīt un risināt kļūdu identificēšanas uzdevumus Description

Apakšnodaļā apskatām kļūdu identificēšanas paņēmienus (bez apņemšanās kļūdu lokalizēt vai izlabot)
(Modiano2009, L15)Communication Systems Engineering: Cyclic Codes and Error Detection
3.1.1. Lietot un analizēt CRC32 algoritmu un apskatīt tā īpašības
3.1.2. Lietot un analizēt Lūna pārbaudes (Luhn check) algoritmu un līdzīgus kontrolsummu algoritmus
3.1.3. Aplūkot dažus droša hešinga algoritmus (MD5, SHA256 u.c.) un to lietojamību, lai pamatotu, ka datu vai programmatūras fails nav korumpēts.
3.2 Aprakstīt un analizēt Heminga un citus lineārus kļūdu labošanas kodus Description

Apakšnodaļa aplūko tos kodus, kam var izlabot tikai vienu kļūdu, toties tie balstās uz matricu algebru un to optimalitāte ir pierādāma.
(MIT:Polyanskiy2016, CH16)Information Theory: Linear Codes

(MacKay2014E)Noisy Channel Coding (I): Inference and Information Measures for Noisy Channels. (MacKay2014F)Noisy Channel Coding (II): The Capacity of a Noisy Channel. (MacKay2014G)Noisy Channel Coding (III): The Noisy-Channel Coding Theorem.
3.2.1. Definēt trijstūra nevienādību virkņu atšķirību metrikai un tās sekas kļūdu labošanā

Definēt bitu virkņu attālumu (kļūdu jeb atšķirību skaitīšana)
Pamatot, ka attālums starp $ 2 $ ziņojumiem ir vismaz $ 2c+1 $

3.2.2. Definēt n-dimensiju kubus ar kodavārdiem virsotnēs

Definēt, kas ir [n,k,d] kļūdu korekcijas kodi
Kombinatoriski pamatot $ [n,k,d] $ kodu (ne)esamību noteiktiem parametriem $ n,k,d $.

3.2.3. Definēt [7,4,1] Heminga kodu

Izveidot Heminga kodu (saskaitāmās izteiksmes pēc mod 2) vienas kļūdas labošanai un iekodēt.
Izlabot kļūdu saņemtā $ [7,4,1] $ Heminga koda ziņojumā un atkodēt
Aprakstīt $ [7,4,1] $ Heminga kodu ar matricas operāciju

3.2.4. Formulēt Heminga kodu optimalitātes teorēmu (ja koda garums ir $ 2^n-1 $).

Atkodēt 7-bitu un 15-bitu Heminga kodus
Sakārtot Heminga ziņojumu/kontroles bitus inversi leksikogrāfiski

3.2.5. Definēt vispārīgu lineāru kodu.

Lietot lineāra koda ģeneratormatricu
Lietot lineāra koda pareizības pārbaudes matricu.

Week 8: 2020-10-26 to 2020-10-30

3.3 Lietot Rīda-Solomona kodus un polinomu interpolāciju. Description

Aplūkot algoritmu saimi, kas rodas no polinomu aplūkošanas un var izlabot lielāku skaitu kļūdu nekā Heminga kodi.
(Kak2020, L6)Computer and Network Security: Polynomial Arithmetic (Kak2020, L7)Computer and Network Security: Finite Fields of the Form $GF(2^n)$ (Khan2017)Building polinomials over the field $GF(2^8)$
3.3.1. Definēt galīgus laukus un formulēt to īpašības

Lauku jēdziens un piemēri
Lauks $ GF(p) $, kur $ p $ ir pirmskaitlis
Veikt aritmētiskas darbības galīgos laukos $ GF(p^n) $
Veikt četras aritmētiskas darbības galīgos laukos $ GF(2^n) $.
Veikt darbības ar polinomiem pār galīgiem laukiem
Veikt aritmētiskas darbības galīgos laukos $ GF(p) $ (atlikumi pēc pirmskaitļa moduļa)

3.3.2. Definēt algebras pamatteorēmu

Formulēt algebras pamatteorēmas sekas par divu polinomu sakņu sakrišanu
Konstruēt polinomu ar dotajām saknēm
Rakstīt Lagranža interpolācijas polinomu formulas

3.3.3. Apskatīt Rīda-Solomona kodus kā algebriskas interpolācijas uzdevumus
3.3.4. Saistīt Solomona-Rīda polinoma pakāpi, vērtību un kļūdu skaitu
3.3.5. Apskatīt Rīda-Solomona kodus, veidojot polinomus virs Galuā laukiem
3.4 Aprakstīt un analizēt citus kļūdu labošanas algoritmu veidus Description

Apakšnodaļā aplūkoti daži moderni kļūdu labošanas algoritmi un esošo pieeju kombinācijas
(Noisternig2006)An Introduction to Tornado Codes: Introduction to Error-Correcting Codes by Michael Noisternig. University of Darmstadt.
3.4.1. Izmantot kļūdu atjaunošanas kodējumu divdaļīgā grafā.
3.4.2. Aprakstīt Tornado kodu vispārējo darbību
3.4.3. Pazīt kļūdu detekcijas un labošanas metodes darbībā

Nosaukt OSI un arī TCP/IP protokolu steku līmeņus, kur labo kļūdas
Aprakstīt Etherneta freimu kļūdu labošanas metodi
Aprakstīt kļūdu detekcijas un labošanas metodes kompaktdisku datos.

Week 9: 2020-11-09 to 2020-11-13

4 Lietot un analizēt lineārās programmēšanas algoritmus

4.1 Definēt LP pamatēdzienus un formalizēt teksta uzdevumus par LP. Description

Apakšnodaļā definēti lineārās optimizācijas uzdevumu pamatjēdzieni un vienkāršākie secinājumi par to risināmību kā arī visāda veida dualitātes rezultāti.
(MIT:Goemans2008, L9)Advanced Algorithms: Linear Programming (Vempala2003; L12)Combinatorial Optimization: Linear Programs
4.1.1. Ieviest lineārās programmēšanas pamatjēdzienus

Risināt nelielas lineāru vienādojumu sistēmas ar mainīgo izslēgšanu
Definēt un noteikt taisnstūrveida matricas rangu
Veikt Gausa izslēgšanas soļus matricās

4.1.2. Ieviest lineārās programmēšanas ģeometrisko interpretāciju

Interpretēt ģeometriski LP uzdevuma nosacījumus un papildmainīgos
Attēlot plaknē pieļaujamo apgabalu 2 brīvo mainīgo LP uzdevumam.
Atzīmēt 2D vai 3D pieļaujamā apgabala robežai mainīgo, kurš ir 0.

4.1.3. Ģeometriskā intuīcija par optimālā risinājuma esamību un eksponenciāls “naivais algoritms”
4.1.4. Veikt LP uzdevumu pārrakstīšanas un manipulācijas

Pārveidot mērķa funkcijas minimizēšanu par maksimizēšanu
Izteikt vienādības ar nevienādībām
Izteikt nevienādību ar nenegativitāti un nokares mainīgo
Aizstāt ar zīmi neierobežotus mainīgos ar diviem nenegatīviem mainīgajiem

4.1.5. Aprakstīt problēmas kā veselo skaitļu programmēšanas uzdevumus

Formulēt teksta uzdevumus kā veselo skaitļu LP uzdevumus.
Reducēt Hamiltona ciklu uz veselo skaitļu LP uzdevumu.
Reducēt SAT problēmu uz veselo skaitļu LP uzdevumu.

4.2 Lietot un analizēt simpleksu metodi lineārās programmēšanas uzdevumu risināšanai Description

Apakšnodaļa apskata vecāko un arvien populārāko LP risināšanas metodi ar simpleksu metodi. Vienlaikus pamatots neapmierinošs konverģences ātrums dažos īpašos gadījumos.
(MIT:Goemans2008, L10)Advanced Algorithms: Sketch of the Simplex Method (MIT:Demaine2015, L15)Design and Analysis of Algorithms: Linear Programming (Chutong2019)Statistical Analysis of Four Pivot Rules for the Simplex Method (Vempala2003, L13)Combinatorial Optimization: The Simplex Algorithm
4.2.1. Pārveidot LP uzdevumus simpleksu standartformā, t.sk. Ieviešot papildmainīgos.
4.2.2. Izvēlēties sākotnējo tuvinājumu simpleksu algoritmā
4.2.3. Veikt simpleksa algoritma soļus
4.2.4. Analizēt simpleksu algoritma ārtrdarbību un sliktākos gadījumus.

Week 10: 2020-11-16 to 2020-11-20

4.3 Lietot un analizēt rezultātus par LP dualitāti. Description

Šajā apakšnodaļā ieviešam teorijas rezultātus un algoritmus, kas izmanto lineāro programmu dualitāti.
(MIT:Goemans2008; L10)Advanced Algorithms: LP Duality (MIT:Goemans2008; L11)Advanced Algorithms: Complexity of LP (Cornell:Williamson2008; L7)Mathematical Programming I (MIT:Vempala2003, L16)Combinatorial Optimization: The Primal-Dual Algorithm (CMU:Sleator2018, L15)Algorithms: Linear Programming – Duality
4.3.1. Formulēt un pierādīt Farkasa lemmu

Formulēt Farkasa lemmu dažos ekvivalentos veidos
Pierādīt Farkasa lemmu
Formulēt Farkasa lemmas secinājumus

4.3.2. Pārveidot primāro LP uzdevumu par duālo

Minēt duālās problēmas fizikālo interpretāciju ar bumbiņu
Pārveidot (nestandartformas) LP uzdevumu par tam duālo.
Teksta uzdevumos interpretēt gan primāros, gan duālos mainīgos.
Izmantot dualitātes teorēmu un aprēķināt dualitātes atstarpi
Sastādīt LP modeli optimizācijas veida teksta uzdevumam.
Sastādīt LP modeli maksimālās plūsmas uzdevumam grafā.

4.3.3. Primārā-Duālā metode LP uzdevumos
4.3.4. LP uzdevumu izmērs un sarežģītība
4.3.5. Analizēt dualitātes izpausmes teksta uzdevumos

Izmantot dualitāti grafu plūsmas uzdevumos
Izmantot dualitāti krājumu vadības uzdevumos
Izmantot dualitāti matricu spēļu uzdevumos

4.4 Izmantot elipsoīda metodi LP risināšanā Description

Apakšnodaļa apskata iteratīvu (skaitlisko metožu iedvesmotu) LP risināšanas metodi – elipsoīdu metodi un tās ģeometrisko interpretāciju.
(MIT:Goemans2008, L12)Advanced Algorithms: Ellipsoid Algorithm (MIT:Goemans2009, L7)Combinatorial Optimization: Ellipsoid Algorithm (MIT:Vempala2003; L17)Combinatorial Optimization: The Ellipsoid Algorithm
4.4.1. Izklāstīt Elipsoīda algoritma soļus
4.4.2. Formulēt Hačijana elipsoīda algoritma tilpumu novērtējumu.

Week 11: 2020-11-23 to 2020-11-27

4.5 Izmantot iekšējā punkta metodes un afīno mērogošanu Description

Apakšnodaļā virspusēji aprakstītas vairākas iekšējā punkta metodes un viena no tām (afīnās mērogošanas atsevišķs variants) izklāstīts detalizēti.
(MIT:Bertsimas2009, L21)Optimization Methods: Affine scaling algorithm
4.5.1. Ieviest nepārtrauktu funkciju optimizācijā pazīstamus jēdzienus

Definēt izliektas kopas
Nepārtrauktas un diferencējamas funkcijas maksimumi
Formulēt teorēmu par lineāras funkcijas lielāko vērtība uz sfēras
Rakstīt izteiksmi $ n $-dimensiju vektora projicēšanai hiperplaknē.

4.5.2. Lietot un analizēt afīnās mērogošanas metodi LP risināšanā

Izpildīt afīnās mērogošanas metodes koordinātu pārveidojumus.
Atrast afīnās mērogošanas metodes maksimālā pieauguma virzienu.
Projicēt afīnās mērogošanas metodes virzienu dotajā plaknē
Atrast afīnās mērogošanas kārtējo tuvinājumu un atgriezties sākotnējos apzīmējumos

4.5.3. Apskatīt LP modeļu izmantošanu Ieteikumu sistēmās (recommender systems) – tsk. Netflix vai grāmatu ieteikumos.
4.5.4. Reducēt dažas NP-pilnas problēmas uz lineāras optimizācijas (t.sk. Integer programming) uzdevumiem.
4.5.5. Identificēt citus iekšējā punkta metožu variantus

Week 12: 2020-11-30 to 2020-12-04

5 Lietot un analizēt virkņu meklēšanas algoritmus

5.1 Ieviest virkņu meklēšanā izmantotos jēdzienus Description

Šajā apakšnodaļā apskatām pamatjēdzienus un naivo algoritmu.
(RajputJi2016)Wildcard Pattern Matching
5.1.1. Definēt terminus – virkne, apakšvirkne, apakšstrings, apakšstringa indekss

Novērtēt apakšvirkņu un apakšstringu skaitu dotajā virknē
Pamatot dažas stringu prefiksu/sufiksu īpašības
Aprakstīt virkņu meklēšanas uzdevumus (jā/nē testēšana, pirmais indekss, visi indeksi)
Aprakstīt garākās kopīgās apakšvirknes uzdevumu.

5.1.2. Lietot un analizēt naivo apakšstringa meklēšanas algoritmu.

Novērtēt naivā virkņu meklēšanas algoritma ātrdarbību sliktākajā gadījumā.
Novērtēt naivā virkņu meklēšanas algoritma ātrdarbību “nejaušām” virknēm.

5.1.3. Aplūkot algoritmiskus risinājumus rediģēšanas attālumam

Definēt Levenšteina (rediģēšanas) attālumu
Lietot un analizēt dinamiskās programmēšanas algoritmu rediģēšanas attālumam
Pārveidot rediģēšanas attālumu par īsāko ceļu grafā un Dijkstras algoritmu
Izmantot dinamisko programmēšanu, meklējot paraugus ar aizstājējzīmēm (wildcards)

5.2 Lietot hešinga paradigmas virkņu meklēšanas algoritmos. Description

Šajā apakšnodaļā apspriesti slīdošā loga (sliding window jeb rolling hash) algoritmi.
(MIT:Devadas2009, L6)Introduction to Algorithms: Rolling Hash (MIT:Demaine2011, L9)Introduction to Algorithms: Table Doubling, Karp-Rabin
5.2.1. Manipulēt ar skaitļiem dažādās skaitīšanas sistēmās

Pārveidot skaitļus no vienas skaitīšanas sistēmas citā
Aprēķināt polinomu vērtības ar Hornera shēmu
Aprēķināt pozicionāli pierakstītu skaitļu vērtības ar Hornera shēmu.
Rakstīt formulas “ritinošā hešinga” efektīvai aprēķināšanai

5.2.2. Lietot un analizēt Rabina-Karpa algoritmu

Apskatīt optimāla modulārā hešinga funkciju parametru izvēli
Ja doti parametri, novērtēt viltus trāpījumu varbūtību Rabina-Karpa algoritmā.
Veikt Rabina-Karpa soli, ja doti parametri un pārbaudāmais teksts

5.2.3. Definēt Blūma filtrus – varbūtiskas datu struktūras ar hešingu.

Formulēt Blūma filtra abstrakto datu tipu, iespējamās kļūdas atbildēs
Aplūkot praktiski izraudzītus parametrus, lai Blūma filtrs sniegtu vietas ietaupījumu

5.3 Veidot datu struktūras Knuta-Morisa-Prata algoritumam Description

Apakšnodaļa apraksta parauga meklēšanu ar galīga automāta palīdzību, kura stāvokļu pārejas iekodē prefiksu funkcija.
(CMU:Kingsford2017, L9)Design & Analysis of Algorithms: String Matching (Berkeley:Patrascu2009, HW5)Computability and Complexity: Pattern Matching
5.3.1. Aplūkot galīgo automātu jēdzienus stringu analīzei.

Izveidot automātu apakšstringu meklēšanai
Izveidot automātu regulāru izteiksmju meklēšanai

5.3.2. Parādīt ievades papildināšanas (input enhancement) pieeju virkņu meklēšanas algoritmos.
5.3.3. Definēt prefiksu funkciju meklējamam paraugam un tās algoritmu
5.3.4. Definēt KMP algoritmu, kas optimizē nobīdes palielinājumus

Dotajam meklējamajam paraugam P izveidot KMP prefiksu funkcijas tabulu.
Pamatot dažas prefiksu funkcijas īpašības
Saskaitīt simbolu salīdzināšanas, meklējot apakšvirknes ar KMP algoritmu.

5.3.5. Salīdzināt KMP ar stāvokļu automātu

Definēt stāvokļa automātu stringu meklēšanas uzdevumiem.
Aplūkot prefiksu funkcijas saistību ar pārejām stāvokļu automātā
Dotam paraugam $ P $ izveidot galīgu automātu tā meklēšanai.

Week 13: 2020-12-07 to 2020-12-11

5.4 Veidot datu struktūras Bojera-Mūra algoritmam Description

Apakšnodaļa apraksta otra veida stringu meklēšanas algoritmus, kuri sāk pārbaudes no parauga beigām.
(UCDavis:Gusfield2011)String Algorithms: Notes on Boyer-Moore (Lang2001)Boyer-Moore-Algorithmus (Mangal2017)Boyer Moore Algorithm: Good Suffix heuristic
5.4.1. Aprakstīt Bojera-Mūra algoritmu

Aprakstīt sliktā simbola heiristiku un funkciju $ \lambda(n) $
Aprakstīt labā sufiksa heiristiku un gammas funkciju $ \gamma(n) $
Dotajam meklēšanas paraugam $ P $ izveidot labā sufiksa tabulu
Dotajam meklēšanas paraugam $ P $ izveidot sliktā simbola tabulu.

5.4.2. Analizēt pilna BM algoritma ātrdarbību caurmēra un sliktākajā gadījumā.
5.4.3. Lietot un analizēt Bojera-Mūra-Horspola algoritmu caurmēra un slikākajā gadījumā
5.5 Veidot sufiksu koku un lietot to virkņu uzdevumos Description

Šajā nodaļā apskatītas tās pieejas, kas nav radniecīgas RK, KMP, BM algoritmiem un virkņu algoritmu lietojumi dzīvē.
(CMU:Kingsford2017, L10)Algorithms: Suffix Trees and Arrays (MIT:Karger1999, Handout 8)Advanced Algorithms: Problemset 3 Solutions (Allison)Suffix Trees (Stanford:KayA)Suffix Trees (Stanford:KayB)Suffix Trees: Notes on Ukkonen's Algorithm

(MIT:Demaine2012)Advanced Data Structures: Strings
5.5.1. Minēt garākā kopīgā apakšstringa meklēšanas algoritmus
5.5.2. Apskatīt stringu meklēšanas lietojumus datoru drošībā

Apskatīt slīdošā hešinga lietojumus plaģiāta noķeršanā; pārskatīt rīkus un pakalpojumu veidus.
Izskaidrot datu noplūdes novēršanas lietojumus (DLP); heštabulu un Blūma filtru lietojumus tajos.
Pazīt algoritmus leksikonu (nelielu vārdnīcu) meklēšanu DLP rīkos
Pazīt algoritmus regulāru izteiksmju meklēšanu DLP rīkos

5.5.3. Iepazīties ar sufiksu kokiem

Definēt sufiksu koku datu struktūras.
Lietot un analizēt Ukonena algoritmu sufiksu koku veidošanai.
Izmantot sufiksu kokus dažiem meklēšanas uzdevumiem.