Harjoitustyön mahdolliset aiheet

Aiheen valinnasta

Harjoitustyön keskeisenä tavoitteena on toteuttaa ja testata monimutkaisempia algoritmeja jota ei ole käsitelty aiemmilla kursseilla. Aiheen voi keksiä itse, tai voit valita aiheen alla olevasta listasta. Ohjaaja arvioi ja hyväksyy aiheen määrittelydokumentin perusteella kurssin alussa. Itse keksittyä aihetta voidaan joutua muokkaamaan sopivan vaativuuden ja laajuuden saavuttamiseksi. Huomaa kuitenkin että alla olevat ehdotukset on tarkoitettu vain auttamaan alkuun pääsemisessä. Harjoitustyöhon kuuluu oleellisena osana (ohjaajan tukema) itsenäinen tiedon haku, oman aiheen opiskelu ja algoritmin ymmärtäminen. Varaudu käyttämään tähän aikaa. Sellaisen algoritmin toteuttaminen, jonka toimintaa ei itse ymmärrä, on erittäin vaikeaa ja turhauttavaa. Kysy ohjaajalta neuvoa matalalla kynnyksellä projektin kaikissa vaiheissa alkaen aiheen valinnasta.

Tällä sivulla mainittujen aiheiden lisäksi opiskelijat voivat valita oman ohjaajan hyväksymän aiheen. Algoritmit, jotka on opittu kurssilla “Tietorakenteet ja Algoritmit” tai sitä edeltävillä ohjelmointikursseilla, ovat tämän kurssin esitietoa, eivätkä siten voi olla projektin oleellista sisältöä. Tämän lisäksi harjoitustyössä tulee soveltaa jotain algoritmia käytännön tilanteessa. Tämä toteutuu kaikissa kurssimateriaalin aihe-ehdotuksissa. Jos valitset täysin oman aiheen, tai aihe-ehdotuksesi ei ole yksityiskohtainen, sovi tapaaminen ohaajan kanssa jo ensimmäisellä viikolla, ennen määrittelydokumentin palautusta, jotta voitte sopia, miten aihe kannattaa rajata, ja mitkä osat aiheesta sinun tulee toteuttaa itse, jotta harjoitustyölle saavutetaan sopiva laajuus.

Jotkut harjoitustyön aiheista voivat soveltua kandidaatin tutkielman aiheiden pohjaksi. Lisää tietoa tästä löytyy toiselta sivulta. Suosittelemme harkitsemaan harjoitustyön ja kandidaatin tutkielan mahdollisia synergioita.

Lista aiheista

Verkot ja Polunetsintä
Tiedon tiivistys
Pelit
- Gomoku
- Miinaharava
- Shakki
- Connect4
- Reversi
- Battle Sheep
- 2048
- Pentago
- Kivi-sakset-paperi
- 15-peli
DPLL
Koneoppiminen
- Laskennallinen luovuus, tekstin tai musiikin generointi
- Hahmontunnistus
Luolastojen Generointi
Salaus ja tietoturva
Signaalin käsittely
Kontin pakkaus
Sännölliset lausekkeet
Kirjoitusvirheiden korjaaja
Tieteellinen laskin

Verkot ja polunetsintä

Miten löydetään tehokkaasti nopein/lyhin reitti verkossa kahden pisteen välillä? Verkon pisteet voivat olla esimerkiksi katuosoitteita, joukkoliikenteen pysäkkejä, tai koordinaatteja.

Tarkempi määrittely

Toteuta vähintään kahden eri reitinhakualgoritmin vertailu. Näistä korkeintaan toinen saa olla Dijkstra tai A* koska Dijkstra opitaan harjoitustyön esitetoihin kuuluvalla Tira-kurssilla, ja A* on toteutukseltaan erittäin lähellä Dijkstraa.

Harjoitustyöhön sopivia reitinhakualgoritmeja ovat:

JPS, eli Jump Point Search, josta löytyy havainnollistavaa materiaalia esimerkiksi täältä ja täältä. Tieteellinen paperi löytyy täältä.
- Soveltuu vain pikselikartoille. Pikselikartalla on kahdeksan etenemissuuntaa ja kaksi mahdollista painoa, kaaren paino riippuu siitä kuljetaanko seuraavaan solmuun suoraan vai viistottain.
- Pikselikarttoja löytyy esim. Moving AI Lab sivuilta.
Fringe Search, joka on astetta haastavampi.

Myös osiosta Pelit löytyvän 15-pelin ratkaiseminen perustuu reitinhakualgoritmiin.

Hyödyllisiä neuvoja

Reitinhakualgoritmien vertailussa on syytä heti alkuun toteuttaa löydetyn reitin ja läpikäytyjen solmujen / hyppypisteiden visualisointi. Ilman sitä on vaikea nähdä toimiiko algoritmi oikein. Visualisointi auttaa hakualgoritmin oikeellisuuden toteamisessa, ja se nopeuttaa myös virheiden löytämistä ohjelman kehityksen aikana. Visualisoinnin laatimiseen ei saisi mennä paljon työaikaa, sillä varsinainen ydin on reitinhakualgoritmien toteutus ja huolellinen testaus. Graafinen käyttöliittymä on kätevä, mutta selkeä ASCII-grafiikka riittää, jos käytät pikselikarttoja. Huomaa että oikeellisuuden ja tehokkuuden testaamiseen tarvitaan monimutkaisia ja tarpeeksi laajoja karttoja, jotka ovat vertailemiesi algoritmien kannalta mielekkäitä. Niiden tuottaminen käsin olisi kohtuuttoman työlästä, joten tarvitset myös valmiita karttoja jostain lähteestä.

Koodin toteutuksessa ei kannata lähteä toteuttamaan minkäänlaista “verkko” oliota. Sen sijaan kannattaa suoraan lukea kokonaisluku tai merkkitaulukoita.

Valmiita karttoja löytyy esimerkiksi Moving AI Lab sivuilta, shortest-path labin repositoriosta, tai maanmittauslaitoksen kartoista. Huomaa, että Moving AI:n pikselikartoissa ilmoitetut etäisyydet on laskettu niin, että reitti kiertää esteen kulmapikselin, sen sijaan että kulkisi viistosti tavallaan puoliksi estepikselin yli. Myös joukkoliikenteen reitti / aikataulut tai digitransitin kartat ja avoin karttadata ovat olleet suosittuja valmiiden karttojen lähteitä.

Joidenkin karttojen mukana tulee etäisyystietoja erilaisille reiteille, ja niitä voi hyödyntää testeissä. Jos algoritmisi palauttaa oikean pituuden useille riittävän pitkille ja monipuolisille reiteille, se ilmeisesti löytää oikean reitin. Esim. JPS:n oikea toiminta tulee kuitenkin varmistaa myös tutkimalla, että sen käsittelemät hyppypisteet ovat oikeat, sillä algoritmissa voi olla virhe, jonka takia tehdään paljon turhaa työtä, vaikka lyhin reitti löytyykin.

Tiedon tiivistys

Miten erityyppisiä tiedostoja voidaan pakata ja purkaa tehokkaasti? Eri pakkausalgoritmit voidaan jakaa häviöllisiin tai häviöttömiin menetelmiin. Häviölliset menetelmät pystyvät usein suurempaan pakkaustehoon, eli pienentämään tiedostoa enemmän. Toisaalta, purettu tiedosto ei häviöllisellä menetelmällä välttämättä ole sama kuin alkuperäinen. Häviöllisiä menetelmiä käytetään usein kuvan tai äänen pakkaamiseen kun taas tekstin pakkauksessa käytetään häviöttömiä menetelmiä.

Lisää tietoa tiedonpakkauksesta Wikipediasta.

Tarkempi määrittely

Toteuta algoritmeja tiedoston pakkaamiseen ja pakatun tiedoston purkamiseen. Sopiva määrä toteutettavia pakkausalgoritmeja riippuu niiden monimutkaisuudesta. Ohjaaja antaa tästä tarkempaa tietoa. Yleensä harjoitustyön vaatimuksiin pääsemiseksi tarvitaan kahden eri algoritmin toteutus ja vertailu. Jotkut menetelmät ovat kuitenkin niin monimutkaisia, että niiden toteutus yksinään riittää. Keskustele ohjaajan kanssa sopivasta rajauksesta, varsinkin jos toteutat kuvan tai äänen pakkausta.

Harjoitustyöhön sopivia pakkausemenetelmiä ovat esim:

Lempel-Ziv -algoritmit kuten LZ77, LZ78, LZSS tai LZW.
Huffman koodaus johonka liittyy oleellisesti Huffman-puun tallettaminen

Sopiva aihe harjoitustyölle on esimerkiksi yhden LZ algoritmin vertaaminen Huffman koodaukseen tekstin pakkauksessa. Ohjelman tulee tuottaa kiintolevylle yksi tiedosto, joka sisältää kaiken sen purkamiseen tarvittavan datan, ja jonka koko on käytetylle pakkausmenetelmälle tyypillinen. Pakatun tiedoston pitää siis sisältää esim. Huffman-puu tai sanakirja, jos pakkausmenetelmä sellaista vaatii, ja myös niiden tulee olla esitettynä tehokkaasti, ei vaikkapa xml / json -muodossa.

Hyödyllisiä neuvoja

Kun pakataan luonnollista kieltä (tai ohjelman lähdekoodia) pakatun tiedoston koon tulisi olla noin 40-60% alkuperäisestä koosta, kunhan pakattava tiedosto on riittävän suuri. Tekstin pakkaamiseen käytetään vain häviöttömiä menetelmiä, koska pakatut tekstitiedostot täytyy pystyä palauttamaan alkuperäiseen muotoon. Kuvaa ja ääntä pakattaessa pyritään paljon suurempaan pakkaustehoon, mutta se on mahdollista vain häviöllisiä menetelmiä, jolloin pakattua tiedostoa ei voi enää palauttaa alkuperäiseksi.

Aiheen vaatimusten saavuttaminen vaatii datan lukemista ja kirjoittamista tiedostoon bittitasolla, mikä ei onnistu samoilla välineillä kuin tekstitiedoston käsittely. Voit käyttää ohjelmointikielen valmiita tietorakenteita kaikissa pakkausalgoritmeissa. Huomaa että pakkausalgoritmejasi täytyy testata edustavilla syötteillä, jotka ovat tarpeeksi isoja. Myös päästä päähän -testaus (pakkaus +purku ja tuloksen vertaaminen alkuperäiseen tiedostoon) on välttämätön osa oikeellisuustestausta, koska jotkin virheet tulevat esiin vasta, kun tiedosto on tarpeeksi suuri tai siinä on riittävän monta eri merkkiä. Et voi käsin laskea vertailuarvoksi, millainen usean megatavun kokoisen tiedoston oikea pakkaustulos on.

Pelit

Miten toteutetaan tekoäly erityyppisille peleille? Tässä projektissa valitaan yksi peli, ja toteutetaan sille tekoäly. Useimille alla olevista peleistä tekoälyn voi toteuttaa minimax-algoritmilla, jota on tehostettu alpha-beta-karsinnalla. Minimax algoritmin toimintaa selittäviä resursseja löytyy netistä paljon, esimerkiksi tämä video on aika hyvä.

Minmax-algoritmi laskee jokaisesta pelitilateesta eteenpäin ja valitsee siirron, joka johtaa varmaan voittoon, jos sellainen siirto on. Algoritmi olettaa, että sekä tekoäly että vastapelaaja tekevät joka tilanteessa itsensä kannalta parhaan mahdollisen siirron. Koska harvasta pelitilanteesta voidaan laskea voittoon, häviöön tai tasapeliin asti, lasketaan sen sijaan tietty määrä siirtoja eteenpäin ja arvioidaan jollain heuristiikalla, kuinka hyvään pelitilanteeseen päästään. Heuristiikan perusteella valitaan se siirto, joka johtaa parhaimpaan pelitilanteeseen.

Jos haluat tehdä shakille tai connect fourille tekoälyn ja sinulla on linux kone suosittelemme vahvasti harjoitustyön tekoälyalustan käyttöä. Alusta tarjoaa graafisen käyttöliittymän ja mahdollisuuden pelata omaa tekoälyäsi vastaan minimaalisella overheadilla. Huomaa, että alusta toimii tällä hetkellä vain oikeilla Linux koneilla, minkäänlainen linuxin emulointi ei kelpaa.

Tarkempi määrittely

Toteuta jonkin pelin tekoäly. Tekoälysi pitää pystyä pelaamaan ihmistä vastaan käyttöliittymäsi kautta. Voidaksesi käyttää tekoälyäsi, sinun täytyy myös toteuttaa sovelluslogiikka ja käyttöliittymä pelillesi. Sovelluslogiikan ja käyttöliittymän toteuttamiseen ei kuitenkaan saisi käyttää liikaa aikaa, harjoitustyön ydin on itse tekoäly. Valmiita kirjastoja tms. ei saa käyttää pelin sovelluslogiikassa, vaan esim. sallittujen siirtojen generointi, voiton tunnistus ja siirtojen suorittaminen toteutetaan itse. Käyttöliittymään voi käyttää valmiita välineitä, mutta monissa peleissä tekstipohjainen käyttöliittymä on täysin käyttökelpoinen. Käyttöliittymää ei tarvitse testata.

Alla lista joistakin sopivista peleistä sekä hyödyllisiä neuvoja kullekin pelille. Peleissä, joiden solvelluslogiikka ja käyttöliittymä ovat helpoimpia toteuttaa, vaaditaan itse tekoälyltä hieman enemmän ominaisuuksia. Nämä vaatimukset mainitaan erikseen kunkin pelin kohdalta. Mikäli pelin kohdalla ei mainita muuta, tekoälyn sille pelille voi toteuttaa minimax algoritmilla. Jos haluat tehostaa minimaxia, on ensimmäinen askel pelistä riippumatta iteratiivisen syvenemisen toteuttaminen Connect4-pelin kohdalla kuvatulla tavalla. Transpositiotaulun avulla voidaan hyödyntää vielä enemmän aiemman laskennan tuottamaa tietoa. Transpositiotaulun käytöstä iteratiiviseen syvenemiseen yhdistettynä voi olla vaikea löytää oikeaa tietoa, joten kannattaa kysyä neuvoa kurssin ohjaajalta. Ilman iteratiivista syvenemistä on pelitilanteen arvoa arvioiva heuristinen funktio juuri niin hyvä kuin miten hyvin se kuvaa pelitilanteen potentiaalia. Kun käytetään iteratiivista syvenemistä, on heuristiikkafunktion johdonmukaisuus (vain osittain sama asia kuin oikeellisuus) merkittävä laskennan nopeuteen vaikuttava tekijä. Tästäkin saa neuvoja ohjaajalta.

Ristinolla / Gomoku

20 x 20 ruudukolla pelattava ristinolla, jossa voittaa kun saa vähintään 5 merkin pituisen rivin.

Lisävaatimukset. Hyväksyttyyn suoritukseen vaaditaan tehokas toteutus, johon kuuluu:

Tutkitaan vain vapaat ruudut, jotka ovat korkeintaan kahden ruudun päässä aiemmin tehdyistä siirroista, tai muu tätä tehokkaampi mielekäs kokeiltavien siirtojen karsinta. Tutkittavia siirtoja ei selvitetä erikseen joka pelitilanteessa, vaan pidetään yllä listaa tällaisista ruuduista, ja päivitetään sitä tehtyjen / minimaxissa kokeiltujen siirtojen myötä. Siirtojen mukaan päivitetty lista annetaan parametrina eteenpäin minimaxissa.
Ristinollassa on usein pakko reagoida vastustajan edelliseen siirtoon, tai se on jatkoa ajatellen kannattavaa. Usein paras reaktio on jokin edellisen siirron viereinen siirto. Noudata tätä heuristiikkaa lisäämällä / nostamalla viimeisimmän siirron lähinaapurit ensimmäisiksi tutkittaviksi.
Voiton tarkistus tehdään tutkimalla vain rivit, jotka sisältävät edellisen siirron. Jos viiden rivi on syntynyt, voittaja on edellisen siirron tehnyt pelaaja, ja edellinen siirto on osa voittoriviä.
Pelitilanteen hyvyyttä arvioidaan heuristiikkafunktiolla. Sen tulee olla mielekäs, mutta se voi olla yksinkertainen.

Hyödylliset neuvot.

Ei kannata ensin toteuttaa 3 x 3 pelin toimintalogiikkaa ja tekoälyä. Yleensä isomman laudan toteuttamiseen tarvitaan kuitenkin erilainen lähestyminen ja pienen pelin tekemiseen mennyt aika on hukkaan heitetty. Lähde suoraan tekemään isoa lautaa.

Shakki

Normaaleilla säännöillä 8 x 8 laudalla pelattava shakkipeli jossa voit jättää toteuttamatta osan tai kaikki näistä toiminnoista:

tornitus,
ohestalyönti,
sotilaan korotus ja
toistuvaan asemaan perustuva tasapeli.

Projektisi heuristiikkafunktion tulee arvioida materiaalin määrän lisäksi jollain tavalla nappuloiden sijoittumista laudalla. Shakin tekoälyn toteuttamiseen voit käyttää harjoitustyön tekoälyalustaa.

Connect4

6 x 7 -kokoisella laudalla pelattava peli, jossa voittaa kun saa neljä omaa pelimerkkiä riviin. Jos peli ei ole tuttu, katso Connect Four Wikipediasta. Tämä on hyvä aihe, jos haluat käyttää suurimman osan työajastasi juuri minimax-algoritmin tehostamiseen. Tutkittavien siirtojen generointi ja siirtojen toteuttaminen on Connect4:ssä yksinkertaisempaa kuin monessa muussa pelissä, jonka seurauksena voit panostaa laskennan nopeuttamiseen.

Pelin tutkimiseen ja esimerkiksi testaamiseen tarvittavien varmaan voittoon johtavien pelitilanteiden laatimiseen voit käyttää tätä täydellisesti pelaavaa tekoälyä.

Lisävaatimukset. Minimax-pohjaisissa Connect4 harjoitustöissä vaaditaan seuraavat optimoinnit:

Siirtojen järjestäminen. Kokeillaan kaikissa laskennan vaiheissa (minimaxin sisällä) ensin keskimmäiseen sarakkeeseen tehtävä siirto ja edetään siitä reunoja kohti. Tämä tehostaa alfa-beta -karsintaa, koska paras siirto löytyy useammin keskeltä.
Iteratiivinen syveneminen. Suoritetaan ensin minimax pienellä syvyydellä, sitten yhä suuremmalla, kunnes aikaraja on saavutettu. Näin saadaan ensinnäkin hyödynnettyä käytettävissä oleva aika paremmin, koska eri pelitilanteissa samalle syvyydelle tapahtuvaan laskentaan tarvittava aika vaihtelee paljon. Jokaisessa tutkitussa pelitilanteessa talletetaan tieto siitä, mikä oli paras siirto vuorossa olevan pelaajan kannalta. Kun tullaan uudestaan samaan pelitilanteeseen samalla tai myöhemmällä iteraatiolla, kokeillaan ensin edellisellä kerralla parhaaksi arvioitua siirtoa. Se on usein paras tai ainakin hyvä siirto myös sitten, kun lasketaan siirtoja syvemmälle, joten alfa-beta -karsinta tehostuu, kun saadaan nopeasti nostettua / laskettua alfa / beta -arvoa. Uusi hajautustaulu luodaan aina, kun käyttäjä on tehnyt oman siirtonsa, ja aletaan laskea tekoälyn siirtoa. Tällöin talletus onnistuu tavallisella hajautustaululla (dictionary, HashMap), koska muistin käyttö on maltillista. Hajautustaulussa avain kuvaa pelitilanteen, ja arvona on siirto.
Voiton tarkistus tehdään tutkimalla vain rivit, jotka sisältävät edellisen siirron. Jos neljän rivi on syntynyt, voittaja on edellisen siirron tehnyt pelaaja, ja edellinen siirto on osa voittoriviä.
Pelitilanteen hyvyyttä arvioidaan heuristiikkafunktiolla. Sen tulee olla mielekäs, mutta se voi olla yksinkertainen.

Huomaa, että iteratiivisessa syventämisessä et voi tallettaa hajautustauluun siirtojen arvoja ja palauttaa niitä myöhemillä kierroksilla. Voit vain tallettaa tiedon siitä, mikä oli paras siirto eli sarake siinä tilanteessa. Aikaisemmilla kierroksilla tallennetut arvot eivät ole päteviä, koska heuristinen arvo muuttuu, kun lasketaan syvemmälle. Samalla iteraatiolla voidaan päätyä samaan pelitilanteeseen useammalla siirtosarjalla, mutta alfa-beta -karsinnan takia lasketut arvot eivät useimmiten ole aitoja vaan vain ylä- tai alarajoja todellisille arvoille. Talletettua pelitilanteen arvoa ei siksi voi sellaisenaan hyödyntää silloinkaan, kun laskentasyvyys on sama. Kaikkia sallittuja siirtoja täytyy kokeilla (mahdolliseen alfa/beta -katkaisuun asti), tietoa viimeksi parhaaksi arvioidusta siirrosta voi käyttää vain kokeiltavien siirtojen järjestämiseen.

Othello / Reversi

Othelloa pelataan 8 x 8 pelilaudalla. Pelin voittaa se, jolla on eniten nappuloita laudalla, kun kaikki ruudut on täytetty.

Hyödylliset Neuvot. Esim. shakkiin verrattuna Othellossa on vaikea arvioida pelitilanteen arvoa merkityksellisesti, mutta ihmistä vastaan pelatessa auttaa, että tehtävä on vaikea myös ihmiselle. Pelitilanteen hyvyyttä tulee arvioida jollain mielekkällä heuristiikkafunktiolla.

Neuvoja heuristisen evaluaatiofunktion laatimiseen löytyy, esim.

Othellon tekoälyn voi minimaxin lisäksi toteuttaa esim. Monte Carlo Tree Searchilla. Silloin ei tarvita evaluaatiofunktiota.

2048

2048 poikkeaa aikaisemmista siinä mielessä, että pelissä on vain yksi pelaaja ja satunnaiselementti. Näinpä sen tekoälyn pohjaksi sopii expectiminimax-algoritmi, muunnettuna niin että siinä on kahden sijasta vain yksi pelaaja + satunnainen tapahtuma. Myös minimaxilla jossa satunnainen tapahtuma on vastapelaaja on kuitenkin saavutettu hyviä tuloksia, vaikka silloin oletetaan aina uuden luvun ilmaantuvan pahimpaan mahdolliseen kohtaan pahimmalla arvolla. Pelitilanteen hyvyyttä tulee arvioida jollain mielekkäällä heuristiikkafuntiolla.

Jos otat jostain mallia heuristiseen arviointifunktioon, huomaa että ihan sama funktio ei ehkä ole ihanteellinen minimaxille ja expectiminimaxille. Minimaxilla saavutetaan alfa-beta -karsinnan avulla suurempi laskentasyvyys, jolloin esim. vapaiden ruutujen määrä ennustaa paremmin menestystä. Hyvä heuristinen funktio huomioi joka tapauksessa sekä vapaan tilan määrän että arvojen sijoittumisen. Yun Nie, Wenqi Hou ja Yicheng An ovat kirjoittaneet lyhyen artikkelin lähestymistavoista ja heuristiikoista.

Battle sheep

Battle Sheep on hauska vaihtoehto klassikkopeleille. Pelilaudan ei tarvitse olla muokattava, kuten lautapelissä, vaan voit käyttää sopivaa kiinteää pelilautaa. Tähän peliin tarvitaan mielellään graafinen käyttöliittymä, jotta pelaaminen on sujuvaa. Pelitilanteen hyvyyttä tulee arvioida jollain mielekkällä heuristiikkafunktiolla.

Pentago

Myös Pentago on mielenkiintoinen uutuuspeli, jonka voi toteuttaa mimimaxilla. Ihmispelaajalle on vaativaa miettiä eteenpäin siirtoja, joissa käännetään pelilaudan osia, joten tekoälyllä on mahdollisuus menestyä. Toisaalta pelissä on alkuun peräti 36*8 = 288 siirtovaihtoehtoa. Jo neljän seuraavan siirron laskemiseen (kaksi siirtoparia) tarvitaan tehokkaita ratkaisuja. Pelitilanteen hyvyyttä tulee arvioida jollain mielekkällä heuristiikkafunktiolla.

Kivi-sakset-paperi

Kivi-sakset-paperi on kaikille tuttu peli, jota ei yleisesti voi pelata hyvin tai huonosti. Tekoälyä pelille ei voi toteuttaa minimax algoritmilla, koska siinä oletetaan vastustajan tekevän aina parhaan vastasiirron, jolloin jokainen oma siirto johtaa yhtä lailla tappioon. Sen sijaan tässä projektissa tehdään oppiva tekoäly joka pyrkii oppimaan vastustajansa pelityylin ja pelaamaan hyvin sitä vastaan. Yksi tapa oppia toisen pelityyli on käyttää useamman eri asteen Markovin ketjuja (katso myös kohta laskennallisesta luovuudesta). Tähän useaa teloälyä vertailevaan kehykseen voi yhdistää muitakin malleja vastustajan toimminnalle. Kannattaa jutella ohjaajan kanssa, jos tämä aihe kiinnostaa.

15-peli

15-peli on haastava ratkaistava, pelin ratkaisu vie pahimmassa tapauksessa paljon aikaa ainakin heikolla heuristiikalla. Ratkaisussa tulee lähtökohtaisesti käyttää IDA* -algoritmia. Keskustele ohjaajan kanssa jos haluat käyttää jotain muuta. Tähän peliin soveltuvista heuristisista etäisyysfunktioista kerrotaan esim. Michael Kimin blogissa. Lisää tietoa IDA*-algoritmista löytyy esim geeks for geeksin sivulta.

Miinaharava

Tälle kurssille sopivista miinaharavan ratkaisijoista löytyy tietoa David Becerran kandidaatin tutkielmasta. Jos käytät projektissa Javaa, voit toteuttaa ratkaisijan / auttajan käyttöliittymän valmiilla Miinaharavan projektipohjalla. Jos käytät valmista Java-pohjaa, kerro koodin kommenteissa selvästi mikä on omaa koodiasi, ja mikä on pohjaa. Älä muokkaa pohjaa, vaan kirjoita oma koodisi omaan luokkaansa / metodiinsa.

DPLL

Huom: Tämä määrittely käytössä lukuvuoden 25-26 kolmanteen periodiin asti

Propositiologiikan päätösongelma (SAT) on keskeinen sekä teoreettisessa, että soveltavassa tietojenkäsittelytieteessä. Nykyaikaiset ns. CDCL algoritmien toteutukset (SAT-solverit) pystyvät päättämään miljoonia muutujia sisältävien kaavojen toteutuvuuden. Tälläisiä algoritmeja käytetään monissa käytännön sovelluksissa, tehokkaat SAT solverit ovat esimerkiksi oleellisia erilaisten piirien oikeellisuden varmistamisessa.

Tehokkaan CDCL algoritmin toteuttaminen harjoitustyön aikana on liian vaativaa. Sen sijaan tässä aiheessa tutkimme sen edeltäjää, DPLL algoritmia.

Tarkempi määrittely

Toteuta ohjelma, joka lukee propositioloogisen kaavan konjunktiivisessa normaalimuodossa DIMACS tiedostomuodossa ja palauttaa joko sen toteuttavan totuusjakauman, tai tiedon siitä, ettei tälläistä jakaumaa ole. Ohjelman pitää käyttää DPLL algoritmia.

Ollakseen hyväksyttävä ohjelman täytyy toteuttaa yksikköpropagaatio ja puhtaan literaalin poisto. Katso tarkempi selitys algoritmista täältä. Kaavan käsittelyyn vaadittavat tietorakenteet täytyy toteuttaa itse. Aihe on parasta toteuttaa C++ kielellä.

Hyödyllisiä neuvoja

Oman algoritmin oikeellisuutta voi testata vertaamalla sen tuloksia johonkin CDCL SAT solverin tuloksiin. Esim CaDiCaL tai Kissat ovat tähän oikeen soveltuvia. Molemmissa näiden repositorioissa löytyy myös testilauseita: CaDiCaLin testit, Kissatin testit. Muista vaan, että sekä CaDiCal, että Kissat ovat erittäin optimoituja CDCL algoritmin toteutuksia, tämän kurssin aikana oma ratkojasi ei pääse lähellekkään samanlaista tehokkuutta.

Lisää testilauseita voi luoda esim: CNFGen työkalulla.

Lisähaastetta Jos haluat lisähaastetta voit tutustua ns. 2-watched literal tapaan toteuttaa yksikköpropagaatio tehokkaasti. Huomaa, että ilman 2-watched literaalia ohjelmasi luutavimmin pystyy vain ~100 muuttujan kokoisten kaavojen ratkaisuun. Tämä riittää harjoitustyöhön, mutta testisyötteitesi koko kannattaa säätää tämän mukaan. Lisää mahdollisia tehostuksia algoritmillesi löytyy esim Aalto Yliopiston kurssimateriaalista. Oleellisena (mutta haasteellisena) tehostuksena mainittakoon konfliktiklausuulien oppiminen ja epäkronolooginen taaksepäinhyppy.

Huomaa, että SAT solvereilla voi ratkoa monta erilaista ongelmaa mallintamalla ne ensiksi propositiologiikaan. Saatko omasta DPLL algoritmistasi tarpeeksi tehokkaan, jotta se pystyy ratkomaan Sudokuja?

DPLL (tulossa)

Huom: Tämä määrittely käytössä lukuvuoden 25-26 neljännestä periodista alkaen Propositiologiikan päätösongelma (SAT) on keskeinen sekä teoreettisessa että soveltavassa tietojenkäsittelytieteessä. Nykyaikaiset CDCL-algoritmien toteutukset (SAT-solverit) pystyvät päättämään miljoonia muuttujia sisältävien kaavojen toteutuvuuden. Tällaisia algoritmeja käytetään monissa käytännön sovelluksissa. Tehokkaat SAT-solverit ovat esimerkiksi oleellisia erilaisten piirien oikeellisuuden todentamisessa.

Tässä aiheessa toteutetaan kevyt CDCL-tyylinen algoritmi, jonka voi nähdä DPLL-algoritmina, johon on lisätty yksinkertainen klausuulin oppiminen.

Tarkempi määrittely

Toteuta ohjelma, joka lukee propositiologiikan kaavan konjunktiivisessa normaalimuodossa (CNF) DIMACS-tiedostomuodossa ja palauttaa joko sitä toteuttavan totuusjakauman tai tiedon siitä, ettei tällaista jakaumaa ole. Ohjelman tulee käyttää DPLL-algoritmia, johon on lisätty alla kuvattu yksinkertainen klausuulin oppiminen.

Hyväksyttävässä toteutuksessa on oltava yksikköpropagaatio ja alla kuvattu klausuulin oppiminen. DPLL algoritmin tarkempi selitys löytyy esim. täältä.

Yksinkertainen klausuulin oppiminen

Huom: Seuraavan ymmärtäminen voi olla helpompaa, jos ensin tutustut DPLL-algoritmiin ja yksikköpropagaatioon. Kun noudatat seuraavan kappaleen kohdan “Jakauman mallintaminen” hyödyllistä neuvoa, voit ensin toteuttaa perus-DPLL:n ja yksikköpropagaation ja lisätä sen jälkeen tässä kuvatun klausuulin oppimisen.

Kuvitellaan, että ohjelmasi etsii kaavalle F toteuttavaa totuusjakaumaa ja haku käsittelee osittaisjakaumaa T, jossa:

T voidaan nähdä jonona muuttujien arvoja: (x_1 = b_1), (x_2 = b_2), …, (x_n = b_n), missä jokainen x_i on muuttuja ja jokainen b_i on joko 0 tai 1.
Koodissa tätä kannattaa mallintaa pinona (stack) kokonaislukuja (l_1, l_2, …, l_n), jossa l_i = x_i, jos b_i = 1, ja l_i = -x_i, jos b_i = 0.
Huomaa, että osa T:n arvoista on päätettyjä (eli ohjelman itsensä asettamia) ja osa propagoituja (yksikköpropagaation seurauksia muista arvoista).

Oletetaan, että T:n asettamien arvojen alla jokin F:n klausuuli on epätosi, eli T asettaa kaikki kyseisen klausuulin literaalit arvoon 0. Tällöin sanotaan, että T johtaa konfliktiin. Tämä tarkoittaa, ettei mikään F:n toteuttava jakauma voi olla T:n jatke, ja nykyinen hakuhaara on lopetettava. Perus-DPLL peruuttaisi tässä vaiheessa poistamalla viimeisimmän T:hen lisätyn arvon. Klausuulin oppiminen tekee tämän lisäksi seuraavaa: kaavaan F lisätään uusi klausuuli C_L, joka (yksikköpropagaation kautta) estää hakua tutkimasta samankaltaisia osia hakuavaruudesta uudelleen.

Kaikkein yksinkertaisin klausuulin oppiminen lisäisi klausuulin, joka kieltää koko T:n: C_L = ¬l_1 ∨ ¬l_2 ∨ … ∨ ¬l_n, eli DIMACS-muodossa C_L = -l_1 ∨ -l_2 ∨ … ∨ -l_n. Tätä voidaan kuitenkin parantaa monella tavalla. Harjoitustyössä vaaditaan, että C_L-klausuuli sisältää vain päätetyt muuttujat, ja jätetään pois ne, jotka yksikköpropagaatio on asettanut.

Toisin sanoen: Harjoitustyössä vaaditaan, että aina kun osittaisjakauma johtaa konfliktiin, kaavaan lisätään klausuuli, joka sisältää kyseisen osittaisjakauman päätettyjen muuttujien negaatiot. Monimutkaisemmat klausuulinoppimistavat ovat myös hyväksyttäviä.

Hyödyllisiä neuvoja

Jakauman mallintaminen: Kaavan toteuttava jakauma kannattaa mallintaa pinona (stack) kokonaislukuja. Kun tutkitaan tilannetta, jossa muuttuja x_i saa arvon 1, pinoon lisätään x_i. Kun tutkitaan tilannetta, jossa muuttuja x_i saa arvon 0, pinoon lisätään -x_i. Voidaksesi toteuttaa vaaditun klausuulin oppimisen, jakelusi tulee tallentaa tieto siitä, mitkä arvoista ovat päätettyjä (ohjelman valitsemia) ja mitkä propagoituja (yksikköpropagaation seurauksia).

Testaus:

Oman algoritmin oikeellisuutta voi testata vertaamalla sen tuloksia jonkin CDCL SAT -solverin tuloksiin. Esimerkiksi CaDiCaL tai Kissat soveltuvat tähän hyvin. Molempien repositorioista löytyy myös testilauseita: CaDiCaLin testit](https://github.com/arminbiere/cadical/tree/master/test/cnf), Kissatin testit. Muista, että sekä CaDiCaL että Kissat ovat erittäin optimoituja CDCL-toteutuksia; tämän kurssin aikana oma ratkaisusi ei luultavasti pääse lähellekään samaa tehokkuutta.
Lisää testilauseita voi luoda esimerkiksi CNFGen-työkalulla.

Lisähaastetta: Jos haluat parantaa ohjelman tehokkuutta vaativammilla tekniikoilla (ei vaadita työn hyväksymiseen), voit tutustua ns. 2-watched literal-tapaan toteuttaa yksikköpropagaatio tehokkaasti. Huomaa, että ilman 2-watched literalia ohjelmasi luultavimmin pystyy ratkaisemaan vain noin 100 muuttujan kokoisia kaavoja. Tämä riittää harjoitustyöhön, mutta testisyötteiden koko kannattaa säätää sen mukaan. Lisää tehostusideoita löytyy esimerkiksi Aalto Yliopiston kurssimateriaalista.

Yleisenä ohjenuorana: Tehokkuutta saavutetaan olemalla mahdollisimman “laiska” ja säilyttämällä niin vähän tilaa vievää tietoa kuin mahdollista. Kysymys “onko kaavalle F toteuttavaa jakaumaa” on sama kuin “voiko kaikille F:n muuttujille asettaa arvon niin, ettei mikään F:n klausuuleista ole epätosi”. Vaikka tämä on itsestään selvää, jälkimmäisen muotoilun etuna on, ettei sinun tarvitse ylläpitää tietoa toteutuneista klausuuleista. Riittää, että ylläpidät nykyistä osittaisjakaumaa ja tarkistat, onko jokin klausuuli epätosi sen alla.

Huomaa, että SAT-solvereilla voi ratkoa monia erilaisia ongelmia mallintamalla ne ensin propositiologiikkaan. Saatko oman DPLL-algoritmisi riittävän tehokkaaksi, jotta se pystyy ratkomaan Sudokuja – entä isoja sudokuja?

Koneoppiminen

Koneoppiminen on erittäin laaja alue josta löytyy paljon harjoitustyöhön sopivia aiheita. Monissa koneoppimiseen liittyvissä aiheissa kannattaa muistaa, että algoritmit ovat stokastisia, niiden tuottama tulos riippuu osaksi myös siitä harjoitusdatasta, jota niille syötetään. Täten niiden oikeellisuuden varmistamiseen tarvitaan hyvin suunniteltuja testejä joissa käytetään edustavia syötteitä.

Laskennallinen luovuus

Niin sanojen (esim. nimigeneraattori), lauseiden kuin musiikin tuottaminen algoritmisesti onnistuu periaatteessa samalla tavalla. Ohjelma lukee ensin harjoitusdatan ja opettelee siitä sallittuja sanojen / lauseiden / sävel- / sointusekvenssejä. Uutta materiaalia tuotetaan näiden sääntöjen pohjalta.

Tarkempi määrittely

Toteuta ohjelma, joka lukee harjoitusdataa, oppii siitä sekvenssejä ja generoi niiden perusteella
uusia sekvenssejä käyttäjän kehotteiden perusteella. Tällä kurssilla suosittelemme käyttämään markovin ketjuja jonka avulla voidaan onnistuneesti tuottaa esimerkiksi musiikkia tai luonnollisen kielen kaltaisia sanoja tai lauseita. Ketju tallettaa harjoitusdatansa trie tietorakenteeseen josta voidaan tehokkaasti etsiä mahdollisia jatkoja annetulle syöttelle.

Toteuta itse trie-tietorakenne sanojen / lauseiden / sävel- / sointusekvenssien tallettamiseen. Ohjelman kaikki toiminnot tulee toteuttaa niin, että generoinnissa käytetyn Markovin ketjun aste on mielivaltainen. Eri asteita varten ei siis kirjoiteta eri koodia. Voit käyttää sekä valmiita kirjastoja että ulkoisia ohjelmia opetusdatan esikäsittelyyn, melodian soittamiseen / nuotintamiseen jne.

Hyödyllisiä ohjeita

Markovin ketju on prosessi, jossa kukin tila määräytyy probabilistisesti edellisten tilojen perusteella. Tässä tapauksessa yksittäinen tila on merkki, sana tai nuotti. Ensimmäinen tila arvotaan tai kysytään käyttäjältä, ja seuraavat tilat arvotaan painotetusti opetusdatasta opittujen sääntöjen mukaisesti. Ensimmäisen asteen markovin ketjun kunkin tilan arvo riippuu vain edellisestä tilasta, tässä tapauksessa aiemmin generoidun datan viimeisestä kirjaimesta tms. Vastaavasti toisen asteen ketjun tila riippuu kahdesta viimeisimmästä tilasta generaatiossa.
Huomaa, että esimerkiksi toisen asteen Markovin ketjun toteuttaminen vaatii kaikkien opetusdatassa peräkkäin esiintyvien kolmikoiden ja niiden esiintymismäärien tallettamista, jotta tiedetään kullekin viimeisimmälle kaksikolle mahdolliset seuraajat ja niiden todennäköisyydet.

Kokeile generointia alkaen 1. asteesta, ja vertaa tuloksia eri asteilla. Seuraava kirjain, sana tai sävel arvotaan opetusdatasta opittujen todennäköisyyksien mukaan. Järkevien - tai hauskojen - lauseiden tuottamiseen tarvitaan minimissään toisen asteen Markovin ketju. Musiikkikin on 1-asteella tuotettuna aika satunnaista, vaikka noudattaa toki jotain sävellajia, kunhan opetusdata on ollut siinä suhteessa konsistenttia.

Musiikin tuottaminen. Aiemmissa projekteissa on musiikkidataa syötetty ohjelmalle MIDI-tiedostoina, Lilypond-nuotteina tai abc-notaationa. Python-kirjastossa music21 on monia hyödyllisiä välineitä. Musiikkia on tuotettu satunnaisesti jo paljon ennen tietokoneita, katso Musikalisches Würfelspiel. Myös geneettisillä algoritmeilla voi tuottaa taidetta. Algoritmissa tarvittavan kelpoisuus-funktion määritteleminen on kuitenkin vaikeaa.

Harjoitusdatan määrä. Jotta ei päädytä toistamaan opetusdataa sellaisenaan, pitää esim. 2-asteella generoitaessa olla niin paljon opittuja mahdollisia kolmen sanan / sävelen jonoja, että kahden edellisen perusteella voi kolmannen riittävän usein valita useammalla tavalla. Varsinkin tekstiä tuotettaessa tarvitaan paljon harjoitusdataa (kokonaisia kirjoja tms.). Jos tuotetaan musiikkia tai vaikka nimiä, riittää pienempi määrä opetusdataa, mutta silti niin paljon, että datan syöttäminen käsin olisi kohtuuttoman työlästä. Tarvitaan sopivaa dataa, joka muunnetaan automaattisesti ohjelman käyttämään muotoon.

Jos tämä aihe kiinnostaa, kannattaa jutella ohjaajan kanssa jo ennen työn aloittamista.

Hahmontunnistus

Tarkempi määrittely

Toteuta ohjelma, joka harjoitusdatan perusteella oppii tunnistamaan jotakin kuvia. Ohjelma lukee ensin harjoitusdatan, ja oppii sen perusteella tunnistamaan uusia, entuudestaan tuntemattomia kuvia. Alla muutama tarkempi aiheidea. Muutkin ovat mahdollisia (juttele ohjaajan kanssa).

Kasvojentunnistuksen voi toteuttaa esimerkiksi Eigenface:n avulla. Tähän aiheeseen vaaditaan vähintään kursseja lineaarialgebra ja matriisilaskenta 1+2 vastaavat tiedot. Jos käsitteet kovarianssimatriisi ja pääkomponenttianalyysi ovat tuttuja, ymmärrät varmaan tähän aiheeseen liittyvän matemaattisen teorian. Toteuta vaativia matriisilaskennan operaatioita itse.

Käsin kirjoitettujen numeroiden tunnistus. MNIST on tietokanta, jota käytetään paljon hahmontunnistusmenetelmien testaamiseen. Tällä kurssilla on numeroita luokiteltu esimerkiksi neuroverkoilla. Sovi ohjaajan kanssa mitä valmiita välineitä voit käyttää, jotta työmäärä on kohtuullinen. Joka tapauksessa neuroverkko vastavirta-algoritmeineen ym. toteutetaan itse.

Neuroverkkoja ennestään tuntemattomalle helpompi ratkaisu on muuntaa MNIST:in harmaasävykuvat mustavalkoisiksi ja käyttää k:n lähimmän naapurin menetelmää pistejoukkojen etäisyysmitoilla. Tällöin tuntematon kuva luokitellaan samaksi, kuin enemmistö sen k lähimmästä naapurista on. Näin voi myös saavuttaa niin hyvän luokittelutuloksen, että neuroverkoilla ei ole helppo päästä samaan. Artikkeli A Modified Hausdorff Distance for Object Matching kertoo muutamasta mahdollisesta etäisyysmitasta. Artikkelissa parhaaksi mainitun mitan D22 lisäksi kannattaa kokeilla ainakin mittaa D23 sellaisenaan ja ilman kerrointa 1/N osakaavassa d6.

Lisää materiaalia neuroverkoista:

Takaisinvirtausalgoritmin toteuksesta (backpropagation) kertova yksityiskohtainen video.
A step by step forward pass and backpropagation example - Rabindra Lamsalin kirjoittama artikkeli ns. feed forward verkosta ja sen treenaamisesta.
3Blue1Brownin erittäin hyvin tehdyt videot neuroverkoista.
Michael Nielsenin kirjoittama arikkeli MNISTin numeroiden tunnistuksesta neuroverkoilla.
Deep Learning oppikirja ns. syväoppimisesta. Huom vaikka syväoppiminen on “aidoissa” sovelluksissa useimmin käytetty tekniikka, on syväoppivan verkon toteuttaminen huomattavasti haastavampaa kuin tältä harjoitustyöltä vaaditaan.
Heli Tuomisen kirjoittama kurssimateriaali neuroverkkojen matematiikasta suomeksi.
Neuroverkkojen testauksesta kertova Sebastian Björkqvistin artikkeli.

Luolastojen generointi

Tarkempi määrittely

Toteuta ohjelma, joka luo jonkinlaisen luolaston, tai kartan dynaamisesti. Luolaston generointi voi olla joko etukäteen tapahtuva tai dynaamisesti pelin aikana pelaajan liikkumisen mukaan kehittyvä. Luolastoja tuotetaan useampivaiheisen prosessin kautta. Tällöin esim. yksi algoritmi voi tuottaa huoneita, toinen niiden väliset käytävät ja kolmas halutun kaltaisen ulkoasun. Ohjelmassa tulee olla vähintään yksi riittävän laaja algoritmi, joka ei kuulu kurssin esitietoihin, esimerkiksi jokin delaunay triangulaation suorittava algoritmi.

Hyödyllisiä Lähteitä:

Procedurally Generated Dungeons
Tom Stephensonin blogikirjoitus
Bowyer–Watson algoritmi delaunay triangulaatioiden laskemiseen.

Salaus ja tietoturva

Tietoturva on tänä päivänä tärkeämpää kuin koskaan. Salausta voi tehdä useilla eri tavoilla ja moniin käyttötarkoituksiin. Esim. RSA-salaus on harjoitustyöhön sopiva aihe.

Tarkempi määrittely

Toteuta ohjelma joka salaa ja purkaa tekstiä. Ohjelman tulee salaamisen ja salauksen purkamisen lisäksi tuottaa avaimia, joiden pituus on oikean RSA-salauksen tavoin vähintään 2048 bittiä. Käyttäjä voi antaa salattavaksi sen pituisen tekstin kuin avaimen pituus sallii. Paddingia ei tarvitse toteuttaa. Isojen alkulukujen etsimiseen ja avaimen muodostamiseen tarvittavat metodit, kuten Miller-Rabin algoritmi, tulee toteuttaa itse, mutta ohjelmointikielen valmista modulaarista potenssiin korotusta saa käyttää laskennassa. Miller-Rabin on hidas, ja esim.1024-bittisiä parittomia lukuja joutuu kokeilemaan keskimäärin satoja ennen kuin löytyy kaksi todennäköistä alkulukua (40 iteraatiota Miller-Rabinilla). Laske siksi etukäteen listaan esim. 500 pienintä alkulukua, ja kokeile ensin meneekö jako jollain niistä tasan. Vasta jos ei mene, annetaan tutkittava luku Miller-Rabinille. Tehokas algoritmi pienten alkulukujen laskentaan: https://en.wikipedia.org/wiki/Sieve_of_Eratosthenes

Tämän kurssin vaatimustasoa eivät vastaa sellaiset salausmenetelmät, jotka perustuvat yksittäisten sanojen tai koko tekstin merkkien paikan vaihtamiseen tai yksittäisten merkkien korvaamiseen aina jollain tietyllä merkillä.

Vaihtoehtoisesti voit toteuttaa ohjelman joka murtaa (eli purkaa tietämättä siihen tarvittavaa avainta) salauksia. Vaihtosalaukseen perustuvan salakirjoituksen saa murrettua sanaston avulla merkkien frekvenssejä analysoimalla, jos teksti on riittävän pitkä ja tiedetään mitä kieltä se on. Ratkaisuksi käy peruuttava haku, joka kokeilee korvata salattuja merkkejä siinä järjestyksessä, mitkä frekvenssien perusteella ovat luultavimpia. Sanaston talletukseen sopii trie-tietorakenne. Koska mikään sanasto ei ole täydellinen, pitää peruuttava haku toteuttaa niin, että hyväksytään tietty määrä virheellisiltä vaikuttavia sanoja.

Muita aiheita

Signaalinkäsittely (kuva, ääni)

Toteuta algoritmien vaativuudesta riippuen yksi tai useampi signaalinkäsittelyalgoritmi. Useat signaalinkäsittelyn algoritmit hyödyntävät matriisilaskentaa ja lineaarialgebraa, joten niiden tunteminen on hyödyksi. Ohjelman tulee tuottaa tuloste (visualisointi tai ääni), josta algoritmia tuntematonkin voi havaita ohjelman toimivan suunnilleen tarkoitetusti. Aiheena on aiemmin ollut esimerkiksi signaalin voimakkaimman taajuuden tunnistaminen ja / tai kohinansuodatus käyttäen nopeaa fourier-muunnosta.

Kontin pakkaus

Rahtifirma NopsaToimitus haluaa optimoida konttikuljetuksissa käytettävän tilan. Suunnittele miten voidaan täyttää yksi tai useampi kontti mahdollisimman tehokkaasti, jos tiedetään pakettien määrä ja koot. Tämä aihe vaatii kolmiulotteista konttien kuvaamista näytöllä, jotta lopputulosta voi arvioida.

Säännöllisten lausekkeiden tulkki tai kääntäjä

Toteuta tulkki, eli ohjelma joka sovittaa säännöllistä lauseketta merkkijonoon ja kertoo, kuuluuko se lausekkeen määräämään kieleen. Vaihtoehtoisesti voit toteuttaa kääntäjän, joka annetun säännölisen lausekkeen perusteella tuottaa DFA:n, joka hyväksyy samat merkkijonot, kuin lauseke.

Kirjoitusvirheiden korjaaja

Toteuta ohjelma, joka annettuna käyttäjän väärinkirjoitetun sanan ehdottaa sille oikeinkirjoitusta. Tälläinen ohjelma voidaan toteuttaa tallettamalla mahdollisia sanoja itse toteutettuun trie-tietorakenteeseen ja vertaamalla käyttäjän väärinkirjoitetun merkkijonon etäisyyttä oikein kirjoitettuihin sanoihin. Yksi tähän soveltuva etäisyysmitta on Damerau–Levenshtein -etäisyys josta lisää tietoa myös Geeks for Geeksin sivuilla.

Tieteellinen laskin

Toteuta laskin joka laskee annetun matemaattisen lausekkeen arvon, ja mahdollisesti sijoittaa sen muuttujaan, joita on käytettävissä riittävä määrä. Lauseke voi sisältää lukuarvoja, muuttujia, peruslaskutoimituksia ja sekä yhden (sqrt, sin) että kaksi parametria (min, max) saavia funktioita. Ohjelman tulisi antaa yksilöity virheilmoitus, jos käyttäjä syöttää virheellisen lausekkeen, ja erityisesti se ei saa ilmoittaa mitään arvoa lausekkeelle, jolle ei oikeasti voi laskea arvoa. Tälläinen ohjelma toteutetaan shunting-yard algoritmilla.

Korjauksia tälle sivulle

Tee korjausehdotus editoimalla tätä tiedostoa GitHubissa.

(Jos teet jo harjoitustyötä) Lue ensin moodle

Aiheen valinnasta

Lista aiheista

Verkot ja polunetsintä

Tarkempi määrittely

Hyödyllisiä neuvoja

Tiedon tiivistys

Tarkempi määrittely

Hyödyllisiä neuvoja

Pelit

Tarkempi määrittely

Ristinolla / Gomoku

Shakki

Connect4

Othello / Reversi

2048

Battle sheep

Pentago

Kivi-sakset-paperi

15-peli

Miinaharava

DPLL

Tarkempi määrittely

Hyödyllisiä neuvoja

DPLL (tulossa)

Tarkempi määrittely

Yksinkertainen klausuulin oppiminen

Hyödyllisiä neuvoja

Koneoppiminen

Laskennallinen luovuus

Tarkempi määrittely

Hyödyllisiä ohjeita

Hahmontunnistus

Tarkempi määrittely

Luolastojen generointi

Tarkempi määrittely

Salaus ja tietoturva

Tarkempi määrittely

Muita aiheita

Signaalinkäsittely (kuva, ääni)

Kontin pakkaus

Säännöllisten lausekkeiden tulkki tai kääntäjä

Kirjoitusvirheiden korjaaja

Tieteellinen laskin

Korjauksia tälle sivulle