Masinõpe: mittetehniline ülevaade

Masinõpe (machine learning) oli 2016. aastal haibitsükli tipus. Eesti on ses osas ilmselt veidi taga, aga Eesti masinõppe kokkusaamiste populaarsuse põhjal mitte väga kaugel. Tean oma (mitte ainult tehnoloogiaettevõtetes töötavate) tuttavate kaudu, et huvi selle suuna vastu on märkimisväärne.

Mis on masinõpe?

Wikipediast tõlkides: masinõpe on arvutiteaduse haru, mis annab arvutitele õppimisvõime ilma neid otseselt selleks programmeerimata. Kõige produktiivsem seletus ongi võrdlus programmeerimisega: kui tavalise IT-arenduse puhul teame nii soovitud tulemust (“leia kõige odavam võimalik lennukipilet soovitud päeval”) kui ka viisi selle saavutamiseks (“küsi andmebaasist kõik võimalikud piletid, järjesta hinna järgi kasvavalt ja kuva esimene tulemus”), siis masinõpe ründab tavaliselt selliseid probleeme, kus eesmärk on hästi teada (“leia pildil kõik näod”), aga isegi eksperdid ei oska väga hästi öelda, kuidas sinna jõuda.

Teine kasulik võrdlus on klassikalise statistikaga. Siin on piir hägusem – masinõpe asub arvutiteaduse ja statistika puutepunktis ja statistika on palju laiem ala kui masinõpe –, aga mulle tundub, et masinõpe on rohkem inseneri lähenemine. Mõtlen sellega, et masinõppes on põhiline edu indikaator mudeli kvaliteet (Mitu protsenti vähijuhtumitest suudame mikroskoobipildi pealt tuvastada? Kui suur osa meie väidetud vähihaigetest on tegelikult terved?), aga statistikas interpreteeritavus ja matemaatiline vettpidavus (Mille põhjal otsuse tegime? Kas kõik tehtud eeldused kehtivad?). Masinõpe aktsepteerib rohkem musta kasti stiili, kus kasti sisu pole nii oluline – peaasi, et see teeb, mida vaja.

Klassikaliselt jaotatakse masinõppe ülesanded kolmeks:

juhendatud õpe (supervised learning),
juhendamata õpe (unsupervised learning),
stiimulõpe (reinforcement learning).

Ülaltoodu on lühike väljavõte. Loe edasi originaalallikast: pungas.ee.