Siin on info blogide, materjalide ja ettevõtete kohta, mis on kuidagi seotud Eesti ja andmeteadusega. Kõik nimekirjad on tähestikulises järjekorras.

Kui tahad midagi lisada või paranduse teha, vaata siia.

Masinõppe sõnastik

Eestikeelsed vasted erinevatele masinõppe terminitele.

Projektiideed

Ideed põnevate praktiliste projektide jaoks.

Kommuunid

  • Data Science Estonia Facebooki grupp – siin jagatakse (inglise keeles ja tüüpiliselt vähem kui kord nädalas) Eesti andmeteadusega seonduvaid üritusi, uudiseid, tööpakkumisi ja nõu.
  • Machine Learning Estonia meetup.com grupp – ligikaudu kord kahe kuu tagant toimub kokkusaamine, kus peetakse ettekandeid erinevatel masinõppega seonduvatel teemadel (vt varasemate kohtumiste sisu siit).
  • Tallinn.ai kommuun – kord kvartalis toimub kokkusaamine, kus peetakse ettekandeid tehisintellekti ja masinõppe rakenduslikust poolest.
  • Garage48 Open & Big Data häkatonid on hea viis 48 tunni jooksul tiimiga mõni andmeteaduse projekt valmis teha.

Blogid

  • Analüüsiait – TÜ majandusteaduskonna lõpetanud modelleerijate algatatud blogi, et majandusanalüüse ja nendega seonduvat avaldada. Küllaltki kvantitatiivne; postitatakse üsna ebaregulaarselt, paar korda aastas.
  • andmeteadus.ee blogi – siit leiab üldiseid andmeteaduse teemalisi postitusi, näidisanalüüse tõlgendustega, kommentaare teiste projektide kohta ja muudki. Lugejalt suurt tehnilist taiplikkust ei eelda ja on kirjutatud üsna hästi arusaadavalt tavainimesele. Kirjutab Kristjan Eljand keskmiselt kord kuus (üsna ebaregulaarse graafikuga).
  • datasci.ee blogi agregeerib mujal andmeteaduse kohta postitatavat sisu ning on koht, kus huvilised saavad üksikuid andmeteaduse alaseid postitusi avaldada ilma uut blogi alustamata.
  • pungas.ee – Taivo Pungase blogi, mis aeg-ajalt käsitleb andmeteadust puudutavaid teemasid (näiteks graafikute tegemist). Uus postitus kord nädalas.
  • stat24.ee – põnevad autori enda läbiviidud andmeanalüüsid koos ilusate visualiseeringutega. Teemad on enamasti Eestiga seotud ja ulatuvad päevakajalistest (valimised, Veerpalu doping) üldisteni (netikommentaarid, postiindeksid, karjäärivalikud). Kirjutab Tanel Pärnamaa kord paari kuu tagant.
  • Statistikablogi – siin kirjutab Statistikaamet erinevatest Eesti rahvastikku, majandust jpt aspekte puudutavatest andmetest. Tegu on natuke klassikalisema kirjeldava statistikaga, aga kommentaarid ja analüüs on asjalikud.
  • Welcome to data science – tegu on küll inglisekeelse blogiga, aga autorid (Lauri Koobas ja Valdar Tammik) on eestlased. Teemad osalt tehnilised (andmeanalüüs R-is), aga ka kommentaarid veebikursuste, huvitavete artiklite/videote, tööpakkumiste jm kohta. 2015. aastal on seni ilmunud 4 postitust.

Kursused ja materjalid

Eesti keeles

Praegu eesti keeles eriti palju materjale ei ole. Ainuke on kursus Statistiline andmeteadus ja visualiseerimine (2015, 2016, 2017), mille korraldamisega alustasid Tartu Ülikoolis Kaspar Märtens ja Tanel Pärnamaa ning jätkasid Mark Gimbutas ja Siim Viigand. Kõik õppematerjalid (v.a. mõned konfidentsiaalsed andmehulgad) on avalikud (vt GitHubist).

Kursus on põnev selle poolest, et aines toimuvadki ainult praktikumid (mille täpsed juhised on aine kodulehel kättesaadavad!) ja loengute asemel on viited erinevatele huvitavatele videotele ja artiklitele. Käsitletakse andmete kraapimist, puhastamist, analüüsi, visualiseerimist jm. Peamised märksõnad: R, knitr, dplyr, ggplot2, shiny, rvest.

Inglise keeles

Tartu ülikooli arvutiteaduse instituudi inglisekeelses informaatika magistriõppekavas võimalik spetsialiseeruda andmekaevele. Enamiku kursuste materjalid on avalikult kättesaadavad; muuhulgas õpetatakse kursusi Data Mining, Machine Learning ja on õpetatud erikursusi Reinforcement Learning ja Unsupervised Learning.

Tahtmise korral leiab palju andmeteaduse-teemalisi ja seotud inglisekeelseid kursuseid erinevatest MOOC-ide keskkondadest (Coursera, edX, Udacity jt) ja ülikoolide endi kodulehtedelt – näiteks siin on (inglisekeelne) nimekiri, kuidas alustada.

Andmestikud

Järgnev nimekiri põhineb Tartu tõepõhjahäkatoni korraldajate kogutud nimekirjal.

Eestis tegutsevad asutused

Siin on asutused, mis ei taotle tulu ja tegelevad mingil viisil andmeteadusega.

Eestis tegutsevad ettevõtted

Siin on ettevõtted, mis mingil viisil kasutavad oma tegevuses andmeteadust (ja potentsiaalselt palkavad inimesi, kes sellega tegelevad).

  • Adcash – kuuldavasti analüüsitakse seal reklaamiandmeid.
  • andmeteadus.ee on (vist Eesti esimene ja ainuke) puhtalt andmeteaduse konsultatsioonile suunatud ettevõte.
  • Bondora on otsinud inimesi oma laienevasse andmeteaduse tiimi (allikas: meil TÜ kinnisesse meililisti).
  • Centar kasutab majandusanalüüside tegemisel ka kvantitatiivseid meetodeid.
  • Datafruit tegelevad andmete laadimise, analüüsi ja raporteerimise alase konsultatsiooniga.
  • DataMe koondab eraisikute maksekäitumist ja laene puudutavaid andmeid ning tegeleb nende andmete töötlemisega.
  • DigiVikings rakendab andmekaevet ja masinõpet ärianalüütikas.
  • Eesti Energia Energiamüügi alaüksuses analüüsitakse “klientide liikumist, klientide profiilide segmenteerimist ja tulevikutehingute hinnastamist” (allikas: praktikapakkumine tudengitele).
  • Funderbeam analüüsib idufirmasid ja tegeleb andmeteadusega.
  • Inforegister on otsinud oma tiimi andmeteadurit (2016).
  • Jobbatical kausutab oma andmeid erinevates peamiselt soovitustega(kasutaja-tööpakkumine ja vastupidi) seotud probleemides.
  • Mooncascade‘is on kasvav andmeteaduse üksus, mis tegeleb andmeanalüüsi tellimuslahendustega.
  • Neste on otsinud oma tiimi andmeteadlast (2016).
  • Nortal on otsinud andmeteadlast oma Omaani kontorisse (2015).
  • Planet OS tegeleb geoandmete infrastruktuuri ja analüüsiga.
  • Proekspert tegeleb tarkade seadmete ning ärianalüüsiga.
  • SIFR tegeleb andmeteaduse konsultatsiooni ja arendusteenuse pakkumisega ettevõtetele.
  • Skype‘is tehakse andmeteadust erinevates tiimides – näiteks kõne kvaliteedi parandamiseks, aga ka pettuse vältimise ja maksete osas.
  • STACC lahendab ettevõtete andmeanalüüsi ülesandeid, näiteks personaalmeditsiini, tekstikaeve ja äriprotsesside optimeerimise alal.
  • Starship kasutab masinõpet, et isesõitvaid pakiroboteid kontrollida.
  • Swedbanki Customer Value Management ärisuuna all on 6 inimesega andmeanalüüsi osakond.
  • Taxify teeb andmeteadust erinevate kaardi- ja kasutajaandmete peal.
  • Teleport.org kasutab maakera erinevaid andmekihte, et aidata inimestel optimeerida oma elukohta.
  • Telia on otsinud oma tiimi “analüütik-andmekaevurit” (2016).
  • Titanium Systemsis töötab vähemalt üks andmeteadlane autorendiga seotud andmete kallal.
  • TransferWise‘is otsitakse aeg-ajalt andmeteadlase profiilile vastavaid inimesi Growth Analysti nime all kliendibaasi analüüsima ja kasvatama.
  • Xpressomics ja Quretec teevad rohkem teadusega (bioinformaatika ja terviseandmetega) seotud andmekaevet.