Scikit-learn -aloitusohje koneoppimisen kokeiluiden tekoon Python-ohjelmointikielellä
Koneoppiminen (machine learning) on menetelmäperhe, jonka avulla määrämittaisesta datasta pyritään mekaanisesti, eri algoritmien avulla, opettamaan tai johtamaan samantyyppisen (uuden) aineiston havaintoyksiköitä luokittelevia tai kuvailevia malleja. Tämä aloitusohje kertoo, kuinka päästä alkuun koneoppimisen kokeiluissa Python-kielellä, scikit-learn –kirjastoa käyttäen. Ohje on tuotettu osana AI-lähettiläs -hanketta. AI-lähettiläs -hanke on Tampereen ammattikorkeakoulun ja Turun yliopiston kauppakorkeakoulun yhteinen ESR-hanke, joka auttaa yritysten avainhenkilöiden kehittymistä tekoälyn ja data-analytiikan hyödyntämisessä. Hankkeen rahoittajana toimii Suomen rakennerahasto-ohjelma Kestävää kasvua ja työtä 2014–2020. Nimensä mukaisesti, tässä dokumentissa tutustutaan vain kirjaston minimaaliseen peruskäyttöön: Sovelluksen toiminnoista käsitellään siis vain pieni osa, eikä Python-ohjelmoinnin edistyneempiä piirteitä, tai tiedonlouhinnan tai koneoppimisen teoriaa juuri esitellä.