Datatiede
Datatiede (engl. data science) on erilaisten aineistojen analysointimenetelmiä käsittelevä tieteenala.[1] Datatiede yhdistää ongelman määrittelyn, algoritmien ja prosessien joukon, jolla voidaan analysoida aineistoa käytännöllisten näkemysten eristämiseksi suurista aineistojoukoista. Datatiede käsittelee sekä rakenteellista että rakenteetonta aineistoa ja omaksuu periaatteita monilta aloilta kuten koneoppimisesta, tilastotieteestä, dataetiikasta ja -sääntelystä ja suurteholaskennasta.[2]
Helsingin yliopistossa on datatieteen maisteriohjelma.[3]
Datatieteen käyttökohteisiin kuuluu sen selvittäminen, voiko ongelmaan vastata olemassa olevalla tiedolla, eikä se kohdistu niinkään tiedon määrään tai käytettäviin työkaluihin.[4] Eräät suosituimmat datatieteen menetelmät tulevat koneoppimisesta.[5]
Datatiede ei ole sama kuin informaatiotutkimus.
Tutkimusala
[muokkaa | muokkaa wikitekstiä]Datatiede käsittää joukon periaatteita, ongelman määrittelyjä ja prosesseja, joilla eristetään ilmeisistä poikkeavia ja hyödyllisiä hahmoja suurista tietoaineistoista. Datatiede liittyy läheisesti tiedonlouhintaan ja koneoppimiseen, mutta on näitä laajempi. Datatieteen tavoite on parantaa päätöksentekoa perustamalla päätökset suurista tietoaineistoista eristettyihin näkemyksiin.[6]
Lähteet
[muokkaa | muokkaa wikitekstiä]- Kelleher, John D. & Tierney, Brendan (suom. Pietiläinen, Kimmo): Datascience (suom. Datatiede), s. 7. Terra Cognita, 2018 (2021). ISBN 978-952-7367-11-7
Viitteet
[muokkaa | muokkaa wikitekstiä]- ↑ https://www.helsinki.fi/fi/uutiset/datatiede
- ↑ Kelleher & Tierney 2018, s. 228
- ↑ Datatieteen maisteriohjelma, filosofian maisteri (2 v) helsinki.fi. Arkistoitu Viitattu 16.11.2019.
- ↑ Jeff Leek: The key word in "Data Science" is not Data, it is Science simplystatistics.org. 12.12.2013. Arkistoitu 21.8.2018. Viitattu 24.9.2019. (englanniksi)
- ↑ Data Science: Machine Learning edx.org. Viitattu 16.10.2019. (englanniksi)
- ↑ Kelleher & Tierney 2018, s. 7