Datatiede

Wikipediasta
Siirry navigaatioon Siirry hakuun

Datatiede (engl. data science) on erilaisten aineistojen analysointimenetelmiä käsittelevä tieteenala.[1] Datatiede yhdistää ongelman määrittelyn, algoritmien ja prosessien joukon, jolla voidaan analysoida aineistoa käytännöllisten näkemysten eristämiseksi suurista aineistojoukoista. Datatiede käsittelee sekä rakenteellista että rakenteetonta aineistoa ja omaksuu periaatteita monilta aloilta kuten koneoppimisesta, tilastotieteestä, dataetiikasta ja -sääntelystä ja suurteholaskennasta.[2]

Helsingin yliopistossa on datatieteen maisteriohjelma.[3]

Datatieteen käyttökohteisiin kuuluu sen selvittäminen, voiko ongelmaan vastata olemassa olevalla tiedolla, eikä se kohdistu niinkään tiedon määrään tai käytettäviin työkaluihin.[4] Eräät suosituimmat datatieteen menetelmät tulevat koneoppimisesta.[5]

Datatiede ei ole sama kuin informaatiotutkimus.

Datatiede käsittää joukon periaatteita, ongelman määrittelyjä ja prosesseja, joilla eristetään ilmeisistä poikkeavia ja hyödyllisiä hahmoja suurista tietoaineistoista. Datatiede liittyy läheisesti tiedonlouhintaan ja koneoppimiseen, mutta on näitä laajempi. Datatieteen tavoite on parantaa päätöksentekoa perustamalla päätökset suurista tietoaineistoista eristettyihin näkemyksiin.[6]

  • Kelleher, John D. & Tierney, Brendan (suom. Pietiläinen, Kimmo): Datascience (suom. Datatiede), s. 7. Terra Cognita, 2018 (2021). ISBN 978-952-7367-11-7
  1. https://www.helsinki.fi/fi/uutiset/datatiede
  2. Kelleher & Tierney 2018, s. 228
  3. Da­ta­tie­teen mais­te­rioh­jel­ma, fi­lo­so­fian mais­te­ri (2 v) helsinki.fi. Arkistoitu Viitattu 16.11.2019.
  4. Jeff Leek: The key word in "Data Science" is not Data, it is Science simplystatistics.org. 12.12.2013. Arkistoitu 21.8.2018. Viitattu 24.9.2019. (englanniksi)
  5. Data Science: Machine Learning edx.org. Viitattu 16.10.2019. (englanniksi)
  6. Kelleher & Tierney 2018, s. 7

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]