Avoin tiede:koneluettavuus

  Tieteen termipankista

  koneluettavuus

  Tämä sivu on vielä tarkistamatta
  koneluettavuus
  Määritelmä se, että tieto on rakenteistettu siten, että kone pystyy käsittelemään tietoja
  Selite Pilkku- tai sarkaineroteltu data sopii parhaiten taulukkomuotoisen tiedon tai nimi-arvoparien julkaisemiseen. Etuna on, että lähes jokaiselta tietokoneelta löytyy taulukkolaskentaohjelma, jolla tällaiset tiedostot voidaan avata tutustuttaviksi ja muokattaviksi. Monimutkaisempien tietorakenteiden esittämiseen esimerkiksi XML, JSON ja RDF ovat yleisen tason standardeja. Parhaimmillaan koneluettava tieto on yksilöity pysyvillä tunnisteilla, kuten urleilla, joita voi linkittää muihin lähteisiin esimerkiksi ontologioiden avulla. Esimerkiksi verkkosivuilla merkintäkielenä käytettävä HTML soveltuu hyvin asiakirjojen rakenteen kuvailuun (mikä on otsikkoa ja mikä leipätekstiä), mutta itse tietosisältöä se ei tarjoa koneluettavassa muodossa. Esimerkiksi jos kunnan verkkosivuilla luetellaan kaikkien kirjastojen osoitteet ja aukioloajat on ihmisen helppo löytää haluamansa tieto sivuilta, mutta koneellisesti on vaikea erottaa osoitteita, aukioloaikoja ja muuta sivuilta löytyvää informaatiota toisistaan. Koneluettavuuden näkökulmasta on pystyttävä yhdistämään eri ainestojen metatiedot, jotta koneellisesti voidaan todeta, kirjastojen «osoitteiden» olevan verrannollisia «katuosoitteeseen» uimahalleista puhuttaessa. Aina tietueiden yhdistäminen (harmonisoiminen) ei kuitenkaan ole näin suoraviivaista. Hyvän esimerkin tarjoavat työttömyysluvut, jotka Tilastokeskus ja työ- ja elinkeinoministeriö laskevat eri tavalla. Näitä lukuja ei voida helposti yhdistää.

  Erikieliset vastineet

  maskinläsbarhetruotsi (svenska)

  Käytetyt lähteet

  ATT-sanasto

  Alaviitteet

  Lähdeviittaus tähän sivuun:
  Tieteen termipankki 14.4.2024: Avoin tiede:koneluettavuus. (Tarkka osoite: https://tieteentermipankki.fi/wiki/Avoin tiede:koneluettavuus.)