Avoin tiede:koneluettavuus
koneluettavuus
Tämä sivu on vielä tarkistamatta
koneluettavuus |
Määritelmä
se, että tieto on rakenteistettu siten, että kone pystyy käsittelemään tietoja
Selite
Pilkku- tai sarkaineroteltu data sopii parhaiten taulukkomuotoisen tiedon tai nimi-arvoparien julkaisemiseen. Etuna on, että lähes jokaiselta tietokoneelta löytyy taulukkolaskentaohjelma, jolla tällaiset tiedostot voidaan avata tutustuttaviksi ja muokattaviksi. Monimutkaisempien tietorakenteiden esittämiseen esimerkiksi XML, JSON ja RDF ovat yleisen tason standardeja. Parhaimmillaan koneluettava tieto on yksilöity pysyvillä tunnisteilla, kuten urleilla, joita voi linkittää muihin lähteisiin esimerkiksi ontologioiden avulla. Esimerkiksi verkkosivuilla merkintäkielenä käytettävä HTML soveltuu hyvin asiakirjojen rakenteen kuvailuun (mikä on otsikkoa ja mikä leipätekstiä), mutta itse tietosisältöä se ei tarjoa koneluettavassa muodossa. Esimerkiksi jos kunnan verkkosivuilla luetellaan kaikkien kirjastojen osoitteet ja aukioloajat on ihmisen helppo löytää haluamansa tieto sivuilta, mutta koneellisesti on vaikea erottaa osoitteita, aukioloaikoja ja muuta sivuilta löytyvää informaatiota toisistaan. Koneluettavuuden näkökulmasta on pystyttävä yhdistämään eri ainestojen metatiedot, jotta koneellisesti voidaan todeta, kirjastojen «osoitteiden» olevan verrannollisia «katuosoitteeseen» uimahalleista puhuttaessa. Aina tietueiden yhdistäminen (harmonisoiminen) ei kuitenkaan ole näin suoraviivaista. Hyvän esimerkin tarjoavat työttömyysluvut, jotka Tilastokeskus ja työ- ja elinkeinoministeriö laskevat eri tavalla. Näitä lukuja ei voida helposti yhdistää.
Erikieliset vastineet
maskinläsbarhet | ruotsi (svenska) |
Käytetyt lähteet
Alaviitteet
Lähdeviittaus tähän sivuun:
Tieteen termipankki 21.12.2024: Avoin tiede:koneluettavuus. (Tarkka osoite: https://tieteentermipankki.fi/wiki/Avoin tiede:koneluettavuus.)