Avoin tiede:koneluettavuus

    Tieteen termipankista

    koneluettavuus

    Tämä sivu on vielä tarkistamatta
    koneluettavuus
    Määritelmä se, että tieto on rakenteistettu siten, että kone pystyy käsittelemään tietoja
    Selite Pilkku- tai sarkaineroteltu data sopii parhaiten taulukkomuotoisen tiedon tai nimi-arvoparien julkaisemiseen. Etuna on, että lähes jokaiselta tietokoneelta löytyy taulukkolaskentaohjelma, jolla tällaiset tiedostot voidaan avata tutustuttaviksi ja muokattaviksi. Monimutkaisempien tietorakenteiden esittämiseen esimerkiksi XML, JSON ja RDF ovat yleisen tason standardeja. Parhaimmillaan koneluettava tieto on yksilöity pysyvillä tunnisteilla, kuten urleilla, joita voi linkittää muihin lähteisiin esimerkiksi ontologioiden avulla. Esimerkiksi verkkosivuilla merkintäkielenä käytettävä HTML soveltuu hyvin asiakirjojen rakenteen kuvailuun (mikä on otsikkoa ja mikä leipätekstiä), mutta itse tietosisältöä se ei tarjoa koneluettavassa muodossa. Esimerkiksi jos kunnan verkkosivuilla luetellaan kaikkien kirjastojen osoitteet ja aukioloajat on ihmisen helppo löytää haluamansa tieto sivuilta, mutta koneellisesti on vaikea erottaa osoitteita, aukioloaikoja ja muuta sivuilta löytyvää informaatiota toisistaan. Koneluettavuuden näkökulmasta on pystyttävä yhdistämään eri ainestojen metatiedot, jotta koneellisesti voidaan todeta, kirjastojen «osoitteiden» olevan verrannollisia «katuosoitteeseen» uimahalleista puhuttaessa. Aina tietueiden yhdistäminen (harmonisoiminen) ei kuitenkaan ole näin suoraviivaista. Hyvän esimerkin tarjoavat työttömyysluvut, jotka Tilastokeskus ja työ- ja elinkeinoministeriö laskevat eri tavalla. Näitä lukuja ei voida helposti yhdistää.

    Erikieliset vastineet

    maskinläsbarhetruotsi (svenska)

    Käytetyt lähteet

    ATT-sanasto

    Alaviitteet

    Lähdeviittaus tähän sivuun:
    Tieteen termipankki 14.4.2024: Avoin tiede:koneluettavuus. (Tarkka osoite: https://tieteentermipankki.fi/wiki/Avoin tiede:koneluettavuus.)