Avoin tiede:tutkimusaineistojen hallinta
tutkimusaineistojen hallinta

tutkimusaineistojen hallinta |
Tutkimusaineistojen hallinta on koko tutkimusprojektin ajan kestävä prosessi, jota havainnollistaa tutkimusaineiston elinkaarimalli. Malli kuvaa erilaisia aineistonhallinnan vaiheita, kuten suunnittelu, dokumentointi, suojaaminen, tallentaminen, avaaminen ja säilyttäminen. Tutkimusaineistojen vastuullinen hallinta noudattaa FAIR-periaatteita.
Aineistonhallinnan suunnittelu
Aineistonhallinnan suunnittelussa kuvataan aineiston keruun, tallentamisen, suojaamisen ja säilyttämisen vaiheet sekä huomioidaan aineiston käsittelyn edellyttämät lait ja ohjeet (esim. henkilötietojen käsittelyyn liittyvä lainsäädäntö). Suunnitellessa huomioidaan myös tekijänoikeuksien ja tekijyyden muodostuminen sekä sovitaan aineiston jatkokäytön ehdoista. Suunnittelussa hyödynnetään aineistonhallintasuunnitelmaa (data management plan, DMP)
Aineiston tallentaminen ja säilytys
Tallennus on tutkimusprojektin aikana tapahtuvaa lyhytaikaista tallentamista, kun tutkimusaineisto on aktiivisessa käytössä. Tutkimusaineistojen säilytyspaikan valintaan tulee kiinnittää erityistä huomiota: tutkimusorganisaatiot tarjoavat luotettavan, pitkäaikaisen ja tietoturvallisen tallennuspaikan (esim. korkeakoulujen verkkolevyasemat). Tallennuspaikan tietoturvallisuus on erityisen tärkeä sensitiivisen aineiston kohdalla.
Tutkimusaineiston säilytyksestä puhutaan silloin, kun aineistoja on tarkoitus säilyttää tutkimusprojektin jälkeen useita vuosia. Tyypillisiä tutkimusaineistojen säilytyspaikkoja ovat esimerkiksi korkeakoulujen omat tai tutkimusalakohtaiset datarepositoriot.
Tutkimusaineistot voivat olla staattisessa tai muuttuvassa muodossa: aineistokokonaisuus pysyy siten joko muuttumattomana tai vaihtoehtoisesti tutkimusaineistoa muodostuu lisää (karttuva/kumuloituva aineisto) tai siihen tehdään muutoksia takautuvasti (dynaaminen aineisto).
Aineiston dokumentointi
Tutkimusaineiston keräämisen, analysoinnin, säilyttämisen ja mahdollisen hävittämisen vaiheet dokumentoidaan tutkimusprosessin aikana. Dokumentaation pohjalta tutkimusaineistolle luodaan metatiedot, eli sen kontekstia, sisältöä ja rakennetta, hallintaa ja/tai käsittelyä sekä sen kokoamista kuvaavat ja tiivistetyt tiedot. Metatiedot mahdollistavat tutkimusaineiston löytymisen, tunnistamisen ja jatkokäytön.
Tutkimusaineiston kuvailua suositellaan tehtävän koko tutkimusprosessin ajan dokumentaatiota ja metatietoja täydentäen. Tämä parantaa kuvailun laatua ja mahdollistaa julkaistavan aineiston metatietojen koostamisen lopuksi ilman merkittävää lisätyötä. Dokumentointiin ja kuvailuun on olemassa sekä organisaatiokohtaisia, kansallisia että kansainvälisiä ohjeita ja työkaluja.
Metatietojen luominen toteuttaa FAIR-periaatteita: vaikka itse tutkimusaineistoa ei voisi avata, metatiedot voidaan yleensä julkaista avoimesti, mikä mahdollistaa tutkimusaineiston löydettävyyden.
Avaaminen ja jakaminen
Tutkimusaineiston jakamista voidaan tehdä jo tutkimushankkeen aikana, esimerkiksi tutkimusyhteistyössä. Aineiston jakamisen tulee olla suunniteltua siten, että kaikki osapuolet ovat tietoisia aineistoon liittyvistä oikeuksista ja vastuista: ketkä voivat editoida dataa, miten versiointia tehdään ja miten dataa voi käyttää. Sensitiivisen datan jakamiseen tutkimuskäytössä on olemassa erillisiä tietoturvallisia palveluita.
Tutkimusaineistojen avaamisessa suositellaan noudatettavan periaatetta ”niin avointa kuin mahdollista, niin suljettua kuin välttämätöntä.” Lähtökohtaisesti tutkimusaineistot pyritään avaamaan tutkimuksen verifiointia ja aineiston uudelleenkäyttöä varten ja tämä estetään vain perustellusta syystä. Tutkimusaineistojen avaamisessa suositellaan käytettävän avointa lisensointia, kuten CC-lisenssejä, joiden avulla voidaan määritellä aineistojen jatkokäytön ehdot.
Tutkimusaineistojen avaaminen ja julkaiseminen ovat erillisiä prosesseja, vaikka niissä on paljon yhteistä. Julkaistulla aineistolla voidaan viitata tieteellisen artikkelin yhteydessä julkaistuun aineistoon tai vertaisarvioituihin datajulkaisuihin. Julkaiseminen tekee tutkimusdatasta viitattavan aineiston, jolla on pysyvä tunniste ja viittausohje. Julkaistu data on dokumentoitu huolellisesti ja vähintään sen löytämisen mahdollistava metatieto on julkaistu. Tutkimusaineistot avataan datarepositorioissa, jonne ne on tallennettu.
Aineiston pitkäaikaissäilytys tai tuhoaminen
Tutkimusaineistojen pitkäaikaissäilyttäminen on tutkimuksen aikaisesta tallennuksesta erillinen prosessi, jonka tavoitteena on digitaalisten aineistojen säilyminen käytettävässä muodossa kymmeniä tai jopa satoja vuosia eteenpäin. Pitkäaikaissäilytykseen laitetaan tyypillisesti tutkimuksen kannalta arvokkaita aineistoja uudelleenkäyttöä varten. Pitkäaikaissäilyttäminen voidaan käsittää myös aineistojen arkistointina, mutta koska arkistointitoimintaa säädellään laissa, on tutkimusaineistojen kohdalla selkeämpi puhua säilytyksestä tai pitkäaikaissäilytyksestä.
Usein tutkimusaineistoa ei ole tarkoituksenmukaista tai mahdollista säilyttää kokonaisuudessaan, jolloin aineisto tai sen osa täytyy hävittää tietoturvallisesti. Jos tutkimusaineisto sisältää informaatiota, jota ei ole mahdollista säilyttää (esim. sensitiivinen aineisto, henkilötiedot, joiden käsittelyperuste on päättynyt), nämä aineiston osat tai aineisto kokonaisuudessaan täytyy hävittää tietoturvallisesti ja peruuttamattomasti.Erikieliset vastineet
research data management | englanti (English) |
Lähikäsitteet
- tutkimusaineisto (yläkäsite)
Käytetyt lähteet
Tutkimusaineistojen ja -menetelmien avoimuus 2021, Aineistonhallinnan käsikirja, Tutkimusdata tieteellisenä julkaisuna, Tutkimuksen datanhallinnan viitearkkitehtuuri 2030
Alaviitteet
Lähdeviittaus tähän sivuun:
Tieteen termipankki 18.7.2025: Avoin tiede:tutkimusaineistojen hallinta. (Tarkka osoite: https://tieteentermipankki.fi/wiki/Avoin tiede:tutkimusaineistojen hallinta.)