Aineistot hallintaan yhteistyössä

Yliopistossamme on käynnistynyt Aineistot haltuun –hanke, jonka tavoitteena pähkinänkuoressa on ensin opettaa yliopisto tarjoamaan tutkijoille riittävät työkalut, tuki ja prosessit aineistojen hallintaan ja sen jälkeen tarjota ne työkaluiksi tutkijoille.

Viime vuosina rahoittajien vaatimukset hankkeissa syntyvien aineistojen hallinnalle ovat kasvaneet ja suurin osa tutkijoistamme onkin tutustunut Tuuli -työkaluun, jolla on laadittu aineistonhallintasuunnitelmia liitteiksi esimerkiksi Suomen Akatemian rahoitushakemuksiin. Todellisuudessa edellytykset sekä laatia että ennen kaikkea toteuttaa aineistonhallintasuunnitelmia ovat olleet suomalaisissa yliopistoissa heikot. Nyt tarkoitus on nostaa työkalut ja edellytykset tasolle, jota 2020-luvun tieteeltä vaaditaan. Näin vastaamme EU:n uusiin vaatimuksiin tieteen avoimuudesta ja datan jakamisestä sekä sillä meritoitumisesta.

Tiedemaailma liikkuu vääjäämättä kohti avoimen tieteen mallia, jossa mahdollisimman paljon julkaisuja, dataa ja muuta materiaalia pyritään julkaisemaan niin avoimesti kuin käytännöllisesti on kunkin aineiston kohdalla mahdollista.

Tiedemaailma liikkuu vääjäämättä kohti avoimen tieteen mallia, jossa mahdollisimman paljon julkaisuja, dataa ja muuta materiaalia pyritään julkaisemaan niin avoimesti kuin käytännöllisesti on kunkin aineiston kohdalla mahdollista. Tämä mahdollistaa tutkimuksesta yhä suuremman osan tekemisen jo olemassa olevilla aineistoilla, laajemmat ja löydettävämmät yhteistyöverkostot sekä meritoitumisen julkaisujen ohella aineistojen kautta. Vaivalla kootuista aineistoista voi saada tunnustusta myös muiden tekemän analyysin ja julkaisujen myötä! Samalla tiede muuttuu läpinäkyvämmäksi ja helpommin arvioitavaksi.

Aineistojen ja datan kannalta tämä näyttäytyy tarpeena koota sekä ennen kaikkea tallentaa ja dokumentoida niitä hallitummin. Aineistot täytyykin jo niiden keruuvaiheessa suunnitella ja dokumentoida niin, että muut tieteentekijät kykenevät niitä käyttämään ja hyödyntämään. Monille tutkijoille, allekirjoittanut mukaan lukien, tuttua on satunnaisilta vaikuttavien muistiinpanojen ja Excel-taulukoiden säilyttäminen monenkirjavilla muistitikuilla tai verkkolevyasemien syövereissä. Muun tiedemaailman silmissä tällainen aineisto ei kuitenkaan ole olemassa. Muille näkyväksi se tulee vasta, kun (meta)tieto siitä on olemassa ja itse aineisto tallessa. Jotain tästä kertoo, että eri yliopistoille tehdyissä aineistokartoituksissa suuretkin yliopistot ovat löytäneet tiedot vain kourallisesta aineistoja, kun näitä todellisuudessa on varmasti tuhansittain.

Työkalut ajan tasalle

Tilanteesta ei voi syyttää tutkijoita, jotka joutuvat tekemän työtään satunnaisten työsuhteiden ja vaihtelevien työkalujen parissa. Valtaosassa yliopistoja aineistojen omistajuuskin on epäselvä ja aineiston säilyttämiseen on tarjolla 1990-lukulaista verkkolevytekniikkaa, joka ei mahdollista kunnollista ryhmätyöskentelyä. Kirsikkana kakussa levypinta jää työnantajan vaihtuessa vanhan työnantajan varastoihin ja vaatii tutkijalta ulkoisten, usein kotikutoisten ratkaisujen käyttöä. Itse tutkijoiden lisäksi myös yliopistoilta puuttuvat työkalut metatietojen hallintaan.

Kehityksen alla on uusi pilvipohjainen järjestelmä aineistojen tallentamiseen, jossa niiden säilyttäminen, käsittely ja jakaminen ovat yhtä helppoa kuin esimerkiksi Dropboxissa tai Google Drivessä.

Nyt alkaneen hankkeen myötä Jyväskylän yliopistossa tilanne korjataan. Kehityksen alla on uusi pilvipohjainen järjestelmä aineistojen tallentamiseen, jossa niiden säilyttäminen, käsittely ja jakaminen ovat yhtä helppoa kuin esimerkiksi Dropboxissa tai Google Drivessä.

Tähän yhteyteen pyritään kytkemään järjestelmä, jossa uuden aineiston keruun aloittaessaan tutkija tuottaisi yliopiston omaan aineistokatalogiin yksinkertaiset metatiedot (tiedot datan ominaisuuksista, kuten omistaja, tekijä, tieteenala, aihe, jne.) – hyödyntäen tietysti yliopiston järjestelmissä jo olevia tietoja. Tutkijan halutaan tässä vaiheessa kohtaavan tarpeen hahmottaa aineiston ominaisuuksia, tarpeita ja elinkaarta, jotta yliopisto osaa tämän aineiston kohdalla palvella tutkijaa parhaalla mahdollisella tavalla ja jotta aineisto luodaan mahdollisimman laadukkaan tutkimuksen mahdollistavaksi. Kun aineisto valmistuu tai siitä osa halutaan ”jäädyttää” ja julkaista, tuotetaan loput kokonaisuuteen liittyvät metatiedot ja lisätään aineistoa dokumentoivat tiedot pakettiin. Tässä vaiheessa aineisto saa pysyvän tunnisteen ja sen metatiedot (ja mahdollisesti itse aineisto) voidaan julkaista sekä paikallisissa, kansallisissa että kansainvälisissä järjestelmissä muutamalla napinpainalluksella.

Tutkijalle tämä näyttäytyy metatietojen tuottamisen ja uuden tallennusjärjestelmän lisäksi mahdollisesti tarpeena tehdä aineistotyö systemaattisemmin sekä ennen kaikkea dokumentoida sitä laajemmin. Aineistot pitää pystyä keräämään alusta alkaen pitäen mielessä niiden luettavuus, käytettävyys ja ymmärrettävyys. Tämä tarkoittaa myös tutkimuksen aikaista aineistojen tuottamisen/keruun dokumentointia.

Monille tutkijoille nämä ovat jo arkipäivää, mutta lopuille se tulee näyttäytymään merkittävästi laadukkaampien aineistojen kokoamisena, jotka mahdollistavat paremman tutkimuksen ja toisaalta meritoitumisen laadukkaiden, löydettävien ja käytettävien aineistojen kautta. Kysymys on 2020-luvun tutkimuksen tavoille opettelemisesta, jota henkii jo englantilaisen jättirahoittaja Wellcome Trustin ohjeistus, jossa hakemuksiin ei listatakaan julkaisuja vaan merkittävät tutkimukselliset kontribuutiot, jotka sisältävät myös aineistoja.

Tulemme laitoksille tutustamaan niiden erityistarpeisiin aineistojen osalta. Samalla IT-palveluissa jatketaan pilvialustan testaamista ja toivottavasti pikaista käyttöönottoa.

Tavoitteenamme on luoda hyvät prosessit ja palvelut, jotka helpottavat tutkijoiden työtä ja tuottavat niin paljon lisäarvoa, ettei pieni vaiva työkulttuurin kevyistä muutoksista jää vaivaamaan.

Hymyillään kun tavataan! Muistakaa antaa palautetta ja ideoita aiheeseen liittyen.

Juuso Marttila
Projektipäällikkö
Avoimen tiedon keskus, Aineistot haltuun –hanke