Liikuntatieteellisen tiedekunnan aineistonhallinnan parhaita käytäntöjä kehittämässä

Jyväskylän yliopiston liikuntatieteellinen tiedekunta toteuttaa vuoden 2022 aikana datastrategiatyötä, joka tähtää tiedekunnan tutkimuksessa tuotettavien uusien tutkimusaineistojen keruukäytäntöjen harmonisointiin ja itse aineistojen mahdollisimman monipuoliseen käytettävyyteen.

Tavoitteena on tutkimuskentässä meneillään olevien muutosten ennakointi ja niihin vastaaminen. Esimerkiksi tiivistyvä kansainvälinen tutkimusyhteistyö edellyttää sitä, että aineistoja voidaan jakaa kansallisten tietosuojalainsäädäntöjen rajojen yli kestävällä tavalla.

 

”Tasokkaat julkaisusarjat myös edellyttävät niissä ilmestyviltä julkaisuilta yhä laajempien aineistojen käyttöä”, toteaa datastrategiaa koordinoiva akatemiatutkija Elina Sillanpää.

Aineistojen jatkokäyttö on omassa yliopistossa ja kansainvälisten kumppanien kesken on helpompaa, jos aineistojen keruu on suunniteltu ja aineistot koottu yhtenäisten periaatteiden mukaan. Ihannetapauksessa aineistojen muuttujat on kerätty samoja menetelmiä ja protokollia hyödyntäen ja ne ovat täysin yhdistettävissä.

Parhaimmillaan tutkimusaineistot muodostavat varannon, josta voidaan jatkossa johtaa yhä monipuolisempia jatkotutkimuskysymyksiä ja analyysejä. Tämä edellyttää tiedekunnassa tuotettavien aineistojen suunnitelmallista hallintaa ja siihen sovittua yhteistä toimintamallia.

Aloite datastrategiasta kumpusi vuonna 2021 tiedekunnan teemaryhmistä. Ryhmät ovat järjestäytyneet tiedekunnan toiminnan neljän teema-alueen mukaan, ja niiden toimintaperiaate on Elina Sillanpään mukaan yhteisöllinen ja osallistava.

Kun tavoitteena on muutos siinä, miten aineistoja kootaan, organisoidaan ja jaetaan, on tärkeää, että työ perustuu henkilökunnan todellisiin tarpeisiin. Yhtä tärkeää on se, että tarpeista vallitsee henkilökunnan kesken yhteisymmärrys. Käytännön toimenpiteiden jalkauttaminen edellyttää sekin jaettua kehittämishalua.

Hyvät käytännöt huoneentauluksi

Avoimen tiedon keskus osallistuu vuoden 2022 aikana datastrategian toteuttamiseen avustavassa roolissa. OSC fasilitoi strategiatyötä sen tavoitteiden mukaisesti niin, että tiedekunnan aineistot ovat tulevaisuudessa mahdollisimman pitkälle FAIR-periaatteiden mukaisia.

Tämä tarkoittaa, että aineistot ja niiden kuvailutiedot ovat löydettävissä ja saavutettavissa verkosta ja että ne ovat mahdollisimman yhteentoimivia ja uudelleenkäytettäviä.

Yhteistyö käynnistyi syksyllä 2021 kunkin teemaryhmän tutkimusryhmien edustajien haastatteluilla. Haastatteluissa nousi esiin tarve koostaa henkilökunnalle yhteinen, huoneentaulutyyppinen aineistonhallinnan ohjepankki. Tiedekunnan intraan koostettiin aineistonhallinnan käsikirja, jonka sisältö räätälöitiin tiedekunnassa keskeisten datatyyppien, kysely- ja mittausaineistojen tarpeet huomioiden.

Liikuntatieteiden alojen tutkimuksissa tuotetaan monipuolisia ja rikkaita pitkittäis- ja seuranta-aineistoja, joiden elinkaari on pitkä ja jotka sisältävät terveystietoa sekä monenlaisia muita henkilötietoja. Käsikirjan tavoitteena on helpottaa näiden vaativien pitkäikäisten aineistojen elinkaaren suunnittelua. Avoimen tiedon keskus päivittää käsikirjaa jatkossa säännöllisesti ja huolehtii siitä, että tiedekunnan väki saa ajantasaisen tiedon ohjepäivityksistä.

Kuvailutiedot tekevät aineistoista löydettäviä ja käyttökelpoisia

Liikuntatieteellisen tiedekunnan aineistonhallinnan käsikirja opastaa myös siihen, miten tutkija julkaisee aineistonsa peruskuvailutiedot eli metatiedot yliopiston Converis-tutkimustietojärjestelmän avulla. Jyväskylän yliopiston datapolitiikan mukaisesti kaikissa uusissa tutkimusprojekteissa syntyvien tutkimusaineistojen metatiedot julkaistaan JYX-julkaisuarkiston aineistokatalogissa. Käytännössä tutkijan vastuulla on kirjata tiedot Converis-järjestelmän aineisto-osioon, minkä jälkeen Avoimen tiedon keskus julkaisee ne JYXissä.

Julkaistut metatiedot saavat muun muassa pysyvän DOI-tunnisteen. Se mahdollistaa aineistoon viittaamisen. JYXistä metatiedot päätyvät automaattisesti myös kansalliseen Etsin-metatietokatalogiin, Tiedejatutkimus.fi:n aineistokatalogiin ja tulevaisuudessa myös Euroopan laajuiseen OpenAIRE-katalogiin.

Metatietojen julkaiseminen on keskeinen kohta liikuntatieteellisten tutkimusprojektien työlistalla siksikin, että vaikka itse aineistoja ei olisi tietosuojasyistä mahdollista saattaa avoimesti saataville, metatiedot voidaan käytännössä aina julkaista, kunhan ne on ensin kirjattu Converikseen.

Metatiedot ovat avain aineistojen löydettävyyteen, ja niiden julkaiseminen tutkimuksen päättyessä täyttää yliopiston ja keskeisten tutkimusrahoittajien minimiedellytykset aineistojen avoimuuden osalta.

Syksyn 2021 haastattelujen antina ohjeisiin saatiin tutkijoilta erinomaisia vinkkejä myös aineistojen dokumentointiin. Muuttujatason dokumentaatio on yksityiskohtaista kuvailua, joka selittää, miten, kenen toimesta ja miksi aineistoa on muokattu ja käsitelty missäkin tutkimuksen vaiheessa.

Dokumentaatio on ehto sille, että sekä tutkijat itse että mahdollisesti joku muukin pystyy ymmärtämään aineistoa vielä vuodenkin kuluttua keruuhetkestä, ja hyödyntämään sitä.

Dokumentaatiokäytännöt siirtyvät tyypillisesti eteenpäin tutkijoiden välisenä hiljaisena tietona. Esimerkiksi kyselytulosten koodaaminen eli muuttujien ja arvojen systemaattinen auki kirjoittaminen voi tutkimusprojektissa olla muutaman konkarin vastuulla. Tällöin on tärkeää, että koodausohjeet kirjataan ylös tutkimusryhmän sisäiseen käyttöön, jotta työ pääsee jatkumaan, vaikka dokumentoinnista vastaava henkilö vaihtuisi. Työohjeita kannattaa siis laatia ja ylläpitää vähintään oman projektin käyttöön, jotta työ ei seisahdu missään vaiheessa hiljaisen tiedon tyrehtymiseen.

Aineistoille vaikuttavuutta ja näkyvyyttä

Liikuntatieteellisen tiedekunnan datastrategian päätavoitteena pitemmällä aikavälillä on tiedekunnassa käytössä olevien kyselytutkimusmateriaalien kokoaminen ja harmonisointi. Pitkällä aikavälillä kyselymateriaalien yhdenmukaistaminen parhaimmillaan vähentää tutkimusryhmien päällekkäistä työtä. Samalla materiaaleja koskevan tiedon jakaminen antaa tilaa uudelle yhteistyölle henkilökunnan kesken.

Parhaimmillaan se, että kyselyissä käytetään mahdollisimman yhdenmukaisia kysymyssarjoja samojen ilmiöiden mittaamiseen, tekee mahdolliseksi myös kerättävien kyselyaineistojen yhdistämisen ja entistä monipuolisemman FAIR-periaatteiden mukaisen jatkokäytön. Yhdistäminen ja jatkokäyttö edellyttävät toki aina sitä, että se on tutkittavien tietosuojan kannalta perusteltua ja mahdollista.

Entä ne aineistot, joita ei tietosuojasyistä voida tulevaisuudessakaan yhdistää? Myös niiden perusmetatiedot on mahdollista julkaista Converis-tutkimustietojärjestelmän avulla JYX-julkaisuarkistossa Jyväskylän yliopiston datapolitiikan mukaisesti.

Näin tieto arvokkaiden aineistojen olemassaolosta, tekijöistä ja sisällöstä löytyy pysyvästi verkosta ja on saatavilla tiedekunnan ja koko yliopiston käyttöön. Metatietojen avulla aineistoon voi viitata aitona tutkimustuotoksena silloinkin, kun itse aineistoja ei voida avata.

Yhteistyö jatkuu

Liikuntatieteellisen tiedekunnan intrassa julkaistujen ohjeiden tarkoitus on toimia täydentyvänä käsikirjana. Avoimen tiedon keskus täydentää sitä jatkossa vuoden mittaan, kun Jyväskylän yliopistossa otetaan käyttöön uusia tutkimusaineistojen hallinnan työkaluja. Myös kansallinen aineistopalveluinfrastruktuuri tulee vuoden loppuun mennessä täydentymään erityisesti CSC:n sensitiivisille aineistoille suunnatuilla säilytys- ja analyysipalveluilla. Yhteistyö jatkuu myös kyselyaineistojen harmonisointityön jatkon organisoimisessa loppuvuoden aikana.

Anna Salmi
Informaatikko
Avoimen tiedon keskus

Tutustu Jyväskylän yliopiston tutkimusdatapolitiikkaan

Haluatko kirjoittaa OSC Blogiin? Ota yhteyttä julkaisukoordinaattori Sini Tuikkaan.

Creative Commons -lisenssi
Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä.