Open Repositories 2019

Osallistuin Hampurissa järjestettyyn Open Repositories 2019 -konferenssiin, jonka pääteema oli "All the user needs".

Hampurin yliopisto

Se fiksumpi julkaisuarkisto -työpaja

Olen pitänyt Fedoraa fiksumpana, mutta vaikeammin lähestyttävä julkaisuarkisto-ohjelmistona DSpaceen verrattuna. Fedoran vahvuus on sen linkitettyyn dataan perustuva tietomalli verrattuna DSpacen litteään tietomalliin ja täysi REST API, jota taas ei DSpacen 6 -versiossakaan ole. Fedorassa ei myöskään ole oletuskäyttöliittymää, mitä pidän etuna.

Konferenssin ohjelmaan kuului Fedora-työpaja, johon osallistuin päästäkseni vähän paremmin selville Fedoran ominaisuuksista. Työpaja oli antoisa ja erittäin hyvin organisoitu. Osallistujat saivat ennen työpajaa ohjeet Fedoran asentamiseen ja sitten työpajassa asennusta pommiteltiin rajapintakutsuilla selitysten kera.

Työpajan jälkeen olin vakuuttunut siitä, että Fedora on fiksu(mpi) järjestelmä. Tosin on todettava, että DSpace 7 kyllä kaventaa tuota eroa huomattavasti. Työpajan aineistot löytyvät täältä.

GLAMpipe -työpaja

Pidin myös itse työpajan, jossa kävin läpi GLAMpipe -työkalua, jonka kehittäjä olen. GLAMpipe on työkalu, joka yrittää tarjota ratkaisua datan prosessoinnin organisoimiseen tarjoamalla rajapinnan (ja käyttöliittymän) datan prosessoimiseen järjestelmäriippumattomasti.

 Datan kulkua

Alkuperäinen tarkoitukseni oli saada GLAMpipen uusi versio käyttökuntoon työpajaan mennessä. Tämä ei aivan onnistunut, joten pajalaiset joutuivat tyytymään vanhaan versioon. Itse työpaja oli ehkä enemmänkin demon kaltainen kuin varsinainen työpaja. 

Työpajan osallistujista lähes kaikki olivat kehittäjiä  Muutamat osallistujat hakivat GLAMpipesta työkalua ei-tekniselle henkilökunnalle datan prosessoimiseen.

 DSpace 7

 DSpace 7 oli luonnollisesti aika vahvasti esillä konferenssissä. Vielä kehitteillä oleva versio korjaa DSpacen ilmeisimmät puutteet eli litteän tietomallin ja täyden REST -rajapinnan puutteen. Toinen iso uudistus on Angular -pohjainen käyttöliittymä.

DSpacen 7:n tietomallin uudistus on erittäin tervetullut. Uudessa tietomallissa voidaan määritellä uusia entiteettejä ja niiden välisiä suhteita. Nyt on siis mahdollista luoda esimerkiksi henkilö-entiteetti, joka on "kirjoittaja" -suhteessa artikkeliin tai voidaan luoda lehti -entiteetti, joka linkittyy lehden numeroihin.

Monipuolisempi tietomalli tarkoittaa tietysti myös muutoksia tietojen näyttämiseen. Esimerkiksi artikkelilla ei enää välttämättä ole dc.contributor.author -kenttää, koska tieto kirjoittajasta on omassa entiteetissään, joka on linkitetty artikkeliin. Tämä tieto kuitenkin monesti halutaan näkymään Dublin Coren määrityksen mukaan. DSpacessa tämä ongelma on ratkaistu virtuaalimetatietojen avulla.

Virtuaalimetatietojen avulla voidaan ikään kuin palauttaa litteä tietomalli. Sen sijaan, että kirjoittajan nimi olisi dc.contributor.author -kentässä suoraan, se määritelläänkin luettavaksi henkilö-entiteetistä virtuaalimetatietoto-mappauksessa. Tuloksena on tutun näköinen Dublin Core -tietue.

Using DSpace as backend service -
Workflow-centric repository development in practice

Pidin devtrackissä esityksen työnkulkupohjaisesta kehityksestä. Ajatuksena on lähteä liikkeelle parhaista mahdollisista työnkuluista välittämättä järjestelmien sisäisistä työnkuluista. Monesti parhaat mahdolliset työnkulut ovat järjestelmienvälisiä ja siksi usein tarvitaan joku järjestelmäriippumaton tapa toteuttaa niitä.

Datan prosessointirajapinta

Työnkulkupohjaisen kehitystavan keskeinen ajatus on datan prosessoinnin rajapinta. Tämä rajapinta osaa "puhua" Converiksen, DSpacen ynnä muiden organisaation järjestelmien kanssa. Rajapintaa hyödyntämällä voidaan luoda keveitä ja joustavia selainpohjaisia käyttöliittymiä.

 Esitykset videoitiin ja lisään videon omasta esityksestäni tänne, kunhan ne tarjolle tulevat.