Lokiaineistot tutkimusdata-arkiston käytön tutkimuksessa

Viime vuosien aikana tutkimusaineistojen avoin jakaminen on noussut keskeiseksi avoimen tieteen teemaksi. Digitalisoitumisen myötä tutkimusaineistojen arkistoiminen ja jakaminen on tullut mahdolliseksi. Aineistoja avaamalla ja jakamalla tutkimuksen läpinäkyvyys kasvaa, tutkimuksen laadun arviointi helpottuu ja mahdollisia taloudellisia säästöjä syntyy. Tutkijoita aineistojen avaamiseen kannustaa myös tutkimusrahoittajien ja julkaisijoiden toiveet ja jopa vaatimukset. Luonnontieteissä aineistojen jakaminen on ollut osa tutkimuskäytäntöjä jo pitempää, mutta yhteiskuntatieteissä ja humanistisilla aloilla käytännöt ovat vasta vakiintumassa.

Tampereen yliopiston yhteydessä toimiva Tietoarkisto on arkistoinut ja tarjonnut käyttöön digitaalisessa muodossa olevia tutkimusaineistoja erityisesti yhteiskuntatieteellisillä aloilla jo 1990-luvulta lähtien. Tietoarkistoon arkistoituja yli 1500 aineistoa pääse käyttämään Aila-verkkoportaalin kautta. Tietoarkisto tarjosi tutkimustamme varten rikastettua lokiaineistoa Aila-portaalin käytöstä vuosilta 2015-2018 (Late & Kekäläinen 2020). Lokiaineisto (Tampereen yliopisto 2020) pitää sisällään tiedon ladattujen aineistojen määrästä ja aineistotyypeistä. Näiden lisäksi rikastettu aineisto sisältää tietoja aineistojen lataajista, kuten tiedon käyttäjän organisaatiosta, maasta, tieteenalasta ja aineiston käyttötarkoituksesta.

Lokiaineisto osoittaa, että Tietoarkistosta tehtiin viiden tutkimusvuoden aikana yli 10000 aineistolatausta. Suurin osa latauksista kohdistui määrällisiin aineistoihin, kuten kyselyaineistoihin. Erityisesti pitkittäistutkimuksina kerätyt kyselyaineistot olivat suosittuja. Myös professori Tatu Vanhasen kokoamat laajat tilastoaineistot (esim. Demokratisoitumisen mittarit 1810-2018) olivat ladatuimpien aineistojen joukossa. Laadullisista aineistoista useimmiten ladattiin kirjoituskilpailuaineistoja. Suurin osa aineistoista ladattiin opiskelutarkoituksiin. Valtaosa Tietoarkiston käyttäjistä tuli yhteiskuntatieteiden alalta ja työskenteli tai opiskelija suomalaisessa yliopistossa. Yllättävää kuitenkin oli, että käyttäjien joukossa oli tutkijoita ja opiskelijoita ympäri maailmaa ja kaikilta eri tieteenaloilta.

Kuva 1. Tietoarkiston aineistolataukset 2015-2018

Päätelmien tekeminen lokiaineistojen pohjalta ei ole ongelmatonta. Käyttäjä voi ladata aineiston Tietoarkistosta, mutta ei lopulta käytä aineistoa lainkaan. Toisaalta ladattua aineistoa voidaan käyttää useaan eri tarkoitukseen. Lokiaineistot eivät myöskään kerro esimerkiksi miten aineistoja käytettiin ja mitä ongelmia aineistojen käytössä oli. Jotta saataisiin selkeämpi ja monipuolisempi kuva digitaalisten tutkimusaineistojen käytöstä, tarvitaan erilaisia lähestymistapoja. Yhdistämällä laadullisia ja määrällisiä menetelmiä voidaan saada uutta tietoa tutkimusdata-arkistojen käytöstä, digitaalisten aineistojen jakamisesta ja uudelleen käytöstä. Tätä tietoa tarvitaan tulevaisuudessa, kun arvioidaan avoimen tieteen kehitystä ja todellisia hyötyjä tutkijoille ja tieteelle.

 

Lue ja tutki lisää:

Late, E., & Kekäläinen, J. (2020). Use and users of a social science research data archive. PloS one, 15(8), e0233455. https://doi.org/10.1371/journal.pone.0233455

Tampereen yliopisto: Tietoarkiston aineistojen käyttö 2015-2018 [sähköinen tietoaineisto]. Versio 1.0 (2020-06-09). Yhteiskuntatieteellinen tietoarkisto [jakaja]. http://urn.fi/urn:nbn:fi:fsd:T-FSD3424

Kommentit

Vastaa

Käsitellään kommentteja...

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *