Suomen Lajitietokeskuksen aineistopolitiikka
1. Aineistopolitiikan tarkoitus
Suomen Lajitietokeskus kokoaa tietovarastoon digitaalisia tietoaineistoja Suomen eliölajeista. Lajitietokeskuksen tietovarastossa oleva tieto, jota ei ole luokiteltu arkaluonteiseksi[1] tai määritelty osittain tai kokonaan jollakin muulla perusteella[2] salattavaksi, on avointa julkista tietoa. Tietovarastossa olevan em. perusteilla salatun arkaluonteiseen tiedon lukuoikeus ja käyttö on aina hallittua ja siitä tiedon omistajan kanssa erikseen sovittu. Avoimen tiedon käyttöoikeus perustuu käyttöoikeuslisensseihin, jotka voivat poiketa toisistaan aineistosta riippuen ja jotka määritellään aineistonluovutussopimuksessa.
Tämä aineistopolitiikka linjaa kaikkien Suomen Lajitietokeskuksen hallinnoimien digitaalisten tietoaineistojen keruun, ylläpidon ja käytön periaatteita.
Suomen Lajitietokeskus on Luonnontieteellisen keskusmuseon Luomuksen hallinnon alainen virtuaalinen keskus. Tämän aineistopolitiikan tavoitteena on olla ristiriidaton suhteessa Luomuksen digitaalisten aineistojen aineistopolitiikkaan, jolla Luomus ohjaa lakisääteisten tehtäviensä toteuttamista. Ristiriitaisissa tilanteissa noudatetaan Lajitietokeskuksen aineistopolitiikkaa.
Aineistopolitiikka on sitova Suomen Lajitietokeskuksen tiedonhallinnan ohjeistus. Se koskee kaikkia Suomen Lajitietokeskuksen aineistoja ja aineistojen parissa työskenteleviä, Luomuksen palveluksessa olevia tai Luomuksen kanssa muussa sopimussuhteessa olevia henkilöitä. Lisäksi kaikki henkilöt, joilla on pääsy Lajitietokeskuksen tiedon hallintaan heille myönnettyjen käyttöoikeuksien kautta, sitoutetaan noudattamaan tätä aineistopolitiikkaa.
Suomen Lajitietokeskusta rakennetaan vuosina 2015–2017 Luomuksen koordinoimana, Suomen ympäristökeskuksen hallinnoiman Envibase[3]-hankekokonaisuuden osahankkeena. Aineistopolitiikka päivitetään viimeistään vuoden 2018 alussa siltä osin, kuin hankkeen aikana varmistuvat Lajitietokeskuksen tulevaan organisaatioon liittyvät hallintorakenteet ja -vastuut mahdollisesti edellyttävät.
2. Aineistopolitiikassa käytettyjen termien määritelmiä
Tässä aineistopolitiikassa seuraavia termejä käytetään seuraavissa merkityksissä:
Aineisto (tai data) tarkoittaa yksittäisten tietueitten muodostamaa kokonaisuutta, joka on tallennettu digitaaliseen muotoon. Aineisto voi sisältää tietueita muutamista miljooniin ja nämä voivat koostua teksteistä, numeroista, kuvista, äänestä tai näihin verrattavista tiedoista, sekä näihin liittyvistä kuvailutiedoista.
Tietojärjestelmä tarkoittaa elektroniseen tietokantaan tai tietokantoihin perustuvaa järjestelmää, jossa tietoja käsittelemällä palvellaan jotakin toimintaa tiettyyn tarpeeseen. Tietojärjestelmän muodostavat tiedot ja niiden käsittelysäännöt, käsittelyn henkilö- ja laiteresurssit sekä tiedonsiirtolaitteet ja toimintaohjeet. Tietojärjestelmään voi sisältyä tietoja myös muista tietojärjestelmistä.
Lajitietokeskuksen tietojärjestelmä tarkoittaa tietojärjestelmää, joka on Luomuksen ICT-tiimin (tieto- ja viestintäteknologiatiimi) ylläpitovastuulla. Järjestelmä voi olla joko ICT-tiimin ohjelmoima, jonkun muun Luomuksen henkilöstöön kuuluvan tai kuuluneen ohjelmoima, taikka ulkopuoliselta taholta Luomuksen hallintaan ostettu tai saatu.
Metatiedot tarkoittavat aineistoa kuvailevia tietoja, kuten selostusta aineiston koostumuksesta, syntytavasta ja -ajasta sekä kerääjästä jne.
Primaariaineisto (primaarikappale) tarkoittaa aineiston alkuperäistä, päivitettävää versiota. Tällä versiolla on metatiedot ja omistaja.
Sekundaariaineisto (sekundaarikappale) tarkoittaa primaarikappaleesta otettua kokonaista tai osittaista kopiota, jota ei päivitetä.
Aineistojen muodostuminen kuvaa tapaa tai menetelmää, jolla aineistoja kertyy kohteena oleviin järjestelmiin ja siihen liittyviin prosesseihin.
Aineistojen päivitys tarkoittaa alkuperäisen tiedon muuttamista primaariaineistossa eli tiedon korvaamista uudella tai korjatulla tiedolla joko osittain tai kokonaan.
Aineistojen ylläpito tarkoittaa, että tiedon ajantasaisuudesta ja käyttövalmiudesta pidetään huolta. Primaariaineiston osalta varmistetaan, että tiedon päivitys näkyy välittömästi tallennusjärjestelmässä. Sekundaaritiedon osalta varmistetaan, että uudessa kopiossa päivitetty tieto on korvannut vanhan tiedon.
Aineistotyyppi käsittää aineistot, jotka tyypillisesti syntyvät yhden prosessin tuloksena ja joille luodaan omantyyppinen, kuvaileva metatieto. Käsitteen avulla voidaan tarkentaa periaatteita: aineistotyyppi käsittää aineistot, joita koskevat samat periaatteet.
Aineiston avoimuus tarkoittaa, että aineiston salaamattomat osat ovat kenen tahansa käytettävissä mihin tahansa tarkoitukseen, kunhan noudatetaan aineiston käyttöoikeuteen liittyviä periaatteita, kuten viittaus lähteeseen hyvän tieteellisen käytännön mukaisesti. Avoimuutta voidaan rajoittaa käyttölisenssein tai salauskriteerein (ks. kohta 6.3).
3. Aineistopolitiikkaa ohjaavat lait, säädökset ja linjaukset
Suomen Lajitietokeskuksen aineistopolitiikkaa ohjaavat samat lait ja velvollisuudet kuin Luomusta.
Aineistopolitiikassaan Lajitietokeskus seuraa kansallisella ja EU-tasolla sekä kansainvälisesti sovittuja, digitaalisten aineistojen avoimeen saatavuuteen liittyviä linjauksia, strategioita ja ohjelmia, erityisesti valtioneuvoston linjausta lisätä tietoaineistojen avoimuutta.
Yliopistolaki ja laki viranomaisten toiminnan julkisuudesta (ns. julkisuuslaki) määrittelevät Luomuksen toiminnan julkisuutta, mikä vaikuttaa suoraan myös Lajitietokeskuksen aineistopolitiikkaan. Luomuksen ja näin ollen myös Lajitietokeskuksen aineistopolitiikka on linjassa Helsingin yliopiston, Luomuksen emo-organisaation datapolitiikkaan.
Muita Lajitietokeskuksen aineistopolitiikkaan vaikuttavia säännöksiä ovat seuraavat, sähköistä asiointia ja hallintoa koskevat sekä digitaalisen aineiston syntyyn, käyttöön, levittämiseen, hyödyntämiseen ja säilyttämiseen liittyvät lait ja säännökset: luonnonsuojelulainsäädäntö, hallintolaki, laki julkisen hallinnon tietohallinnon ohjauksesta (ns. tietohallintolaki), henkilötietolaki, laki asioinnista viranomaistoiminnassa, laki sähköisistä allekirjoituksista, arkistolaki, laki kulttuuriaineistojen tallettamisesta ja säilyttämisestä sekä tekijänoikeussäädökset.
Suomen Lajitietokeskuksen aineistopolitiikassa otetaan myös huomioon EU:n PSI-direktiivin (Public Sector Information) sekä INSPIRE-direktiivin (Infrastructure for Spatial Information in Europe) Suomen lainsäädäntöön ja strategioihin liittyvät linjaukset. Laissa (421/2009) ja asetuksessa (725/2009) paikkatietoinfrastruktuurista, asetetaan Luomukselle velvoitteita koskien lajien levinneisyyteen ja biomaantieteellisiin alueisiin liittyvän paikkatiedon yhteiskäytöstä. Tietoaineistot tulee ylläpitää ja jakaa laissa ja INSPIRE-direktiivin täytäntöönpanosäännöissä määritellyllä tavalla.
4. Aineistopolitiikan kattavuus
Aineistopolitiikka kattaa Lajitietokeskuksen hallinnassa olevat aineistot. Lajitietokeskus ottaa hallintaansa, säilyttääkseen ja jakaakseen aineistoja sopimuksiin perustuen.
Nämä aineistot kuuluvat seuraaviin aineistotyyppeihin:
- Kokoelmanäytteitä koskevat tiedot; kokoelmanäytteet voivat olla kokonaisia organismeja, organismien makro- tai mikroskooppisia osia, kudosnäytteitä tai DNA:ta, taikka fossiileja.
- Kokoelmissa säilytettäviä eläviä kasvi-, sieni- tai mikrobikantoja koskevat tiedot; kanta voi käsittää yhden yksilön tai kasvuston tai useampia, samasta siemen- tai itiöerästä tai kasvullisen lisääntymisen tai lisäämisen tapahtumasta syntyneitä yksilöitä tai kasvustoja, jotka voivat olla eri elinkiertovaiheissa (esimerkiksi itiö, siemen, taimi, aikuinen).
- Havaintoaineistot, joihin ei liity kokoelmanäytteitä.
- Kokoelmanäytteitä tai havaintoja dokumentoivat aineistot kuten valokuvat, äänitteet, piirrokset yms.
- Seuranta- ja kartoitusaineistot: kartan tai tilaston tuottamiseksi tai seurannan toteuttamiseksi kerätyt, yhdistetyt ja jalostetut tiedot.
- Nimistöt ja taksonomiset hierarkiat.
- Luonnontieteelliset mittaus- ja luokittelutulokset.
- Erilaiset analyysitulokset: näytteiden ajoitustulokset, isotooppisuhteet ja alkuainemääritykset, DNA-sekvenssit ja genotyyppimääritykset yms. sekä näihin liittyvä prosessitieto.
- Yllä lueteltuihin aineistotyyppeihin liittyvät paikka- ja sijaintitiedot, kuten keruu- ja havaintopaikat tai -alueet, koealat, sijainnit kokoelmissa jne.
- Yllä lueteltuihin aineistotyyppeihin liittyvät henkilötiedot, kuten aineiston tuottajan nimi ja organisaatio, yhteystiedot jne.
5. Aineistopolitiikan päämäärä
Aineistopolitiikan yleisenä päämääränä on edistää Lajitietokeskuksen hallinnoimien aineistojen hyödynnettävyyttä ja hyödyntämistä tutkimuksen, opetuksen, hallinnon, luonnonsuojelun, elinkeinotoiminnan ja yhteiskunnan hyväksi.
Tämän päämäärän saavuttamiseksi aineistopolitiikalla pyritään:
- luomaan yhtenäiset käytännöt aineistojen tallettamiseen, julkaisemiseen ja jakamiseen
- varmistamaan, että jokaisella sähköisellä aineistolla on primaarikappale eli yksi päivitettävä versio (ns. master-kopio), kuvailutiedot (ns. metatiedot) ja omistaja
- mahdollistamaan lajitietoaineistojen saattaminen avoimeen käyttöön mahdollisimman nopeasti, tehokkaasti ja kattavasti
- lisäämään yhteistyötä tiedon kerääjien, tuottajien ja hyödyntäjien välillä.
Aineistopolitiikka ohjaa Luomuksen ja sen sopimuskumppaneiden henkilöstöä Lajitietokeskukseen tulevien ja sieltä jaettavien aineistojen hallinnassa ja käsittelyssä ja myötävaikuttaa siihen, että eri toimijat noudattavat yhdenmukaisia periaatteita aineistoja luovutettaessa ja käytettäessä. Hallinta- ja jakeluperiaatteita määritellessään politiikka myös välillisesti parantaa aineistojen laatua.
6. Aineistojen muodostumisen, ylläpidon ja käytön periaatteet
Aineistojen muodostuminen
Suomen Lajitietokeskuksen tietovarastoon tallennetaan (kopioidaan) sekundaarisia tietoaineistoja primaarisista lähdeaineistoista. Aineistojen kopioiminen perustuu kirjalliseen sopimukseen, joka tehdään lähdeaineiston omistajan tai haltijan ja Luomuksen välille. Olemassa olevia aineistoja siirretään Lajitietokeskukseen joko automatisoidusti, rakennettavien tiedonvaihtorajapintojen kautta, tai muulla tehokkaalla keinolla. Lajitietokeskukseen kertyy uutta dataa joko sopimuskumppaneiden primaaritiedon tallennustietojärjestelmistä tai Lajitietokeskuksen palvelukokonaisuuden osana olevista ja sen osaksi rakennettavista primaariaineistojen tallennusjärjestelmistä. Sekundaarikopiot tallentuvat Lajitietokeskuksen tietovarastoon aineistoista riippuen erikseen sovitulla aikataululla joko määräajoin tai reaaliaikaisena.
Aineiston omistaa organisaatio, jonka lukuun se on muodostettu. Lajitietokeskukselle tallennettavaksi ja jaettavaksi luovutettujen aineistojen omistajuus ei muutu luovutuksen myötä. Aineiston omistajuus merkitsee oikeutta päättää aineiston käytöstä ja tiedon jakamisesta Lajitietokeskuksen tietovarastoon, ja tästä sovitaan keskinäisellä aineistonluovutussopimuksella.
Aineistojen ylläpito ja säilytys
Lajitietokeskuksen palvelukokonaisuuden osana on ja sen osaksi rakennettaan myös uusia primaariaineistojen tallennusjärjestelmiä. Näitä aineistoja ylläpidetään ja päivitetään Luomuksen ja tietojen omistajien toimesta erikseen sovittavalla tavalla. Muut Lajitietokeskuksen sopimuskumppanit vastaavat omien tai hallinnassaan olevien primaaritiedon tallennustietojärjestelmien aineistojen ylläpidosta ja päivittämisestä. Kaikista primaariaineistoista, omistuksesta, hallinnasta tai päivitysvastuusta rippumatta, tallennetaan Lajitietokeskuksen tietovarastoon vain kopio eli ei-päivitettävä sekundaarikappale. Aineiston ylläpidossa ja säilytyksessä noudatetaan kappaleessa 3 lueteltujen lakien, säädösten ja linjausten mukaisia päätöksiä ja ohjeita.
Lajitietokeskuksen tietovarastoon kopioitavat lajitiedot yhtenäistetään Lajitietokeskuksen ydintietokannan tietojen kanssa pääsääntöisesti ennen niiden tallennusta tietovarastoon. Ydintietokannassa on muun muassa kansallisesti käytettävä nimistö ja taksonominen tieto eli tieteellinen luokittelu.
Aineistoista ylläpidetään julkisilla verkkosivuilla jaettavaa, aineistoja kuvailevaa luetteloa (aineistojen ns. metatiedot). Tiedot uusista aineistoista lisätään luetteloon viimeistään aineiston valmistuttua, aineiston luovutuksen yhteydessä tai jatkuvasti kerättävistä aineistoista heti, kun aineistoa on alkanut kertyä Lajitietokeskuksen järjestelmiin.
Aineistojen käyttö
Suomen Lajitietokeskuksen hallinnassa olevat digitaaliset aineistot ovat lähtökohtaisesti julkisia ja avoimessa käytössä[4] eli avointa dataa. Aineistoja jaetaan käyttöön pääsääntöisesti Creative Commons -lisenssiperheen määrittämillä periaatteilla[5]. Creative Commons -lisenssejä[6] valitaan ja otetaan käyttöön aineiston omistajan kanssa sovitun mukaisesti. Aineiston julkaisemisessa noudatetaan kappaleessa 3 lueteltujen lakien, säädösten ja linjausten mukaisia päätöksiä ja ohjeita.
Lajitietokeskuksen hallinnoimassa aineistossa voi olla myös sellaista aineistoa, joka on luokiteltu arkaluonteiseksi joko yleisen lainsäädännön[7] tai ympäristö- ja luonnonvarahallinnon[8] päätösten perusteella. Arkaluonteiseen aineistoon liittyy pääsääntöisesti saatavuus- ja käyttörajoitteita.
Suomen Lajitietokeskuksen rakentamisen yhteydessä on valmisteltu kansallinen, sitova periaatepäätös[9], joka sisältää yleiset saatavuus- ja käyttörajoitteiden linjaukset sekä liitteenä ylläpidettävän luettelon Suomen arkaluonteisesta lajistosta.
Avoimuutta voidaan rajoittaa monin eri tavoin, joista paikkatiedon karkeistaminen on tavanomaisin. Myös aikaan sidottuja tai muuhun kuin havainnon paikkaan, kuten talvehtimis- tai pesäpaikkaan, liittyvää tietoa voidaan salata perustellusti.
Lisäksi Lajitietokeskuksessa voi olla aineistoja, joiden avoimuutta ja käyttöoikeutta voidaan rajoittaa datan omistajan tai hallinnoijan vaatimuksesta ja sopimukseen perustuen. Näidenkin tietojen jakamiseen liittyvä käyttöoikeus määritellään yllä mainittujen käyttöoikeuslisenssien kautta tapauskohtaisesti.
Lajitietokeskuksen tietovarastossa aineistot säilytetään sellaisina, kuin ne on tiedon omistajalta saatu. Yllä mainitut käyttörajoitukset tulevat voimaan vasta, kun aineistot siirtyvät tietovarastosta laji.fi-sivuston julkiseen palveluun näkyviin ja käytettäviksi. Lajitietokeskuksen tiedon avointa käyttöä edistävien tavoitteiden mukaisesti viranomaisilla ja viranomaisiksi luokitetuilla tahoilla on virkatehtävissä aineistojen rajoittamaton käyttöoikeus.
Vapaaehtoisesti viranomaiskäyttöön luovutetut aineistot nauttivat Lajitietokeskuksen kautta jaettuna sitä suojaa, jonka laki viranomaisten toiminnan julkisuudesta myöntää 24 §:n 1 momentin 16 kohdan ja 26§:n 1 momentin 2 kohdan perusteella. Tämä tarkoittaa käytännössä sitä, että viranomaisen käyttöön viran hoitamiseksi luovutettuja aineistoja ei voi luovuttaa eteenpäin ilman aineiston omistajan suostumusta. Tämä varmistetaan Lajitietokeskuksen ja viranomaisten keskinäisillä sopimuksilla samalla, kun sovitaan toimintatavasta viranomaisen pääsystä kaikkeen Lajitietokeskuksen aineistoon.
Aineistojen avoimuus ei saa loukata tietosuojaa. Aineiston avoimuuden rajoitukset perusteluineen ilmaistaan aineiston metatiedoissa. Avoimet aineistot saatetaan Luomuksen hallinnoimassa Suomen Lajitietokeskuksen portaalissa (laji.fi) itsepalveluperiaatteella tiedeyhteisön, julkishallinnon, järjestöjen, yritysten ja yksityishenkilöiden hyödynnettäviksi vapaasti ja maksutta. Myös muita julkisia jakelukanavia voidaan perustaa avoimeen aineistoon perustuen.
Lajitietokeskuksen aineistojen avoimuutta ja julkisuutta edistetään antamalla aineistoja ja niiden kuvauksia tietovaraston kautta julkaistaviksi Global Biodiversity Information Facility GBIF:in portaalissa sekä muissa vastaavissa palveluissa.
7. Vastuunjako
Aineistopolitiikan laatiminen, päivittäminen ja hallinnointi
Lajitietokeskuksen organisaation hallintorakenteesta päätetään Suomen Lajitietokeskus -hankkeen aikana yhtenä hankkeen toimenpiteenä ja tuotoksena. Aineistopolitiikan laatiminen, päivitysvastuu ja hallinnointi tapahtuvat tulevan organisaation ja sen osalta päätettyjen vastuiden mukaisesti. Hankkeen ajan aineistopolitiikan vahvistaa Luomuksen johtaja.
Tämän aineistopolitiikan päivitys tehdään viimeistään vuoden 2018 alussa, jolloin hanke on päättynyt. Luomuksen ICT-tiimi vastaa tämän aineistopolitiikan ylläpidosta, ja sitä hallinnoidaan osana Lajitietokeskuksen kokonaisarkkitehtuuria[10]. ICT-tiimi tarkistaa politiikan päivitystarpeet vuosittain. Tarkistuksen yhteydessä tiimi voi pyytää mm. Envibase-hankekokonaisuuden ohjausryhmältä näkemyksiä politiikan päivitystarpeista. Lisäksi se arvioi politiikan yhteensopivuutta yhteistyökumppaneiden vastaavien politiikkojen kanssa.
Aineistopolitiikan toteuttaminen
Aineistopolitiikan toteuttamisen vastuunjako hankeaikaisessa (2015–2017) Suomen Lajitietokeskuksessa on seuraava:
- Hankkeen projektipäällikkö valvoo aineistopolitiikan toteutumista Lajitietokeskuksen hallinnoimien aineistojen osalta.
- Luomuksen ICT-tiimi vastaa aineistopolitiikan toteutumisesta Lajitietokeskuksen tietojärjestelmissä kaikkien aineistotyyppien osalta.
- Jokainen Luomuksen työntekijä ja Luomuksen kanssa muussa sopimussuhteessa oleva henkilö vastaa omalta osaltaan aineistopolitiikan toteuttamisesta toimiessaan Lajitietokeskuksen nimen alla ja tuottaessaan, jakaessaan tai käyttäessään politiikan tarkoittamia aineistoja.
VIITTAUKSET
[1] Arkaluonteisella eli sensitiivisellä tiedolla viitataan julkisuudelta rajattuun tietoon, johon pääsy on vain määritetyillä henkilöillä, ryhmillä tai organisaatioilla. Luokittelu arkaluonteiseksi perustuu olettamukseen, että kyseisen tiedon julkistamisella voi olla vahingollisia seurauksia kohteelle, jota kyseinen tieto koskee.
[2] Aineistoa voidaan salata arkaluonteisuuden lisäksi myös muilla perusteilla, jotka liittyvät usein aineiston omistajuuteen ja hallintaan, kuten varaus tutkimuskäyttöön tai liiketoiminnan kehitystyöhön
[3] http://www.ymparisto.fi/envibase
[5] https://creativecommons.org/licenses/by/4.0/deed.fi
[6] http://creativecommons.fi/lisenssit/
[7] Laki viranomaisten toiminnan julkisuudesta (1999/621); Luonnonsuojelulaki (1996/1096), 6 luku, Eliölajien suojelu
[8] Suomen ympäristöhallinto muodostuu ympäristöministeriöstä ja TEM:n hallinnonalalla toimivien alueellisten elinkeino, – liikenne- ja ympäristökeskusten ympäristö- ja luonnonvarat -vastuualueista, aluehallintovirastojen ympäristölupavastuualueista, Suomen ympäristökeskuksesta sekä Asumisen rahoitus- ja kehittämiskeskuksesta. Luonnonvarojen hallinto jakautuu ympäristöministeriön, maa- ja metsätalousministeriön ja työ- ja elinkeinoministeriön kesken.
[9] Kansallinen luettelo on valmistunut osallistavan prosessin tuloksena ja lähetetty kaikille osallistuneille tahoille 29.7.2016. Periaatepäätökseen tähtäävän prosessin valmistelukokous järjestettiin 29.9.2015 ympäristöministeriön, maa- ja metsätalousministeriön, Suomen ympäristökeskuksen ja Luomuksen kesken.
[10] Kokonaisarkkitehtuurilla (KA) tarkoitetaan toiminnan, tietotarpeiden, tietojärjestelmien ja teknologiaratkaisujen mallintamista, kuvaamista ja suunnittelemista yhtenäisen mallin mukaisesti. Lajitietokeskuksessa noudatetaan KA:n suunnittelussa JHS-suositusta 179 soveltuvin osin.