Teema 1.9.2017

Avoin data on nykypäivän digitaalista raaka-ainetta

Ilmatieteen laitos tarjoaa jatkuvasti ilmaiseksi suuren määrän avointa dataa – kenen tahansa halukkaan käyttöön. Aivan kuin mistä tahansa raaka-aineesta voi datasta muotoilla aivan uusia tuotteita tai palveluita.

Avoin data onkin tämän päivän digitaalista raaka-ainetta, jota kansalaiset, yritykset ja yhteisöt voivat louhia vapaasti. ”Avaamalla Ilmatieteen laitoksen tietoaineistoja, olemme halunneet luoda mahdollisuuksia uudelle liiketoiminnalle, tutkimukselle ja koulutukselle. Lisäämällä julkisten tietojen uudelleenkäyttöä pyritään lisäämään läpinäkyvyyttä sekä luomaan uusia markkinoita ja innovaatioita tarjoamalla tietoa niiden materiaaliksi”, Ilmatieteen laitoksen pääjohtaja Juhani Damski toteaa.

Avoin lähdekoodi ja pilvipalvelut auttavat suurten aineistojen käsittelyssä

Avoin julkinen data on minkä tahansa julkisen organisaation tuottamaa tietoa, joka on tarjolla konekielisessä muodossa ja maksutta sekä yksityisiin mutta myös kaupallisiin tarkoituksiin. Ilmatieteen laitos avasi sää-, meri- ja ilmastohavaintotietoja sekä mallitietoja avoimeksi dataksi jo vuonna 2013. Nykyisin tarjolla on merkittävä määrä usein päivittyvää dataa sisältäen lukuisia ympäristön tilaa mallintavia havaintoja ja ennusteita.

”Jaettavat aineistot ovat suuria ja päivittyvät usein, mikä luo erityishaasteita datan jakamiselle ja hyödyntämiselle”, Ilmatieteen laitoksen suunnittelija Roope Tervo toteaa.  ”Ilmatieteen laitoksella on käytössä lukuisia ohjelmistoja, joita käytetään sää- ja ympäristötiedon tuottamiseen, käsittelyyn ja jakeluun. Viime vuonna aloitimme myös näiden ohjelmistojen julkaisun avoimena lähdekoodina. Koodin avulla palvelukehittäjien on helpompaa käsitellä ja prosessoida haastavia aineistoja”, Tervo selittää. Ohjelmistojen julkaisemisella avoimena lähdekoodina pyritään lisäämään avoimen sää- ja ilmastodatan hyödynnettävyyttä sekä tehostamaan ohjelmistojen käyttöä ja kehitystä.  Avoimella lähdekoodilla tuetaan myös tutkimusprojekteja, kansainvälistä yhteistyötä, kehitysyhteistyötä ja suomalaista yritystoimintaa.

Parhaillaan käynnissä on myös kahden vuoden mittainen pilotti, jossa laitoksen tuottama numeerinen sääennustemalli HIRLAM on saatavilla Amazonin pilvipalvelusta. Käyttäjät pääsevätkin nyt hyödyntämään säädataa laajemmin kuin aiemmin, kun laaja aineisto on ladattu kokonaan Amazonin pilveen. Pilven kautta pystyy rakentamaan myös uusia pilvisovelluksia, joissa dataa pystyy hyödyntämään Amazonin tehokkaiden järjestelmien sisällä.

Monenlaiset käyttäjät voivat hyödyntää avointa dataa

Valtioneuvosoton kanslian tilaaman “Avoimen datan hyödyntäminen ja vaikuttavuus” -raportin mukaan avoimen datan vaikuttavuutta on vaikea arvioida. Ilmatieteen laitoksen avoimen datan käyttäjälukujen perusteella tulokset ovat melko lupaavia. Portaalissa on yli 10 000 rekisteröitynyttä käyttäjää, jotka tekevät keskimäärin yli 9,6 datakyselyä joka sekunti. Tähän mennessä datan latauksia on tehty satoja miljoonia kertoja. Toisaalta vain 40 – 50 prosenttia rekisteröityneistä käyttäjistä oikeasti lataa dataa käyttöönsä”, Tervo toteaa.

Esimerkkikuva aaltopoiju.fi -palvelusta

Ilmatieteen laitoksen avointa dataa hyödynnetään jo monissa palveluissa, sovelluksissa ja hankkeissa. Osa uusista palveluista on julkisia ja kaikkien käytettävissä joko verkkopalveluina tai sovelluksina. Yksi tällaisista palveluista on purjehtijoille, veneilijöille ja vesiurheilijoille suunnattu Aaltopoiju.fi-sivusto. Palvelu hyödyntää Ilmatieteen laitoksen avoimesta datasta saatavia sää-, aalto- ja vedenkorkeushavaintoja, sekä vastaavia ennusteita koko Itämeren alueelle.

Paikkatietokonsultit puolestaan louhivat Ilmatieteen laitoksen lisäksi avointa dataa myös muualta. ”Me autamme asiakkaitamme hyödyntämään paikkatietoa monipuolisesti toimintansa tehostamiseksi. Analyyseja tehdään mm. kuljetusten optimoinnista, liikepaikkojen optimaalisesta sijoittamisesta ja ympäristövaikutuksista. Esim. kotimaan lomasuunnitelman laatimisessa avustava Finterest.fi -verkkopalvelumme käyttää avointa dataa Ilmatieteen laitoksen lisäksi mm. Maanmittauslaitoksen, Suomen ympäristökeskuksen, Liikenneviraston, Metsähallituksen, Jyväskylän yliopiston ja Tilastokeskuksen palveluista”, toimitusjohtaja Kari Mikkonen Paikkatietokonsultit Oy:stä luettelee.  ”Avoin data lisääntyy jatkuvasti ja tuottaa hyötyä meidän kaltaisillemme yrityksille, jotka yhdistelevät eri paikoista kerättyä avointa tietoa.”

Avoin tiede lisää myös yhteiskunnallista vaikuttavuutta

Avoimen datan lisäksi avoimen tieteen edistäminen on yksi Ilmatieteen laitoksen tavoitteista. ”On kaikkien etu, että myös avoimen tieteen mahdollisuudet hyödynnetään laajasti yhteiskunnassa”, tiivistää Ilmatieteen laitoksen tutkimusjohtaja Yrjö Viisanen. Avoimen tieteen päähyötyjä ovat tieteen kehityksen nopeutuminen ja tutkimuskäytäntöjen läpinäkyvyyden lisääntymisestä johtuva tutkimuksen laadun parantuminen. ”Tärkeää on kuitenkin myös se, että tutkimustulosten paremman saavutettavuuden myötä tulosten yhteiskunnallinen vaikuttavuus lisääntyy”, Viisanen toteaa.

Yhtenä esimerkkinä avoimen tieteen edistämisestä on se, että Ilmatieteen laitos on käynnistänyt yhdessä Tieteen tietotekniikan keskuksen, CSC:n, kanssa hankkeen, jossa Ilmatieteen laitoksen tutkimusaineistoille luodaan kokonaisvaltainen hallintajärjestelmä. Uudella hallintajärjestelmällä huolehditaan keskitetysti tutkimusaineiston elinkaaren vaiheet, taataan pitkäaikaissäilytys ja avoin rajapinta ilmatieteen laitoksen tuottamiin tutkimusaineistoihin. ”Julkisella rahalla tuotettu tiedon ja tutkimusaineiston halutaan olevan avointa ja kaikkien käytössä. Myös aineistojen kuvaus, tietoturva ja aineistojen turvattu säilyminen ovat Ilmatieteen laitokselle tärkeitä asioita”, sanoo tutkimusaineistojen hallintajärjestelmää koskevaa projektia llmatieteen laitoksella vetävä tutkimuspäällikkö Sanna Sorvari.

Sodankylä tuottaa satelliittidataa lähtökohtaisesti ilmaiseksi

Sodankylän avaruuskeskuksen valvomohuone.

Myös Ilmatieteen laitoksen tutkimustietoa on saatavissa yhä enemmän avoimena datana. Sodankylän satelliittipalvelukeskuksen infrastruktuuria on kehitetty viime vuosina niin, että isot satelliittidatamassat on saatavilla koneellisesti luettavan rajapinnan kautta. Lähtökohtaisesti monet aineistoista ovat täysin ilmaisia. ”Haluamme tarjota erilaisia avoimia rajapintoja, joiden kautta uusia sovelluksia voidaan tehdä. Satelliittiaineistojen rajapinta ei ole tällä hetkellä yhteinen Ilmatieteen laitoksen muun avoimen datan kanssa, mutta käytännössä molemmat pohjautuvat samaan INSPIRE-tietomallin määräämään muotoon”, tutkija Matias Takala kertoo. Avoimen datan lisäksi Sodankylässä on tarjolla pilvipalveluita, joiden avulla asiakas voi ajaa itse laskennan Ilmatieteen laitoksen palvelimilla ja saada käyttöönsä suoraan valmiin tuotteen.

”Vielä tällä hetkellä ei ole syntynyt suuria läpimurtotuotteita, vaikka periaatteessa niinkin jo voisi olla. Menestys vaatii sen, että datalle löydettäisiin uusia käyttökohteita ja yhdisteltäisiin aineistoja ennenäkemättömillä tavoilla. Toisaalta hyvinkin yksinkertaiset ideat ovat niitä parhaimpia”, Takala pohdiskelee.

Ilmatieteen laitoksen avoimen datan portaaliin voi tutustua osoitteessa: https://fmi.fi/avoin-data

Satelliittiaineistoja voi tutkia osoitteessa: https://nsdc.fmi.fi