Miten Yle voisi hyödyntää Big Dataa?
Anniina Huttunen on tekijänoikeuslakimies Ylen lakiosastolla.
Euroopan komissio antoi heinäkuussa tiedonannon datavetoisesta taloudesta. Tiedonannossa kirjoitetaan uudesta teollisesta vallankumouksesta, jonka osatekijöinä ovat digitaalinen data, tietokoneistuminen ja automatisoituminen. Kehitykseen liittyvät myös pilvipalvelut, jotka palvelevat datataloutta vastaavasti kuin voimalaitokset palvelevat tuotantoteollisuutta.
Big Data, Open Data, My Data?
Big Datalla (iso data, massadata) ei ole yhtä vakiintunutta määritelmää, vaan se määritellään eri asiayhteyksissä eri tavoin. EU-komission tiedonannossa big data määritellään suuriksi määriksi erityyppistä dataa, joka tuotetaan suurella nopeudella erittäin monista erityyppisistä lähteistä.
Open Data (avoin data) puolestaan käsitetään dataeräksi, jota kaikki saavat käyttää vapaasti niin kaupallisissa kuin ei-kaupallisissa tarkoituksissa. Avoin data tuo hallinnon lähemmäs kansalaista ja vuorovaikutus yksilöiden ja hallinnon välillä paranee. Lisäksi avoin data voi toimia liiketoiminnan raaka-aineena.
Liikenne- ja viestintäministeriön 14.8.2014 julkaisemassa raportissa ”Big Datan hyödyntäminen” luodataan myös My Datan (omadata) käsitettä. Se liitetään toimintakulttuuriin, jossa yksilö voi hyödyntää organisaation palauttamaa yksilökohtaista tietoa. Tieto voi olla joko raakadataa tai jalostettua dataa, joka on esimerkiksi visualisoitu.
Kohti ihmiskeskeistä henkilötiedon hyödyntämistä
Data voi olla niin koneen antureiden tuottamaa kuin ihmiseen kiinteästi liittyvää henkilötietoa. Liikenne- ja viestintäministeriön rahoittamassa, omadataa koskevassa selvityksessä (tekijöinä Antti Poikola, Kai Kuikkaniemi ja Ossi Kuittinen, Open Knowledge Finland) nostetaan ihminen keskiöön.
Selvitys on tärkeä keskustelunavaus, joka on toteutettu yksityisyydensuoja edellä Privacy by design -hengessä. Selvityksessä korostetaan, että datan hyödyntämisen ja tietosuojan yhteensovittamisen yhtälö voidaan ratkaista vahvistamalla yksilön mahdollisuuksia heitä koskevien tietojen hallintaan. Tiedon keräämistä voidaan tarkastella niin yksilöiden kuin organisaatioidenkin näkökulmasta. Selvityksessä nostetaan omadata digitaalisen ajan ihmisoikeudeksi. Samalla kuitenkin muistutetaan, että kyse on myös uusista liiketoimintamahdollisuuksista.
Data haastaa
Immo Salon mukaan datan määrän kasvu asettaa haasteita datan säilyttämiselle, datan siirtämiselle ja datan ymmärtämiselle. Tarvitaan yhä parempia tallennusratkaisuja, tietoliikenneyhteyksiä ja analytiikkaa.
Kuten liikenne ja viestintäministeriön Big Data -raportissa korostetaan, datan hyödyntäminen edellyttää organisaatiorajat ylittävää yhteistyötä. Toiselle arvoton data saattaa olla toiselle hyvinkin arvokasta. On siis hyödynnettävä organisaation omaa dataa ja samalla suunnattava katse ympäröivään ekosysteemiin.
Raakadata ei itsessään riitä, vaan on osattava myös organisoida ja analysoida sitä. Tarvitaan monialaisia tiimejä, jotka koostuvat data-analyysin, koneoppimisen ja visualisoinnin asiantuntijoista. Big datan hyödyntämisen ei tule tapahtua erillisenä saarekkeena, vaan dataa on osattava käyttää kaikissa organisaation toiminnoissa.
Datatietoisuuden lisääminen
Liikenne- ja viestintäministeriön Big Data -raportissa korostetaan datatietoisuuden lisäämistä. Datatietoisuus tarkoittaa sitä, että ymmärretään datan potentiaalinen arvo ja riskit. Datatietoisuuteen liittyy myös datan tarkastelun rajojen kyseenalaistaminen, uusien lähteiden tunnistaminen ja jo edellä mainittu ulkoisten ja sisäisten lähteiden huomioiminen.
Näin tekijänoikeuslakimiehenä riskeistä ensimmäisenä mieleen tulevat henkilötietojen suojaan ja tekijänoikeuteen liittyvät sääntelykysymykset. Big data haastaa myös lainsäätäjän. On pohdittava, tarvitaanko tiedonlouhintaan liittyviä poikkeuksia tekijänoikeuslakiin. Datan yhdistely eri lähteistä haastaa taas henkilötietojen suojaan liittyvän lainsäädännön. Myös omadataselvityksessä todetaan, että sääntelyllä voi olla niin kiihdyttävä kuin hidastava vaikutus. Lainsäädäntö ei kuitenkaan yksin takaa muutosta. Voidaan ajatella, että lainsäädäntö on muutoksen moottori, mutta polttoaine on saatava yksilöiltä ja organisaatioilta.
Lisäksi sopimusasiantuntijoiden on löydettävä oikeat lausekkeet, jotka kattavat niin jatkokäytön kuin alkuperäisen käytön. Aina henkilötietoja kerättäessä ei osata aavistaa, mitä mahdollisuuksia data tarjoaisi.
Liikenne- ja viestintäministeriön raportissa korostetaan, että Big data tarjoaa ratkaisuja suuriin yhteiskunnallisiin ongelmiin. Big dataa hyödynnettäessä on muistettava niin datan arvo kuin siihen liittyvät riskit.
Big data mediatoimialalla
Mediatoimialalla big dataa voi ajatella hyödynnettävän sekä sisällöllisissä innovaatioissa (datajournalismi ym.) että kaupallistamisen kehittämisessä (käyttödatan parempi hyödyntäminen sekä mainostaja-asiakkaiden että kuluttaja-asiakkaiden palvelukokemus). Esimerkiksi vaalikonedataa voidaan avata jatkokäyttöä varten. Dataa hyödyntämällä myös kulttuuri ja taide voivat omilla keinoillaan kiinnittää huomiota yhteiskunnallisiin ongelmiin.
Yle haluaa kehittyä datatietoisena organisaationa:
- Kehitetään tietoa paremmin tuottavaa asiakaspalaute- ja asiakasdialogijärjestelmää.
- On aloitettu palveluiden käyttödatan avaaminen.
- Rakennetaan avointa rajapintaa (API) Ylen sisältöjen ja niihin liitettyjen metatietojen avaamiseksi myös ulkopuolisten sovellusten käyttöön.
Millaista innovointia ja edelläkävijyyttä Yle voisi mielestänne näyttää datan hyödyntämisessä?
Kuva: CC BY 2.0 Yle Arkisto
Lähteet:
COM2014(442) Kohti menestyvää datavetoista taloutta. http://ec.europa.eu/transparency/regdoc/rep/1/2014/FI/1-2014-442-FI-F1-1...
Liikenne- ja viestintäministeriön 13.8.2014 julkaisema raportti Big Datan hyödyntäminen
http://www.lvm.fi/julkaisu/4417803/big-datan-hyodyntaminen
Immo Salo: Big data – tiedon vallankumous. Jyväskylä 2013.
Marjut Salokannel: Julkisesta datasta avoimeen dataan – Julkisen datan lisensiointi.
http://www.etla.fi/wp-content/uploads/2012/09/dp1277.pdf
Antti Poikola, Kai Kuikkaniemi ja Ossi Kuittinen (Open Knowledge Finland): My Data – johdatus ihmiskeskeiseen henkilötiedon hyödyntämiseen. (Liikenne- ja viestintäministeriön rahoittama selvitys)
http://www.lvm.fi/julkaisu/-/view/4420389
1 kommentti
To 18.09.2014 @ 01:06
Pari sanaa yhtiöstänne: Lainsäädönnöllä on asetettu varainsiirto yhtiöllenne. Ja toiseksi, haluatte seurata käyttäjiä. Kolmanneksi, teidän egot ovat kasvaneet. Halutte tehdä pelkkiä viihdeohjelmia, ja nimeätte radio-ohjelmia toimittajienne mukaan. Haluatte tehdä työntekijöistään julkkiksia. Suurimman osan sisällöstänne ostatte mistä sattuu. Monesti haluatte lietsoa keskustelijoita hyökkäämään luomalla vastakkainasetteluja.
Jos perimmäinen tarkoitus on nykyisten työntekijöiden etu, niin vastaus on tietenkin uskottavisssa projekteissa.
Ja tämäkin kirjoitus herättää epäilyä: Miksi pitää käyttää kyseistä muotitermiä "Big Data", joka on vieläpä kirjoitettu isolla? Ja miksi aloittaa kirjoitus sanalla "Euroopan komissio"?
Mutta jos oletetaan Ylelle sen alkuperäinen tehtävä, niin voin kommentoida avointa dataa.
Olen 10 vuotta odottanut, että esim. Ylen ohjelmatiedot saisi avoimessa XML-muodossa, kuten Ruotsinradion ohjelmatiedot saa. Työntekijöittenne ego pakotti tekemään Ohjelmaopaasta yhä ulkonäkökeskeisemmän. Se sisältää HTML-, CSS-, ja javascript-kikkailua.
Avoimessa datassa on ongelmansa. Mitä tulee yksityisyyden suojaan, niin Ohjelmaopas ei pitäisi olla ongelma. Valtionsalaisuuksia koskevista ongelmista ei edes puhuta. Olisiko ohjelmatiedot salaisia tällä perusteella.
Pitää muistaa, että yleisradiolle on kuulunut myös ajattelutapojen luominen. Tämä on tapahtunut erityisesti fiktion avulla. Isänmaallisten tarinoiden tuottaminen ja ajattelun laventaminen vaikka Koulu-TV:ssä.
Minusta Ylen loogisin tehtävä tietoyhteiskunnassa voisi olla datamuodon luominen ja sen käyttäminen. Se olisi jatkoa ajattelutavoille.
Ehkä se merkittävin Ylen tuottama data löytyy teksti-tv:ssä. Se on tavallaan ihan oma kielensä, joka on kokeneelle käyttäjälle erittäin tehokas tapa hakea tietoa.