Robotti aloitti otsikkotehtailun - poliisi vastasi kumiluodeilla

Botsikot on fiktiivisiä uutisotsikoita luova verkkopalvelu. Palvelussa on lista luoduista otsikoista, joista hauskimpia käyttäjät voivat tykätä eli "peukuttaa". Sivustoon liittyy myös olennaisesti Twitter-botti @Botsikot, joka tweettaa automaattisesti eniten peukutetut botsikot. Parhaimmillaan Botsikot ovat hauskoja, ajankohtaisia ja jopa sarkastisia tai kantaaottavia.

Botsikot

Idea Botsikoihin lähti Hacker News-palstalle lähetetystä sivusta joka generoi uusia otsikoita vanhojen Hacker News otsikoiden perusteella. Sivulle on linkitetty myös python-koodi, jolla otsikot on luotu. Otsikot luodaan lähdemateriaalin pohjalta hyödyntäen Markovin ketjuja. Käytännössä koodi laskee lähdemateriaalin perusteella tilastollisesti millä todennäköisyydellä mitkäkin sanat esiintyvät peräkkäin lauseessa. Tämän jälkeen koodi arpoo aiemmin laskettuja todennäköisyyksiä käyttäen uusia lauseita. Lopputuloksena syntyy siis lähdemateriaalissa esiintyneiden lauseiden yhdistelmiä. Markovin ketjut tuottavat useimmiten kieliopillisesti oikeita lauseita myös suomenkielellä, koska ne perustuvat sanojen tilastolliseen esiintymiseen eivätkä kielioppiin. Botsikot luodaan ainakin toistaiseksi myös tällä samalla Python scriptillä.

Koodin lisäksi otsikoiden luontiin tarvitaan myös lähdeaineistoksi kymmeniä tuhansia otsikoita. Mitä enemmän lähdeaineistoa on sitä alkuperäisimmältä luodut otsikot kuulostavat. Ylellä luodaan tuhansia uutisotsikoita joka viikko, mutta pelkästään Ylen otsikoita käytettäessä otsikoita täytyisi valita lähdeaineistoon hyvin pitkältä ajalta, jotta aineistoa saadaan tarpeeksi. Botsikot käyttääkin lähdeaineistona myös muiden suomalaisten verkkojulkaisujen otsikoita, jotka kerätään verkkosivujen RSS-syötteistä.

Botsikot eivät käytä lähdeaineistonaan kaikkia löydettyjä uutisia. Jokaisen löydetyn uutisen sosiaalisen median jakomäärät tarkistetaan tasaisin väliajoin ja lähdeaineistoksi kelpuutetaan vain artikkelit jotka ovat saaneet enemmän kuin yhden jaon Facebookissa, Twitterissä ja LinkedInissä yhteensä. Tällä tavoitellaan sitä että lähdeaineistona käytetään otsikoita joiden aiheistä Botsikoiden lukijat ovat todennäköisesti kuulleet. Lisäksi lähdeaineistona käytetään vain viimeisen kolmenkymmenen päivän aikana luotuja otsikoita botsikoiden aiheiden tuoreuden varmistamiseksi. 

Botsikoiden luontikoodin ja lähdeaineiston ohella palvelun ydin koostuu käyttöliittymästä, jossa botsikoita peukutetaan. Käyttöliittymä koostuu kolmesta osasta, joista yksi keskittyy kaikkien aikojen parhaimpien botsikoiden esittelyyn ja toinen viimeisen 24 tunnin sisällä luotujen botsikoiden esittelyyn. Etusivu listaa kaikki alle viikon vanhat botsikot, joita ei @Botsikot ei ole vielä tweetannut. Etusivu on siis lista botsikoista jotka @Botsikot tweettaa seuraavaksi.

Parhaat Botsikot

Idea Botsikoihin lähti siis muiden kirjoittamasta ja julkisesti jakamasta koodista, joka pystyi sellaisenaan hyödyntämään Ylellä jo olemassaolevaa suomenkielistä lähdeaineistoa. Botsikoiden ensimmäisen version lähdeaineistona toimi tietokannasta poimitun 10 000 sosiaalisessa mediassa jaetuimman uutisotikon lista, jota käyttäen manuaalisesti luotiin sata ensimmäistä botsikkoa. Ideat tweettibotista sekä peukutuskäyttöliittymästä syntyivät naureskellessamme näille ensimmäisille Botsikoille. Nämä ensimmäiset botsikot ovat jopa hauskempia kuin nykyisessä käyttöliittymässä näkyvät, koska lähdeaineisto on kerätty pidemmältä ajanjaksolta ja täten botsikoihin yhdistellyt asiat liittyvät harvemmin toisiinsa. Markovin ketjujen huumoriarvo kiteytyy loistavasti näihin kahteen esimerkkiin: "ISON-komeetta hipoi aurinkoa - vain twerkkaus puuttui" ja "Maa järisi kuusamossa - kyydissä kolme nuorta."

Käyttöliittymä ja Twitter-botti luotiin kolmen päivän aikana muun työn ohessa, jonka jälkeen linkki käyttöliittymään laitettiin jakoon Twitterissä. Botsikoihin tutustui ensimmäisen päivän aikana noin 2500 ihmistä ja botille kertyi reilut sata seuraajaa. Tällä hetkellä suurin osa botin seuraajista on teknologian edelläkävijöitä ja toimittajia, mutta voisikohan Botsikot kiinnostaa myös suurempaa yleisiöä? Ainakin Mikko Hyppönen ja Suomen UNICEF ry ovat kiinnostuneita.

Nyt kun Botsikoiden perustoiminnallisuudet ovat valmiit ja alkuperäinen visio on toteutettu on aikaa miettiä miten Botsikoita voisi kehittää tai hyödyntää johonkin muuhun tarkoitukseen. Botsikoiden seuraava kehityssuunta on vielä avoin, mutta ainakin sessiopohjainen käyttäjätunnistus tullaan vaihtamaan Ylen kaikki palvelut kattavaan käyttäjätunnusjärjestelmään. Myös Botsikon luontiin käytettävää koodia voisi parantaa monin tavoin. Ideointia on myös tehty uutistekstien sekä ingressien koneelliseksi luomiseksi, uutiskuvien automaattiseksi lisäämiseksi Ylen arkistoista tai joukkoistamalla. Onko sinulla ideoita miten Botsikoita voisi kehittää?

Mikäli sinulla on ainutlaatuista tekstiä jonka pohjalta haluat generoida uusia "Botsikoita" on Botsikoiden koodi on vapaasti käytettävissäsi ja saatavilla GitHubissa. Koodi sisältä tweettibotin, peukutuskäyttöliittymän ja laudeiden luontikoodin. Lähdeaineiston keräys ei ole kuulu tähän projektiin, mutta lähdeaineistona pystyy periaatteessa käyttämään mitä tahansa tekstiä raamatusta liikennetiedotteisiin. 

 

Suomalaisten itsenäisyyspäivä on jo varsin mobiili

Yle.fi:ssä oli koko itsenäisyyspäivän aikana 1.5 miljoonaa käyntiä, joista yhteensä kolmannes mobiili- ja tabletlaitteilta. Tabletin (15%) osuus lähestyy jo älypuhelimia (19.2%).

Linnan juhlat -aiheisilla jutuilla on ollut 7.12. puoleen päivään mennessä n. 460 000 lukukertaa. Luetuimpien juttujen kärjessä on odotetusti juhlapukuihin liittyviä artikkeleita, mutta kiakkovieras-uutisointikin on toki saanut lukijoita.

Suomenkielinen Twitter-liikenne tuplautui normaalista perjantai-iltana. Teksti-TV toi television juhlalähetyksiin yhteensä 1300 twiittiä.

Areenan livestream-käynnistykset alustoittain 6.12.2013

Koko päivän aikana Areenassa oli 311 000 livestream-käynnistystä. Klo 17-24 välillä käynnistyksiä oli 228 000, joista 21% mobiili- ja tabletlaitteilta. Illan viimeisellä tunnilla mobiili ja tablet muodostivat yhteensä jo yli kolmanneksen käynnistyksistä. Viime vuoteen verrattuna desktop-käynnistysten määrä jopa laski hieman, mutta kokonaisuutena illan livestartit kasvoivat 15%.

Katseluun käytetyn ajan osalta Areenan livestreamia katsottiin nelinkertainen määrä keskimääräiseen päivään verrattuna. Yhtä suureen livestreamin katselumäärään on tähän mennessä yltänyt vain aiemmin syksyllä näytetty suurta kiinnostusta herättänyt Costa Concordia -laivan nostourakka.

Suomalaiset verkossa 2013: Puhelin valloittaa itselleen lisää tilaa suomalaisten arjessa

35 % suomalaisista internetin käyttäjistä on katsonut puhelimellaan videoita tai tv-ohjelmia, kertoo Ylen teettämä Suomalaiset verkossa -tutkimus.

Tutkimuksen mukaan jo joka kolmas suomalainen internetin käyttäjä (32 %) käyttää nettiä puhelimella ja peräti 35 % on katsonut puhelimella videoita tai tv-ohjelmia.

Älytelevisio (televisio joka on kytketty internetiin) liittyy teknologian aikaisten omaksujien mediakäyttöön: 17 % suomalaisista netin käyttäjistä kertoo omistavansa älytelevision mutta vain 7 % katsoo älytelevisiollaan ohjelmia netistä. Yksi kymmenestä kyselyyn vastanneista ei osannut sanoa, onko kotona oleva tv-vastaanotin älytelevisio vai ei.

Puhelimen käyttö monipuolistuu, netin mobiilikäyttö kasvaa

Puhelimen merkitys suomalaisten median käytössä on kasvussa. Suomalaiset verkossa -tutkimuksesta käy ilmi esimerkiksi se, että nettiä puhelimen välityksellä käyttävien suomalaisten osuus on noussut jo 32 prosenttiin. Vastaava osuus vuonna 2010 oli 17 %.

Puhelimen käyttö on myös monipuolistunut. Vuonna 2013 suomalaisista 82 % on lähettänyt puhelimellaan kuvaviestin tai videon (2010: 75 %), 60 % on lukenut sähköposteja kännykästään (2010: 38 %) ja 41 % käyttänyt Facebookia tai muita sosiaalisen median palveluita puhelimellaan (2010: 25 %).

Yle tutki suomalaisten verkonkäyttöä tällä tavoin nyt toista kertaa. Tutkimukseen vastasi yhteensä 1092 iältään 15-74-vuotiasta suomalaista netin käyttäjää. Aineisto kerättiin huhtikuussa 2013.

Tutkimus toteutettiin sähköposti-informoituna verkkokyselynä. Tutkimus kuvaa nettiä käyttävien suomalaisten verkkokäyttäytymistä. Taustatietoina kysyttiin mm. sukupuolta, ikää, asuinpaikkaa ja koulutusta. Kyselyssä käytetty lomake löytyy osoitteesta http://bit.ly/sverkossa-lomake

Tutkimuksen tuloksia käytiin läpi julkistustilaisuudessa 18.6. klo 13-14, josta löytyy tallenne Yle Areenassa osoitteessa http://areena.yle.fi/tv/1951640.

Tilaisuudessa esitetty presentaatio on ladattu Slideshare-palveluun osoitteeseen http://www.slideshare.net/ylefi/suomalaiset-verkoss-2013-esitys-yleisradion-isossa-pajassa-1862013-klo-13

Lähdeaineisto avoimena datana

Yle tarjoaa tutkimuksen lähdeaineiston jatkokäyttöön yhdessä 15/30 Research -tutkimusyhtiön kanssa taulukkomuodossa Googlen Drive -palvelussa.

Linkki dataan: https://docs.google.com/spreadsheet/ccc?key=0Akc0L9drWLFldE5kRlpWcXBHNmpEaXJGYnJvamtDSVE#gid=0

Selitteet löytyvät taulukon toiselta välilehdeltä: https://docs.google.com/spreadsheet/ccc?key=0Akc0L9drWLFldE5kRlpWcXBHNmpEaXJGYnJvamtDSVE#gid=1

Aineisto julkaistaan CC-lisenssillä (CC BY-SA 3.0). Jaettavan datan sisältämää tietoa saa julkaista vapaasti ja sitä saa yhdistellä muuhun tietoon, kunhan julkaistaessa linkitetään tähän Ylen Kehitys kehittyy -blogin kirjoitukseen ja ilmoitetaan, että tiedon lähde on Yleisradion ja 15/30 Researchin tutkimusdata. Arvostamme, mikäli dataa käyttäessäsi lisäät kommentin tähän blogipostaukseen ja kerrot siitä myös muille. Mahdollisiin dataa koskeviin kysymyksiin pyrimme vastaamaan ensi tilassa.

Avointa dataa Ylen verkkopalveluiden käytöstä

Olemme tänään avanneet kaksi Google-dokumenttia, joihin syötetään automaattisesti Yleisradion digitaalisten palveluiden käytöstä kertovaa anonyymia dataa.

1. Yleisradion verkko- ja mobiilipalveluiden päivätavoittavuus

Ensimmäisessä dokumentissa on listattuna vuoden 2012 loka-marraskuun vaihteesta lähtien Yleisradion verkko- ja mobiilipalveluiden yhteenlaskettu päivätavoittavuus. Luku on eri selaimia päivässä, ja sen tuottaa Ylen käyttämä comScore Digital Analytix -mittausjärjestelmä. Käytännössä saman päivän aikana palveluun palaava selain kirjautuu lukuun vain kerran. Mikäli asiakas käyttää samaa selainta vaikkapa sekä Areenassa että Uutispalvelussa, tämä selain lasketaan luvussa vain yhdeksi selaimeksi. Mikäli sama asiakas käyttää Areenaa yhden päivän aikana kotikoneelta, työläppäriltä ja tabletilta, nämä kaikki lasketaan eri selaimiksi. Toisaalta myös yhteiskäytössä olevia koneita on paljon, jolloin samaa selainta voi käyttää useampi asiakas. Luku ei siis suoraan kuvaa Yleisradion verkkopalveluiden käyttäjämäärää vaan niiden eri selainten määrä, jotka teknisessä mittauksessa tunnistetaan Yle.fi -tasolla yhden päivän aikana.

Välilehdellä "Test" löytyy seuraavaa dataa:
- sarakkeessa A (date) on päivämäärä muodossa yyyymmdd
- sarakkeessa B (expected) on kullakin rivillä edellisen 10 vastaavan viikonpäivän eri selainten keskiarvo
- sarakkeessa C (currentcount) on automaattisesti 15 minuutin välein päivittyvä luku kuluvan päivän eri selaimista
- sarakkeessa D (timestamp) on epoch timestamp

Välilehden "Varttikertoimet" tarkoitus on kuvata sitä, miten eri viikonpäivinä Yle.fi-käyttö kertyy vuorokauden aikana. Esimerkiksi solussa E34 kuvataan kerroinluku, jolla edellisen 10 perjantain keskiarvosta saadaan laskettua luku joka vastaa sitä miten suuri osa päivän eri selaimista on kertynyt klo 8:00 mennessä. Tätä voidaan verrata sitten ensi perjantaina klo 8:00 kertyneeseen saman päivän dataan ja tarkastella olemmeko jäljessä vai edellä vertailuajankohtaan nähden.

Linkki Google Spreadsheetiin:
https://docs.google.com/spreadsheet/ccc?key=0Akc0L9drWLFldDZvVzlqN3VybE9...

2. Yleisradion verkkopalveluiden rullaava kysely

Toinen avattava dokumentti sisältää dataa siitä, miten Ylen verkkopalveluiden asiakkaat vastaavat ns. exit poll -tyyppiseen käynnin laatua mittaavaan kyselyyn. Kutsu vastata kyselyyn näytetään satunnaisesti valikoidulle joukolle Ylen palveluiden käyttäjiä, ja se on aina sidoksissa siihen Yle.fi-palveluun, johon asiakas saapuu. Kutsu kyselyyn esitetään sillä sivuston sivulla jolle asiakas ensiksi saapuu, ja lomake täytetään vasta käynnin jälkeen. Lomake sisältää sekä avoimia että suljettuja kysymyksiä, ja oheiseen taulukkoon olemme suodattaneet koko datasta suljettujen kysymystyyppien seuraavat vastaukset:

- sarakkeessa A (date) on vastauksen aikaleima.
- sarakkeessa B (onnistunut) on vastaus kysymykseen "Oliko käyntisi onnistunut", eli ns. task completion rate: 1=kyllä, 0=ei.
- sarakkeessa C (suosittelisitko) on vastaajan suositteluherkkyys, kysymys "Suosittelisitko XX-sivustoamme ystävällesi tai kollegallesi?", vastaus asteikolla 0-10 jossa 0=erittäin epätodennäköistä ja 10=erittäin todennäköistä. Vastausta käytetään nettosuositteluindeksin (NPS) laskentaan.
- sarakkeessa D (kiinnostavuus) on asteikolla 0-6 vastaus kysymykseen "Mitä mieltä olet XX-palvelustamme yleensä?". 6=erittäin kiinnostava, 5=kiinnostava, 4=melko kiinnostava, 3=ei kovin kiinnostava, 2=ei kiinnostava, 1=ei lainkaan kiinnostava, 0=en tunne palvelua.
- sarakkeessa E (monta) on kysytty "Kuinka moni henkilö taloudessanne käyttää laitetta, jolla vastaat kyselyyn?"
- sarakkeessa F (sukupuoli) on vastaajan ilmoittama sukupuoli, 1=mies, 0=nainen.
- sarakkeessa G (syntymävuosi) on vastaajan ilmoittama syntymävuosi, yyyy.
- sarakkeessa H (sivusto) on sen Yle.fi-palvelun nimi johon vastaaja saapui kun hänelle näytettiin kutsu osallistua kyselyyn.

Data on jaettu kahteen välilehteen. Ensimmäisellä lehdellä "27.4-28.5" on listattu ko. päivämäärien välillä annetut vastaukset eli kuukauden verran dataa. Seuraava välilehti "28.5-VIIMEISIN" päivittyy koko ajan automaattisesti sitä mukaa kun vastauksia kertyy.

Linkki Google Spreadsheetiin:
https://docs.google.com/spreadsheet/ccc?key=0Akc0L9drWLFldGNKVS1YNTBIbHA...

Aineisto julkaistaan CC-lisenssillä (CC BY-SA 3.0). Jaettavan datan sisältämää tietoa saa julkaista vapaasti ja sitä saa yhdistellä muuhun tietoon, kunhan julkaistaessa linkitetään tähän Ylen Kehitys kehittyy -blogin kirjoitukseen ja ilmoitetaan, että tiedon lähde on Yleisradion tutkimusdata. Arvostamme kovasti, mikäli dataa käyttäessäsi kommentoit tähän blogipostaukseen ja kerrot siitä myös muille. Mahdollisiin dataa koskeviin kysymyksiin pyrimme vastaamaan ensi tilassa.

Näitä datasettejä käytetään myös meneillään olevassa rekrytoinnissa, jossa Yleisradio hakee visualisointi- ja analytiikkadevaajaa. Lue lisää hakemuksesta: http://careers.fi/yle/careers.cgi?action=view&job_id=2488&lang=fin

Rajapintoja rajalle

Yle on astumassa verkkokehityksessä uudelle aikakaudelle. Ylen johdon linjaukset avaavat meille hienoja mahdollisuuksia ja uusia tapoja jakaa sisältöjä kaikille suomalaisille. Koneluettavien rajapintojen (Application programming interface, API) rakentaminen Ylelle on erittäin kova mutta samalla motivoiva urakka. Avaan tätä uutta ajattelua hieman teknisemmästä näkökulmasta.

Eat your own dogfood 

Ylen tekstipohjaisten internetpalvelujen arkkitehtuuri on pääosiltaan hyvin perinteinen Web-CMS-järjestelmiin perustuva kokonaisuus, jossa sisältö ja sisällön esitystapa ovat tiukassa liitoksessa. Rajapintojen avulla puramme tämän liitoksen ja samalla rakenteellistamme sisältömme, jolloin meidän on itse helpompi hallita eri päätelaitteisiin tehtävää julkaisua ja ennen kaikkea tehdä asioita nopeammin ja tehokkaammin kuluttajille näkyviksi palveluiksi. Olemme siis itse uusien rajapintojemme pääkäyttäjiä. Innoittajina uuteen suuntaan ovat olleet muun muassa Amazon, NPR, The Guardian ja Helsingin Sanomat omalla hs.fi-uudistuksellaan.

Parhaat palat internetistä

Rajapintojen toteutukseen käytämme internetissä koeteltuja teknologioita ja tapoja. HTTP, REST, JSON ja avoimen lähdekoodin ohjelmistot ovat uuden sisällön jakamisen teknisiä peruskiviä. Rajapinta-arkkitehtuurimme koostuu pienistä osista, ei yhden IT-toimittajan monoliitista. Tämä tuo toimintaamme ketteryyttä ja voimme tehdä työtä pitkäjänteisesti pala kerrallaan.

APIen tueksi olemme rakentamassa yhteisiä komponentteja, kuten autentikaatio, monitorointi ja kuormantasaus. Tätä mallia kutsutaan yleisesti API-fasadiksi. Lisäksi panostamme infrastruktuurin ketteryyteen ja automaattiseen skaalautumiseen sekä testaukseen.

Haemme uusia tekijöitä

Yllä kuvattu on meille vielä visio, jonka haluamme muuttaa todeksi mahdollisimman nopeasti. Tiimimme on jo tehnyt paljon tutkimusta ja kokeiluja, nyt on aika tehdä ensimmäisiä tuotantosovelluksia. Jos tunnet samaa intohimoa ja tekemisen paloa kuin me, tule auttamaan - meillä on mielenkiintoisia paikkoja auki:

http://careers.fi/yle/careers.cgi?action=view&job_id=2455&lang=fin 

http://careers.fi/yle/careers.cgi?action=view&job_id=2456&lang=fin

Asiasanat: 

Yle to open up its content, stay tuned!

Sami Kallinen (@sakalli) is Head of Yle Internet Development

I have a lot to be proud of as an Yle employee today. We decided some weeks ago to start systematically and increasingly opening up our content and data over the next few years.

Our goal is to have an Yle-API open for our partners, developer communities, and other interested parties by 2015. When different people and organisations can develop services and applications on top of our content and data, we will truly offer value for the Finnish tax-payers who fund our company. This will also enable open innovation and improve the quality of the services we produce in-house.

The first concrete results can be expected as early as the end of this year.

We believe that APIs and open data are part and parcel of operating a modern public service media company. Commonly funded content is distributed in ways that will take the best possible route into the everyday reality of the Finnish people. Yle is expected and even facing demands to open up its content, since the company’s funding changed from license fee-based to tax-based at the beginning of this year.

We live in the midst of many upheavals, and things are changing with incredible speed. In the media industry, global competition is accelerating, impressively skilled players are already in Finland, and many more are surely still to come. Thus, in order to remain relevant, Yle needs to be able to produce content and services that are of the same high quality and with the same agility as the Netflixes, HBOs, Apples and Googles of the world. Devices and technology will continue to become even more fragmented. The rate of this change is hard to understand. In light of these changes, findability is critical and active curating of content for our users is imperative. Acting on the Web becomes increasingly difficult as the mass of content increases and diversity of devices multiply; media usage patterns change and differentiate constantly.

The rapid growth of different devices is one of the biggest challenges we are facing from the technology perspective at the moment. The trend is clearly visible. The usage of our Web services on tablet devices has grown in just four months – from October to January – a whopping 67%!

And plenty of growth potential still exists. The BBC's iPlayer exemplifies this new reality with great clarity. Its desktop usage has fallen well below half, which means that nearly 60% of iPlayer usage happens through smart phones, tablets, game consoles, and the like. It is important, though, to remember that according to figures published last autumn, iPlayer supports 650 different devices.

Tele-text, which is still a surprisingly popular service in Finland, is an interesting example of how opening content can be accomplished with good results and how that in turn can help in dealing with device fragmentation. Tele-text applications have been created in Finland for all major phone platforms and even some rather obscure ones. These are the applications that use our content and that the Finns have developed for the devices of their choice without an active contribution from Yle.

We are also hoping for other types of benefits. Imagine a start-up that develops a special tablet for the elderly and wants to bring Yle content to the device. We would not have the resources to implement such a solution, but when we make our content presentation-free and structure it for multipurpose use, and we create a clear and open API, then the start-ups themselves can bring the content to their products, as long as certain conditions are met. Partners can build products and services that make our content more available for more people.

This is one of the ways we want to take Yle to the next Web era. Plenty of work remains: copyright issues and technology challenges still need to be addressed and resolved. We are currently busy with reforming the way we produce content for the Web. At the moment, a lot is unclear, but a clear direction is something that we already have.

Links:

Read more "open Yle" 

Examples of Tele-text applications:

Android: http://www.tekstitvpro.fi/
iOS: https://itunes.apple.com/fi/app/teksti-tv/id339380076?mt=8
Symbian: http://www.n8fin.com/teksti-tv-suomi-teksti-tv-v1-22http://store.ovi.com/content/39322http://www.samiplonn.com/
MeeGo http://my-meego.com/software/applications.php?fldAuto=903&faq=2
Windows Phone 7 http://www.adafy.com/tekstitv/
Windows Phone 8 http://www.windowsphone.com/fi-fi/store/app/teksti-tv/4994549d-8d05-49c2-9d09-c19a2f22299a

 

iPlayer supports 650 devices
iPlayer desktop use only 41%

Metatiedot kuntoon! Miksi ja miten?

Ylellä on puhuttu viime aikoina paljon metatiedosta. Lisäksi on päätetty, että Ylen metatiedot pitää saada kuntoon, jotta Ylen sisältöjen löydettävyys paranisi etenkin verkossa. 

Millainen kuntoutus metatiedoille sitten tarvitaan ja miten kunto edistää Ylen tavoittavuutta?

Verkko poikkeaa broadcastista ainakin siten, että broadcastissa asiakkaan huomiota tavoittelee vain kourallinen toimijoita (kotimaiset tv- ja radiokanavat) kun taas verkossa vaihtoehtojen määrä lähestyy ääretöntä. Ylen sisältö kilpailee niin Netflixin, Facebookin, Wikipedian kuin vaikkapa YouTuben kissavideoiden kanssa.

Jotta asiakas voisi verkossa valita, minkä sisällön seuraavaksi vastaanottaa, ja jotta valinta kohdistuisi Ylen sisältöön, ei riitä, että Yle julkaisee laadukasta sisältöä. Sisällöstä pitää myös kertoa niille, joita sisältö kiinnostaa. Asiakkaat eivät sokkona käynnistele videoita Areenasta, vaan valitsevat ohjelmia esimerkiksi ohjelman otsikon ja aiheen perusteella.

Metatieto on koukku

Metatieto on lupaus siitä, mitä saat, jos tutustut tähän sisältöön. Esimerkiksi jos ohjelma käsittelee Krista Siegfriedsiä, hiihtämistä tai hallituksen veropolitiikkaa, aina löytyy joku, joka on intohimoisesti kiinnostunut juuri tästä aiheesta. Metatieto on koukku, joka vetää yleisöä sisällön luokse.

Sisältöjä saatetaan käyttää monista eri syistä. Esimerkiksi sama videoleike Elävässä arkistossa saattaa kertoa rakkaudesta, Urho Kekkosesta ja 1960-luvun elämänmenosta. Emme Ylessä voi tietää tarkasti, mistä kulmasta kukakin sisältöjä etsii. Niinpä sisältö kannattaa kuvata monista eri näkökulmista, jolloin sisällön tarttumapinta kasvaa ja asiakas löytää paremmin erityisemmätkin mielenkiinnon kohteet, kuten vaikkapa rakkautta ja politiikkaa yhdistävät tarinat 1960-luvulta.

Metatietojen kuntoon saattaminen tarkoittaa näin ollen sitä, että Ylen jokainen ohjelma (ja muu sisältö) varustetaan metatiedolla, joka kertoo mitä saat, jos tämän sisällön avaat. Jos tietoa sisällöstä ei ole, ei sisältöä voi löytääkään. Jos sisältöä ei löydä, kannattaako sitä tehdä?

Ensin peruskunto, sitten 3 askelta eteenpäin

Tällä hetkellä Ylen ohjelmien metatiedot ovat puutteelliset. Esimerkiksi radio-ohjelmien esittelytekstit puuttuvat välillä kokonaan tai niissä on vain vakioteksti, kuten “viikon parhaat uudet biisit”. Tv-ohjelmissa puolestaan välillä unohdetaan, että ensilähetyksen jälkeen ohjelman elinkaari jatkuu Areenassa. Jos ohjelman tiedoissa on virhe, niin virhe tulee korjata vaikka ohjelman broadcast-lähetys meni jo.

Kun peruskunto on saavutettu, jää metatietoon vielä paljon kehittämisen varaa.

Seuraavassa kolme esimerkkiä tulevaisuuden mahdollisuuksista:

Elävä arkisto kuvaa jo nyt järjestelmällisesti sisällöissään esiintyvät henkilöt, paikat, organisaatiot, aiheet ym. Tämän ansiosta esimerkiksi Urho Kekkoseen liittyvät sisällöt löytyvät Elävässä arkistossa yksiselitteisesti. Lisäksi metatiedosta ilmenee, että Urho Kekkonen on henkilö. Myös Svenska Ylen verkkosivuilla yksilöidään artikkeleiden aiheet järjestelmällisesti, jolloin vaikkapa veroparatiiseista kertovat jutut löytyvät helposti.

Tätä Elävän arkiston ja Svenska Ylen tapaa kuvata sisältöjä voitaisiin laajentaa koko Ylen kattavaksi. Tulevaisuudessa, kun asiakas saapuu vaikkapa lukemaan Ylen uutisten juttua ajankohtaisesta aiheesta niin jutun yhteyteen linkitettäisiin kaikki muu Ylen sisältö samaan aiheeseen liittyen, organisaatiorajat ja siilot ylittäen sekä arkiston pitkää häntää tyylikkäästi heiluttaen. Eräänlaista automaattista taustoitusta ja sisältöjen ristiinmarkkinointia, jolloin Ylen sisältöjen käyttöaste kasvaa ja löydettävyys paranee.

Toiseksi: tiedon tulisi olla yksiselitteisempää. Esimerkiksi samannimiset henkilöt, kuten Erkki Liikanen - poliitikko vai taiteilija - tulisi pystyä erottamaan toisistaan. Samannimisiä paikkoja on myös paljon. Suomessa on esimerkiksi kymmeniä järviä, joiden nimi on Pyhäjärvi.

Kolmas metatiedon hyödyntämiskohde on teknisempi. Yle on päättänyt ottaa käyttöön rajapintalähtöisen (API) toimintatavan, jossa Ylen moninaisia sisäisiä tietojärjestelmiä ja sisällönhallintajärjestelmiä voi hyödyntää yhdenmukaisen rajapinnan kautta Ylen palveluissa kuten Areenassa tai Ylen uutissivustossa.

Metatiedon kuntoon saattaminen edistää sitä, että Ylen rajapinnat palauttavat mahdollisimman hyvälaatuista tietoa, jonka päälle on mahdollista luoda nykyistä parempia palveluita. Lisäksi, jos rajapinnat tulevaisuudessa avataan kenen tahansa käyttöön, niin nolottaa vähemmän, jos tiedot ovat kunnossa.

Kirjoittaja on konseptisuunnittelija Ylen verkkojulkaisuissa.

SEO-asiantuntija: meillä on sinulle töitä!

Meitä kiinnostaa kuulla sinusta, jos...

  • Tiedät mitä eroa on numeroilla 302 ja 301.
  • Tiedät että panda on muutakin kuin uhanalainen eläin.
  • SEO on sinulle vain toissijaisesti huoltoasema.
  • Osaisit kirjoittaa robotsia vaikka sinut herätettäisiin keskellä yötä.
  • Tykkäät ajatuksesta, että omistaisit yle.fi:n sisäisen hakukoneen, ja osaisit pitää siitä hyvää huolta.
  • Voit fyysisesti pahoin joka kerta nähdessäsi "lue lisää"- tai "klikkaa tästä"-ankkuritekstin.
  • Osaat esitellä optimoimiasi sivustoja sekä sisällön että koodin tasolla, ja kertoa miksi ja millaisia optimointistrategioita niissä on käytetty.
  • Ontologia ei kuulosta sinusta lääketieteen haaralta.
  • Sinusta on täysin normaalia vilkaista hiukan sivun lähdekoodia heti törmätessäsi uuteen sivustoon.
  • Osaat neuvoa, miten hakutulosten oheen lisätään video-thumbnailit tai jutun kirjoittaneen toimittajan pärstä.
  • Osaat viedä vanhan sivuston uudistuksen läpi säilyttäen hakukoneliikenteen täydellisesti.
  • Tykkäät numeroista ja tavoitteista.
  • Google Analytics sekä webmaster-työkalut löytyvät pakistasi.
  • Ehkäpä olet käyttänyt myös comScoren mittausjärjestelmiä (ainakin olet nopea oppimaan, ja web-analytiikka on sinulle normikauraa)?
  • Kokemus konversio-optimoinnista, hakusanamainonnasta tai A/B/MV-testauksestakaan ei varsinaisesti haittaa.
  • Ja koska olet lisäksi hyvä tyyppi, sinulta on helppo kysyä neuvoa ja ihmiset pitävät kanssasi työskentelystä.

Jos huomaat nyökkäileväsi itseksesi, lue eteenpäin.

Työpisteesi sijaitsee Helsingissä, Pasilassa. Tulet työskentelemään tiiviissä tiimissä, jota johtaa Sami Kallinen. Samin lisäksi tiimissä ovat tällä hetkellä Maria Hausen ja Leevi Kokko. Tämä Internetmedian kehitystiimi palvelee koko Yle.fi -tasolla mm. web-analytiikassa ja hakukoneisiin liittyvissä asioissa. Projekteja on ympäri taloa, ja pääset tekemään välittömästi töitä johtavien suomalaisten verkkobrändien parissa. Työskentelet hyvin monenlaisten ihmisten kanssa, toimittajista backend-koodaajiin. Sisäisten asiakkaiden tarpeet ovat hyvin kirjavia, ja kahta samanlaista työpäivää tuskin tulee: uutiskilpailussa tarvitaan nopeutta, Areenassa taas videohakutulosten optimointia. Sinulta voidaan myös kysyä miten vaikkapa ohjelmatietojen löydettävyyttä mobiilissa tulisi kehittää.

Sinun tulisi ehdottomasti olla proaktiivinen tyyppi, joka osaa myös omatoimisesti löytää (ja myydä sisäisesti) mahdollisuuksia palveluoptimoinnissa. Työmaasi on varsin itsenäinen, ja vastaat tontistasi täysimääräisesti. Toisaalta kollegasi ympäri taloa ovat oman alansa huippuosaajia, ja tukevat sinua työssäsi.

Pääset suoraan Ylen strategiseen ytimeen, sillä löydettävyys on yksi alkaneen vuoden isoimpia teemoja koko yhtiössä. Tämän voi todeta esim. Julkaisut-yksikön johtajan Ismo Silvon tuoreesta blogimerkinnästä.

Meidän täytyisi ylläpitää ja kasvattaa yli viittä miljoonaa hakukonekäyntiä kuukaudessa, joten aletaanko hommiin?

Hae tammikuun loppuun mennessä. Hakemuslomakkeen löydät Careers.fi -palvelusta, ja lisätietoja tehtävästä voit kysyä Kallisen Samilta numerosta 0400129499 tai sami.kallinen@yle.fi.

Ti 03.04.2012 @ 15:28Mika Rahkonen

Viikko journalismin tulevaisuudessa: Facebook – uutiset: 35 - 1

Netinkäyttötilastot ovat omiaan pitämään uutisväkeä nöyränä. Tai niin sitä ainakin luulisi.

Amerikkalaiset ovat räknanneet, että käyttäjät viipyivät joulukuussa suosituimmilla netin uutissaiteilla kaksitoista minuuttia. Siis koko joulukuun mitassa, kuukauden aikana.

 Mikä mahtoi olla vastaava luku Facebookissa? 423 minuuttia, eli pikkuisen yli seitsemän tuntia. Nopea laskutoimitus: Facebookissa kuluu yhdysvaltalaisilta aikaa kolmekymmentäviisi kertaa niin paljon kuin uutissivuilla.

Luvut ovat peräisin pari viikkoa sitten julkaistusta amerikkalaisesta State Of The News Media –tutkimuksesta.

 Pumaska on journalismin suunnista kiinnostuneen aarreaitta. 

Tänä vuonna fokus on tavallista hienompien yleisöraporttien lisäksi uutisten mobiilissa kulutuksessa.

*

Lisää Facebookista.

Economist, tuo pitkiä ja vaikeasanaisia tekstejä julkaiseva talouslehti, on saanut miljoona fania Facebookiin.

Kuka näitä laskee, mutta onhan se paljon. Se on yli kaksi kertaa niin paljon kuin Wall Street Journalilla, mutta vasta puolet siitä mitä New York Timesilla, joka taisi olla ensimmäisiä suuria mediataloja, jotka hoksasivat, että Facebookin timeline on mainio konsti kertoa historiastaan. 

*

Viime viikkojen suuria sosiaalisen(kin) median tapauksia Yhdysvalloissa on ollut Trayvon Martinin tragedia.

Knowyourmeme.com on tehnyt aiheesta Storify-esityksille sukua olevan koosteen, joka on aika hyvä.

Millaisia reaktioita surma aiheutti, miten kiinnostus näkyi verkossa ja keneltä pääsi suurin sammakko? Jälkimmäistä kisaa taitaa johtaa viiksekäs talk show –julkkis Geraldo Rivera.

*

Guardian on tehnyt interaktiivisen nettihärpäkkeen, joka olisi Suomessakin ajankohtainen: miten vero- ja etuuspäätökset vaikuttavat millaiseenkin perheeseen. Esimerkkitalouksia on niin paljon, että valtava enemmistö niistä varmasti itsensä löytää, ja seurauksia on uskallettu yksinkertaistaa ymmärrettäviksi. 

Päivän infografiikoista ensimmäistä voidaan pitää vaikka yhtenä näkökulmana Suomen loputtomaan tuloerokeskusteluun.

Graafi kertoo, miten paljon Yhdysvaltain suurimpien ammattilaissarjojen urheilijat tienasivat viime vuonna.

Paras liksa on koripalloilijoilla. Höh, tietysti on.

Tuo graafi on muuten napattu newyorkilaisen Columbian yliopiston digitaalisen median professorin Sree Sreenivasanin viikoittaisesta sosiaalisen median koosteesta. Sree näyttää ehtivän kirjoittaa omaa koostettaan säännöllisemmin kuin allekirjoittanut.

Ja Sree on ns. ajan tasalla, joten saittia kannattaa seurata, jos aihe kiinnostaa. Sanokaa terveisiä. 

*

Kaikki vähänkin netissä ympäriinsä pläräilleet tietävät, että suurin sosiaalisen median hitti on nyt Pinterest.

Sen käyttäjämäärä on melkein kymmenkertaistunut alle puolessa vuodessa.

Tässä grafiikassa mietitään, mikä tekee Pinterestistä niin vetävän. 

*

Kevennys.

Me täällä mediassa joskus käytämme aika lailla aikaa miettiäksemme, millaiset videoklipit kiinnostaisivat yleisöjä. Siis niiden ilmeisimpien lisäksi.

Miten olisi video kännisestä kanadalaisäijästä, joka laulaa poliisiauton takapenkillä Queenin Bohemian Rhapsodyn? Kokonaan.

Blogit.yle.fi: näin käyttäjät klikkaavat

Ylen blogipalvelun uusi versio on ollut käytössä nyt kuukauden ajan.

Uudistus näyttää toimivalta. Palaute on ollut positiivista ja käyttäjämäärät ovat nousseet selvästi. Myös mobiilikäyttäjiä on ollut aiempaa enemmän.

Yhtenä työkaluna blogien ja muidenkin Ylen web-paveluiden käytön seurannassa on Crazy Egg -niminen työkalu, joka luo ns. heatmap -kuvia palveluiden käytöstä. Crazy Eggin luoma kuva kertoo, miten käyttäjät palvelussa hiirellään klikkaavat. Käyttäjien klikkauksia ei yksilöidä: emme siis tiedä, kuka käyttäjä klikkaa mitäkin.

Oheisessa kuvassa blogit.yle.fi:n etusivun päälle muodostuu kuvaaja siitä, mihin kohtaa sivua käyttäjät ovat klikanneet. Mitä kirkkaampi piste, sitä suurempi on klikkausmäärä. Yksittäiset siniset pisteet kertovat yhdestä tai muutamasta klikkauksesta.

Mitä kuva sitten kertoo? Hakua klikkaillaan ahkerasti, samoin blogipalvelun etusivulle vievää linkkiä. Etusivun aikajärjestyksessä listattuja blogeja klikkaillaan myös, aivan erityisesti MOT-ohjelman blogin linkkiä. Nämä eivät ole erityisen yllättäviä tietoja.

Pari jatkokehitykseen ideoita antavaa huomiota. Blogit aakkosjärjestyksessä listaavaa linkkiä klikataan suhteellisen usein. Pitäisikö oletusnäkymänä blogit.yle.fi:ssä olla blogien lista aakkosjärjestyksessä? Ja mahdollisesti nykyistä pidempänä, sillä listausta pidentävää linkkiä klikkaillaan varsin paljon myös. Vai kertooko kuva siitä, että käyttäjät haluavat tuoreimpien blogimerkintöjen listan lisäksi nähdä myös aakkosellisen listan? 

Kirjoittaja on Yle Internetin palvelupäällikkö




Sivut

Kehitys kehittyy - kokeile ja kommentoi yle.fi:tä

Tässä ryhmäblogissa yle.fi:n tekijät kertovat tulevista verkkopalveluista sekä valottavat ajatuksiaan suunnitelmien takaa.

Blogiarkisto