Avoindata ja Word Cloud

Tilaa tästä veneen nimi- ja rekisteritunnustarrat

Liikenteen turvallisuusvirasto julkaisi uutta avointa dataa tämän vuoden alussa. Testailin viraston uutta Ajoneuvojen avoin data 4.8 dataa. Tiedostossa on melkein 5 miljoonaa riviä eli kyseessä on hyvinkin Big Data. Data ei mahdu esimerkiksi Exceliin. Olen opiskellut datalouhintaa viimesyksystä saakka Kajaanin Ammattikorkeakoulussa. Koen, että nämä uudet avoimet datalähteet saattavat mahdollistaa uusia liike-ideoita. Onhan ne kustannettu veronmaksajien rahalla, joten on ihan hyvä asia kun ne on julkaistu.

Tein RStudiolla testinä datasta sanapilven ja muutaman histogrammin. Käytin kuvien otantana vain osaa datasta. Eniten rekisteröidyt näyttäisivät olevan Toyota ja Volkswagen. Tosin uusissa matalapäästöisissä kulkuneuvoissa Ford on alkanut nousemaan tilastossa. Itse koen, että tilastojen tutkiminen ja niistä tiedon etsiminen on mukavaa ajankulua. Ehkä tälläisen datalouhimisen ympärille pystyisi myös kehittämään jonkinlaisen työnkuvan.

Lähteet:

http://www.trafi.fi/tietopalvelut/avoin_data
https://github.com/tomtom7979/