Titel: Data verzamelen
Datum en tijd: 16 november 2013, 14:00 uur
Sprekers: Peter Verweij (3DMedia) en Arlen Poort (NRC Handelsblad).
Aantal deelnemers: ongeveer 15
door Guus Daamen
Scrapen en Scripten aan de hand van Google Drive, Google Spreadssheets, Outwit Hub en Scraperwiki. Het lokaal zat vol met Datajournalisten. Dat is logisch gezien het onderwerp van de presentatie. Werken met Outwit Hub bijvoorbeeld. Een geweldig programma en spotgoedkoop volgens Verweij van 3DMedia. ,,Voor 75 dollar ben je klaar en kan je HTML-informatie makkelijk in een spreadsheet krijgen.’’
Hij illustreerde aan de hand van de burgemeesters van Nederland, een lijstje op Wikipedia, hoe je er een overzichtelijk geheel van maakt, het kan gebruiken in Excel en er grafieken mee kan maken in Tableau Public. ,,Je zet Outwit Hub aan, stopt er wat in, stopt het in Tableau en er rolt een prachtig overzicht uit.’’ Maar het was toch wat ingewikkelder dan dat hij deed voorkomen.
Om een Scraper te kunnen maken in Outwit Hub moet je namelijk een script kunnen schrijven. Computertaal dus. Verweij adviseerde journalisten het boek ‘Scraping for Journalists’. ,,Een geweldig boek, waar alles instaat.’’
Arlen Poort hield daarna een workshop over het handige Google Drive. Daarmee is het mogelijk om Excel-bestanden makkelijk te verwerken tot handige grafieken. Ook kun je HTML-informatie makkelijk in een tabel krijgen. Met een beetje handig zoeken kun je op internet veel bruikbare scripts vinden.
Google Drive neemt veel werk uit handen, alle burgemeesters van Nederland en hun partij invoeren met de hand, dat is ene tijdrovend karwei. Dit soort programma’s kunnen de journalist daarbij dan ook veel werk uit handen nemen. Toch kunnen er ook dingen fout gaan. Vooral in Outwit Hub moet je als journalist goed opletten dat de informatie goed wordt verwerkt, en het script goed in elkaar zit.
Peter Verweij heeft op zijn eigen blog een uitgebreidere beschrijving staan in het Engels.