Conferentie

VVOJ2012 verslag: working with data Part I (2)

Titel: Working with data PART 1: Finding what’s available (Dutch / Flemish databases).
Sprekers: Arlen Poort (NRC Handelsblad) en Maarten Lambrechts (MO*).
Datum: 16 november 2012
Tijd: 14:00-15:15 uur

Verslag: Michaël Aussems en Isabelle Gheldolf

Maarten Lambrechts en Arlen Poort beantwoordden in hun workshop heel wat vragen over de praktische kant van datajournalistiek in België en Nederland. Aan tips en tricks geen gebrek, zowel een nieuwkomer in als ervaren rotten konden er wat van opsteken. Wij selecteerden de drie belangrijkste tips voor wie een succesvol datajournalist wil worden.

Tip 1: gebruik bestaande databases voor nieuwe doeleinden
De overheid stelt een heleboel databases ter beschikking via het web maar ook via commerciële instanties. De kans dat iemand een gegevensbestand bijhoudt die een exact antwoord geeft op jouw vraag is echter klein. Een database wordt opgesteld met een bepaald doel, maar dat kan ook voor andere doeleinden gebruikt worden. Bijvoorbeeld supermarkten als Albert Heijn en Delhaize hebben al hun producten online staan. Door deze pagina’s te scrapen kan je de supermarktoorlog volgen.

Tip 2: Webscrapen!
Webscrapen is een techniek om op een geautomatiseerde wijze informatie van het web te halen. Stel dat je de prijsevolutie in de huizenmarkt wil nagaan: de website funda.nl verstrekt actuele gegevens over de prijs van huizen, maar je kan slechts zoeken op provincie en er verschijnen maximaal vijftien resultaten per pagina. Onbegonnen werk om zo wekelijks voor alle provincies de honderden webpagina’s te doorlopen. Een webscraper biedt de oplossing. Zo’n zelfgeschreven programmaatje verzamelt de gegevens die je wil volledig automatisch. Helaas zit er een addertje onder het gras: wie een webscraper wil maken moet een beetje kunnen programmeren. “Helemaal niet zo moeilijk”, aldus Poort, “en meer dan de moeite waard.” Geïnteresseerden kunnen alvast kennis vergaren via scraperwiki.com

Tip 3: Combineer gegevensbestanden
Eén database is goed, twee is beter. Een reeks gegevens van het KMI kan interessant zijn om bijvoorbeeld te onderzoeken of bepaalde maanden droger waren dan anderen. Een ander gegevensbestand kan informatie bevatten over het aantal verkeersdoden per dag, inclusief de betrokken voortuigen. Leg die twee databases naast elkaar en er gaat een hele nieuwe wereld open. Wat is het verband tussen slecht weer en ongevallen? Sterven er meer motorrijders op de eerste dag mooi weer na een koude winter?

Tip 4: Invalshoeken
Via twee invalshoeken kan je aan datajournalistiek doen. Enerzijds kan je bezig zijn met een concreet onderzoek en daar relevante gegevens over zoeken. Anderzijds kan je vertrekken van beschikbare databases. Die bestanden onderzoek je om tot een verhaal te komen.

Gerelateerde artikelen

conferentie-1x

Claimen en framen, dat was het thema van de conferentie 2023. Wie claimt en framet stuurt de dialoog, zet thema’s op scherp en maakt andere geluiden vaak monddood. Hoe gaan we hier als onderzoeksjournalisten mee om? Hoe bewegen we ons in een wereld van wantrouwen? Daarover ging het onder meer tijdens twee succesvolle en verrijkende conferentiedagen op vrijdag 17 en zaterdag 18 november 2023 in Gent.

conferentie-1x

Eind 2013 ontvangt de gemeenteraad van Birmingham, Engeland – een merkwaardige anonieme brief waarin melding wordt gemaakt van een complot van Islamisten om openbare scholen in een achterstandswijk over te nemen. Het geheime plan had de codenaam Operation Trojan Horse. De brief wordt intern snel ontmaskerd als nep, maar veroorzaakt toch landelijke paniek als die in maart 2014 lekt naar de pers. Anekdotes over leerkrachten die Salafistische gedachten in de hoofden van hun leerlingen pompen en hun vrouwelijke collega’s discrimineren, buitelen over elkaar heen in de media.

Sluit je aan bij de vereniging van onderzoeksjournalisten

En vergroot je kennis én netwerk