Conferentie

VVOJ2012 Verslag: Working with data (Part I & II)

Titel: Working with data (Part I and Part II)
Datum: 16 november 2012
Tijd: 14:00-15:15 uur (Part I) en 15:45-17:00 uur (Part II)
Sprekers: Nils Mulvad en Brant Houston (Part I) en David Donald en Jennifer LaFleur (Part II)
Aantal deelnemers: circa 50

Verslag: Petra Jacobs

Tikken, klikken, bookmarken, escapen, selecteren, zuchten, ploeteren, roepen… Van zoeken tot vinden in de wondere wereld van databases op het internet. Nils Mulvad en Brant Houston verklappen je waar en hoe. David Donald en Jennifer LaFleur vertellen je wat ermee te doen.

“Who’s using Google Advanced?”

Met het magere aantal opgestoken handen toont Brant Houston al van meet af aan dat er hier nog heel wat te leren valt. Bekend met Google, Excel, Word en spreadsheets zijn we echter allemaal.

De vroegere journalistiek was immers vooral véél interviewen en veldwerk verrichten, en af en toe werd je dan beloond met een documentje belangrijke cijfers. Maar daar gingen in de eerste plaats dus oneindig veel telefoontjes en tussenpersonen aan vooraf.

Houston getuigt dat hij het nog goed weet toen in 1980 de eerste elektronische documenten verschenen. Plots stond de informatie die je pas verkreeg na 10 maanden mensen lastigvallen, online voor het grijpen.

Klinkt allemaal veelbelovender dan het is. Er zijn helaas zeer weinig goede databases. Veel te vaak is het zoeken naar een speld in een hooiberg. De cijfers zijn het merendeel van de tijd erg onoverzichtelijk opgelijst en onleesbaar voor een onwetende die aan onderzoek doet.

Om dat probleem omtrent datajournalistiek voor een deel de wereld uit te helpen, stellen onze gasten enkele wel goed gebouwde databanken voor. Gevolg: een heel resem nuttige sites over allerhande onderwerpen, gaande van gezondheidszorg tot overheidsinstanties.

En dan een tip: “If you don’t find it, built it!”

Daarmee bedoelt Houston dat het altijd een goed idee is om zelf, en met anderen, een databank te bouwen. Het betekent namelijk dat je exclusieve informatie hebt. Zorg dat het een toekomst uitstraalt, dat mensen eraan willen toevoegen en dat het een referentie is. Zo kom je veel meer te weten dan je denkt.

Nils Mulvad pakt het woord over en vervolgt Houston’s uiteenzetting van betrekkelijke sites met hoe je ze moet “scrapen”. Scrapen betekent elimineren op het net, schrappen van wat niet van toepassing is.

“Sometimes you’re lucky that somebody got there before you and sorted everything out, but most of the time it’s SHIT!”

Houston noemt dit “The Zoo Theory”.

Waar vind je de dieren in de zoo? Hoe vind je alle relevante dingen en verzamel je die netjes bij elkaar? Dit doe je het best met programma’s als Python, Google Refine of op documentcloud.org.

Dè grote evolutie in het presenteren van data, is het visualiseren ervan.

Als vooruitstrevende voorbeelden worden twee sites naar voren geschoven: floatingsheep.org en theyrule.net.

Bij eerstgenoemde speelt humor een aparte rol. Creatief omgaan met data is volgens Houston iets wat we meer moeten doen. Het werkt veel efficiënter om de lezer te animeren terwijl je hem een hoeveelheid cijfers voorschotelt.

Maar wat doen we eens dat we die cijfers in handen hebben?

David Donald en Jennifer LaFleur doen een poging om ons te laten begrijpen wat je zoal met data kan doen. Een eerste logische stap is dan ook: “understand your data”.

Cijfers worden geregeld dichotoom voorgesteld. Er zijn dan maar twee mogelijkheden.

Onderzoek vervolgens hoe vaak een bepaald fenomeen voorkomt. Vergelijk bijvoorbeeld ook twee kenmerken uit de cijfertabellen met elkaar en leg de link. In de VS is er kennelijk een verband tussen cardiale zorg en het gezinsinkomen. “Correlation” en “regression” zijn hier de twee woorden die blijven hangen.

Wat volgt is nog een toelichting over hoe je een index maakt. Een zeer technische workshop waarover de sprekers achteraf zeggen dat ze niet verwachten dat we nu weten hoe het moet. Als je iets niet weet, vraag hulp. Belangrijkste noot in dit verhaal: “We can empower each other.”

Gerelateerde artikelen

Driekwart van de Woo-verzoeken (verzoek om openbaarmaking van documenten op grond van de Wet open overheid) die bij de ministeries in behandeling zijn, bevindt zich ver over de wettelijke termijnen. Van de 759 verzoeken die medio juni bij de ministeries lagen, waren er 575 al (veel) langer dan zes weken binnen. Zes weken is de termijn waarbinnen een besluit moet worden genomen over een Woo-verzoek. Tot 1 mei heetten deze aanvragen nog Wob-verzoeken.

De Wob verdwijnt per 1 mei en wordt vervangen door de WOO, de Wet Open Overheid. In het eerste VVOJ Café van dit jaar komt Annemarie Drahmann, universitair hoofddocent bestuursrecht aan de Universiteit Leiden, vertellen wat er verandert met de nieuwe wet.

Eindelijk weer samen! Dat gevoel overheerste op de VVOJ Conferentie 2021 in Brussel, die vlak voor het ingaan van zwaardere lockdown-maatregelen kon doorgaan. Vaste conferentiegangers weten dat het gesprekje in de wandelgang, het vlugge contact via de nieuwe conferentieapp en de kans om samenwerkingsplannen te smeden tijdens het diner minstens zo belangrijk zijn als de keynote-sprekers, de VVOJ-essayist en de meer dan 36 losse workshops en debatten.

Bjørn Oostra, hoofdredacteur De Limburger, is de winnaar het van het Vliegwiel, de prijs van de Vereniging van Onderzoeksjournalisten bedoeld voor de hoofdredacteur of manager die de onderzoeksjournalistiek dit jaar het meest heeft gestimuleerd.

Vorige week heeft de VVOJ het tweede Regiocafé gehouden waarin collega’s uit verschillende delen van het land de verhalen achter hun onderzoeksverhalen vertelden. Een doorslaand succes! Heb je het gemist of wil het herbekijken? Dan kan dat op YouTube.

Vanaf dinsdag 7 september staat de weg naar eeuwige roem voor onderzoeksjournalisten weer open: het is dan mogelijk om jezelf of anderen voor te dragen voor dé prijs voor onderzoeksjournalistiek: De Loep 2021!

Chris de Stoop kreeg afgelopen juni de oeuvreprijs van de VVOJ, maar ‘journalist’ voelt Chris De Stoop zich al jaren niet meer. Dus werkt de Vlaamse boerenzoon niet meer voor het toonaangevende weekblad Knack, maar wijdt hij zich aan het schrijven van boeken die – dat dan weer wel – alom geprezen worden om hun gedegen journalistieke onderzoek.

Op vrijdag 24 juni 2022 zijn op de Avond voor de Onderzoeksjournalistiek in Antwerpen de Oeuvreprijs 2022, de ASN Aanmoedigingsprijs 2021 en de Loep 2021 uitgereikt. Met deze prijzen viert de Vereniging van Onderzoeksjournalisten (VVOJ) jaarlijks de beste onderzoeksjournalistiek in Nederland en Vlaanderen.

Sluit je aan bij de vereniging van onderzoeksjournalisten

En vergroot je kennis én netwerk