Kenniscentrum

‘Journalisten moeten meer database-onderzoek doen’

Tekst: Rachel Levy

Je kunt natuurlijk de kwartaalcijfers van de NVM of het Kadaster gebruiken om een analyse van de Nederlandse woningmarkt te maken. Maar wat als je meer wilt vertellen over de woningmarkt dan zo’n kwartaalrapport je kan vertellen? Arlen Poort ging in 2004 een samenwerkingsverband aan met het data-analysebureau Dankers & Frank.

Dat resulteerde op 17 januari 2009 in een ongekend diepgravende publicatie samen met collega Melle Garschagen over ontwikkelingen op de Nederlandse woningmarkt.

Aan VVOJ-webredacteur Rachel Levy vertelt Poort over het belang van database-onderzoek voor de journalistiek en de manier waarop de woningmarktpublicatie tot stand kwam.

‘Dit project begon in 2004 met collega Freek Staps, destijds verantwoordelijk voor de huizenmarkt bij de redactie economie van NRC Handelsblad. We wilden een analyse doen van de woningmarkt en werden juist toen benaderd door Dankers & Frank.

Samen verzamelden we de gegevens van de Nederlandse woningmarkt, gewoon door het opslaan van de informatie die de makelaarswebsite Funda bood. We publiceerden dat jaar drie artikelen over de huizenmarkt.’

‘In mei 2008 bedacht ik mij dat de kredietcrisis ook wel eens gevolgen voor de Nederlandse woningmarkt kon hebben. Ik had inmiddels een cursus gevolgd in het downloaden van dit soort gegevens bij IRE, de Amerikaanse zusterorganisatie van de VVOJ.’

‘Ik was al een tijdje gegevens van Funda aan het verzamelen toen Dankers & Frank mij weer belde. Het bureau werkte op dat moment samen met de ING Bank en had gezien dat er flink wat woningprijsaanpassingen waren.

Ze vertelden dat ze de gegevens van de afgelopen vier jaar van Funda steeds hadden bewaard, en boden dat aan. Zo had ik dus ineens de beschikking over in totaal vijf jaar aan woningmarktgegevens.’

‘Het downloaden van dit soort grote databases is niet zo ingewikkeld. Bij de IRE-cursus – feitelijk drie workshops! – had ik de programmeertaal Practical Extraction and Reporting Language ofwel PERL geleerd.

Met PERL kun je een klein progamma schrijven waarmee je gegevens binnenhaalt. Je kunt daarbij aangeven in welke gegevens je wel en niet geïnteresseerd bent. In mijn geval was dat bijvoorbeeld het adres en de prijs van de woning.’

‘Feitelijk gaat het bij mij zo. Ik laat wekelijks de computer de gegevens downloaden. Dat duurt twee dagen en ondertussen doe ik andere dingen. Daarna importeer ik de gegevens in Microsoft Access, een database-programma.

Om te kunnen zien hoe het de huizen vergaat, haal ik de overbodige informatie eruit. Dat doe je met een zogeheten ‘query’, een opdracht aan het programma. In de, bijvoorbeeld, 12 weken dat een woning te koop staat, hoef ik niet twaalf keer de prijs te weten.

Wel wil ik de beginvraagprijs weten, eventuele prijsdalingmomenten, en de laatst bekende prijs voordat de woning eruit wordt gehaald (lees: verkocht is).

Je kunt met behulp van PERL al direct ervoor zorgen dat die overbodige informatie eruit gaat, maar ik doe dat pas in Access.’

‘Het wissen van de overbodige informatie kost de pc behoorlijk wat tijd. Maar je kunt ondertussen wel ander werk doen. Het echte arbeidsintensieve werk begint pas daarna: bij het geocoderen van de gegevens. Dat betekent dat je de adressen codeert en op een landkaart zet.

Daarna moet ik gaan geocorderen, dus alles adressen coderen op een landkaart zetten. Dat doe ik met MapInfo.’

Omdat er weinig ingewikkelde handelingen bij komen kijken, is het onderzoek relatief goedkoop, zegt Poort. Maar hoeveel tijd kost het?

‘Het opzetten en inrichten van de structuur van een database, helemaal in het begin, kostte mij ongeveer twee volle werkweken. Dat was lastig. Het wekelijks downloaden van de gegevens kost de computer twee dagen. Het importeren van die gegevens in Microsoft Access kost een uur. Ik schat dat ik hier wekelijks 2,5 uur mee bezig ben geweest.’

Poort loopt nog met verschillende ideeën rond voor database-onderzoek. ‘Justitie publiceert altijd de namen van de mensen die in de schuldsanering terecht komen.

Daarbij geven ze ook de geboorteplaats, datum en het adres van die mensen. Daar zou je iets interessants mee kunnen doen, zoals onderzoeken of er plekken zijn in Nederland waar meer mensen een schuld hebben dan elders.’

Een ander idee, zegt Poort, is zijn eigen Funda gegevens gebruiken om te kijken of de ontwikkelingen in de Vogelaarwijken anders zijn dan in andere buurten.

Maar in Zweden kun je van alle mensen in het land zien hoe veel ze verdienen en hoeveel belasting ze betalen, dat is een openbaar register.

Database onderzoek staat in Nederland en Vlaanderen nog in de kinderschoenen, aldus Poort.
Bij kranten in de Verenigde Staten, waar overheden ook meer databases geheel openbaar maken dan in Nederland, zijn volgens Poort al sinds de jaren tachtig complete redacties die zich uitsluitend met database onderzoek bezighouden.

‘Daar zie je dat kranten ook regelmatig dit soort onderzoek publiceren als wat ik nu heb gedaan,’ aldus Poort.

De NRC-onderzoeksjournalist vermoedt dat er bij Nederlandse en Belgische journalisten te weinig kennis is over het doen van dit soort onderzoek. Jammer, zegt Poort, wan zo moeilijk is het niet.

‘Ikzelf kom van de school van de journalistiek maar was altijd in computers geïnteresseerd. In de jaren negentig ging ik bij de toenmalige NRC-bijlage Profiel werken, waarvoor veel kaarten en infographics moesten worden gemaakt. Zo heb ik mij het verzamelen en verwerken van gegevens eigen gemaakt.’

‘Je moet gewoon ergens beginnen. Zelf wat boeken kopen, naar wat cursussen gaan. En ik vind journalistieke opleidingen dit soort vaardigheden sowieso moeten aanbieden. Ik weet niet in hoeverre dit nu precies gebeurt, maar mijn ervaring met stagiaires die wij bij het NRC Handelsblad krijgen, is dat zij niet over dit soort kennis beschikken.’

Poort merkt op dat de cursussen die de VVOJ op dit gebied geeft meestal wel heel druk worden bezocht, maar dat het aantal publicaties dat daarna volgt van de deelnemers, beperkt blijft.

‘Je moet natuurlijk wel je chef zien te overtuigen dat het zin heeft om je – deels – vrij te maken voor dit soort onderzoek. Je moet zelf echt een doorzetter zijn om dit te doen.’

Meer weten over database-onderzoek? Mail Arlen Poort, poort@nrc.nl. Heeft u zelf een bijzonder journalistiek onderzoek gedaan en wilt u vakgenoten erover vertellen in de rubriek Dossier Onderzoek? Mail de webredactie van de VVOJ, webredactie@vvoj.org

Sluit je aan bij de vereniging van onderzoeksjournalisten

En vergroot je kennis én netwerk