Conferentie, Kenniscentrum

VVOJ2013 verslag: Data opschonen

Titel: Data opschonen
Datum en tijd: 16 november, 2013, 10:45 uur
Spreker: Arlen Poort (NRC)
Aantal deelnemers: ongeveer 25

door Guus Daamen

Volgens Arlen Poort, hoofdredacteur en datajournalist van NRC, is OpenRefine (voorheen GoogleRefine) een ‘automagisch’ programma en erg geschikt voor het opschonen van bepaalde datalijsten.

In zijn workshop leerde hij de journalisten te werken met het programma dat vooral erg geschikt is voor terugkerende zaken zoals de jaarlijkse lintjesregen. Hij leerde de journalisten het script van het programma, dat voor sommige werd aangezien als hogere ICT-kunde. Ook Poort zelf moest regelmatig de ‘Hulp-functie’ van het programma erbij pakken. Maar als je eenmaal een script hebt geschreven, kun je daar ieder jaar weer gebruik van maken.

Het programma zoekt voor je uit wat dezelfde naam heeft, en wat niet, maakt verschillende lijsten, selecteert de lijsten en maakt een handig overzicht zodat je alleen nog op de grafiekknop hoeft te drukken, of wat je dan ook maar wil maken. ,,Als ik jullie was zou ik gewoon thuis even uitproberen wat je er allemaal mee kan, en dat is heel veel’’, zei Poort over het programma dat nog wel steeds van Google is, ondanks de naamwijziging.

,,Voor journalisten is ‘Tekst Facet’ de belangrijkste functie van Refine’’, zei hij tijdens zijn workshop tijdens het VVOJ-congres. Het programma herkent bepaalde tekst vormen en zoekt naar een match. Daarmee kan je uit onoverzichtelijke Excel-bestanden toch een mooie tabel krijgen. Die kan je opslaan en vervolgens gebruiken in een spreadsheet of in grafieken.

Het programma gaat via het opgegeven script op  zoek naar overeenkomsten en op basis daarvan zijn dan weer heel makkelijk lijstjes te maken. Omdat er veel werd uitgelegd over het programma en het script dat je moet kunnen schrijven, was aanwezigheid bij de workshop  toch echt noodzakelijk om een goed beeld te krijgen van OpenRefine. Of zoals Arlen Poort de journalisten adviseerde: ,,Ga zelf even een regenachtige zaterdagmiddag klooien met het programma en je leer het vanzelf.’’’

 

Gerelateerde artikelen

conferentie-1x

Claimen en framen, dat was het thema van de conferentie 2023. Wie claimt en framet stuurt de dialoog, zet thema’s op scherp en maakt andere geluiden vaak monddood. Hoe gaan we hier als onderzoeksjournalisten mee om? Hoe bewegen we ons in een wereld van wantrouwen? Daarover ging het onder meer tijdens twee succesvolle en verrijkende conferentiedagen op vrijdag 17 en zaterdag 18 november 2023 in Gent.

conferentie-1x

Eind 2013 ontvangt de gemeenteraad van Birmingham, Engeland – een merkwaardige anonieme brief waarin melding wordt gemaakt van een complot van Islamisten om openbare scholen in een achterstandswijk over te nemen. Het geheime plan had de codenaam Operation Trojan Horse. De brief wordt intern snel ontmaskerd als nep, maar veroorzaakt toch landelijke paniek als die in maart 2014 lekt naar de pers. Anekdotes over leerkrachten die Salafistische gedachten in de hoofden van hun leerlingen pompen en hun vrouwelijke collega’s discrimineren, buitelen over elkaar heen in de media.

Sluit je aan bij de vereniging van onderzoeksjournalisten

En vergroot je kennis én netwerk