Stefania Milan: ‘Big data geeft macht’

Nieuws

Stefania Milan is hoogleraar datajournalistiek aan de Universiteit van Tilburg, Nederland en doet onderzoek bij de Munk School of Global Affairs van de Universiteit van Toronto in Canada. Ze zegt vooral gefascineerd te zijn over de ‘wisselwerking tussen technologie en samenleving.’ Ze is geïnteresseerd in de mogelijkheden van zelfregulatie, emancipatie en autonomie die de digitale technologie met zich meebrengt. Ze is nauw betrokken bij het Big Data project van Data JLab. Op de komende VVOJ conferentie in Kortrijk op 7-8 november, praat Stefania Milan over cyberveiligheid. Deel 6 in een serie over sprekers en trainers op het aankomende VVOJ conferentie in Kortrijk.

You can read the English version of this interview here.

door Rachel Levy

U bent gespecialiseerd in het analyseren van ‘big data’. Kunt u uitleggen wat u hieraan fascineert? Waarom denkt u dat dit gebied zo belangrijk is?

Dat is een goede vraag. Ik ben geïnteresseerd in wat mensen (en niet alleen ‘de deskundigen’) kunnen doen met technologie. Wat betekent technologie voor de emancipatie? Op wat voor manier kan technologie de maatschappij veranderen?

Ik zie data op zich als technologie (de term ‘technologie’ is afgeleid van het Griekse ‘techie’, dat kan worden vertaald als ‘ambacht’ of ‘kunst’). Ik ben gefascineerd door de vraag hoe data, al dan niet gemanipuleerd data, kunnen helpen bij het doorgronden van de samenleving, op nieuwe en steeds complexere niveaus. Ook ben ik gegrepen door de vele software programma’s waarmee zelfs amateurs bergen met data kunnen analyseren.

Wie zich met technologie bezighoudt, geeft zichzelf meer macht en zeggenschap. Als je je bezighoudt programmatuur om data te doorgronden en te analyseren – zoals datavisualisatie – breng je de informatie dichter bij de gewone burger. Dit is van essentieel belang in een democratie.

Om het anders te zeggen: software-innovatie heeft de mogelijkheden uitgebreid om data te doorgronden. Dat schept, op zijn beurt, weer nieuwe mogelijkheden voor burgerparticipatie. En de inspraak van de burger is één van de pijlers van een functionerende democratie.

Heeft de mogelijkheid om grote hoeveelheden data geautomatiseerd te analyseren, het journalistieke vak veranderd? Wijzigt het de impact van journalistiek op de maatschappij? Of is data-analyse louter een moderne aanvulling op een ‘oud’ beroep?

Het hangt af van het time-frame dat we in gedachten hebben. Het geautomatiseerd analyseren van grote hoeveelheden gegevens zal zeker impact hebben op de journalistiek. Maar op de korte termijn zal het weinig in het vak veranderen.

Je hebt specifieke vaardigheden nodig om grote hoeveelheden data te analyseren. Het kost tijd om die te ontwikkelen. Zelfs als er nu aanzienlijk meer datajournalisten zouden zijn opgeleid, zou hun baas nu nog niet over de visie en kennis beschikken om de juiste verhalen te signaleren en uit te laten werken door de redactie. Met andere woorden, de prioriteiten van de redactie, en het evenwicht dat daar nu is, verandert niet van de ene dag op de andere. Vele redacties willen verhalen die gebaseerd zijn op ‘big data’ – maar ze zijn meestal niet bereid om een verslaggever vrij te maken voor zo’n tijdrovend project.

Het tweede argument gaat over de journalistiek zelf. Journalistiek is in essentie een plaatsgebonden beroep. Journalistiek gedijt dankzij de citaten van landelijke politici en kleinschalige verhalen waarin de data-analyse geen plaats heeft. De analyse van grote hoeveelheden data kan in potentie dan ook vooral de onderzoeksjournalistiek wijzigen. Het vergroot de horizon van het vak.

Het analyseren van gegevens lijkt nu nog een toevoeging aan het oude vak, maar dit hoeft niet per se negatief te zijn. Gegevens kunnen een verhaal vertellen, maar software kan dat niet. We hebben dus nog altijd mensen nodig die de software ontwikkelingen, zodat we daarmee een menselijk verhaal kunnen maken wanneer we de software op een database loslaten. Het menselijke deel van de journalistiek is in mijn ogen nog steeds fundamenteel.

Je kunt het tegendeel echter ook bewijzen: de opkomst van automatisch gegenereerd nieuws. Dit gaat de journalistiek zeker beïnvloeden – meer dan ons lief is. Al is deze tak van sport nog niet beland op het niveau van kwaliteitsjournalistiek.

Ik hoop dat de geautomatiseerde analyse van grote hoeveelheden data op de lange termijn een grote en duurzame impact op de journalistiek zal hebben. Maar dat betekent wel dat we anders naar ons vak moeten gaan kijken.

Wat betreft de impact van de journalistiek op de maatschappij – wij journalisten geloven over het algemeen in de democratische waarde van ons werk. Data-analyse kan helpen om de kloof tussen de ‘gewone’ journalist en de activist-journalist te dichten. Dan kan journalistiek weer in dienst staan van maatschappelijke betrokkenheid en sociale hervorming.

Zijn er databases die u wilt analyseren, maar die u nooit heeft kunnen bekijken, omdat ze gesloten zijn voor het publiek? En zo ja, waarom die ene specifieke database?

Ik ben van oorsprong Italiaans, hoewel ik al lange tijd in het buitenland. Het liefst zou ik toegang krijgen tot Italiaanse databases die nog niet eens bestaan: gegevens die ik graag bij elkaar gevoegd zou zien, maar waarbij dat nu nog niet het geval is.

?Ik zou graag toegang krijgen tot een landelijke database van de openbare uitgaven in Italië van de verschillende bestuursniveaus (gemeenten, provincies, regionaal, nationaal). Het zou een geweldig instrument om onredelijke uitgaven in dat land aan de kaak te stellen. Op mondiaal niveau zou ik graag een database van de uitgaven voor energie subsidies zien. Zoiets als dit.

Wat kunnen computer analyses nog niet kunnen doen, dat u wel graag zou willen doen?

Dit is natuurlijk de vraag die iedereen graag beantwoord ziet. Laten we zeggen ‘de voorbereiding van de datasets’ voor analyse. Dat is namelijk het meest saaie onderdeel van het proces.

Op 21 oktober gaf u een lezing over big data en de transformatie van de transnationale burgermaatschappij. U stelde dat de nadruk op big data en big data-bewijsmateriaal in de activistische sector uiteindelijk schadelijk zijn voor de diversiteit en integratie van de sector in de burgersamenleving. ‘Uiteindelijk zal het resulteren in het krimpen van de transnationale sfeer van het maatschappelijk middenveld.’ Kunt u uitleggen waarom?

Er kleven een aantal nadelen aan het benadrukken van big data en de kracht van cijfers als middel om de tegenstrijdigheden van onze maatschappij in de openbaarheid te brengen.

Te veel vertrouwen op cijfers zou van grote invloed kunnen zijn op activisten die zich bezig houden met maatschappelijke verandering. Zo riepen de Verenigde Naties onlangs op tot meer ‘cijfermateriaal ontwikkeling.’

Statistiek en statistische methoden zijn zeker zeer nuttig om een probleem, of de werkelijkheid in het algemeen, in kaart te brengen. Maar niet alle maatschappelijke organisaties hebben de capaciteit om data op een efficiënte en zinvolle manier te verzamelen en te verwerken.

Ik ben bang dat er misschien een deling ontstaat tussen zij die wel en zij die geen toegang hebben tot de vaardigheden om data de verzamelen en te verwerken. Die laatste groep zou het risico kunnen lopen om genegeerd te worden in het maatschappelijke debat, om dat ze in ‘gewone’ taal praten – en niet met data.

Met andere woorden, op de lange termijn kan de komst van ‘big data’ de internationale activistische sector hervormen, maar daarin ook meer ongelijkheid kweken.

Lees alle afleveringen in de interview serie Op weg naar Kortrijk, het gezicht achter de sprekers.