De grafieken die Apache eigenlijk had willen tonen

Tom Cochez van Apache heeft een riskante uitspraak van Bart Sturtewagen, hoofdredacteur van De Standaard, opgemerkt. Sturtewagen zei dat De Standaard het initiatief van De Morgen, om het woord ‘allochtoon’ niet meer te bezigen, niet zou volgen. Eén van zijn argumenten daarvoor klonk zo: “Het is hoe dan ook een woord dat steeds minder de krantenkolommen haalt en met uitsterven bedreigd is.”

Tom Cochez had de juiste journalistieke reflex en vroeg zich af: zou dat nu echt zo zijn? Hoofdredacteurs kletsen in de regel nogal uit hun nek, dat is bekend. En dus is Cochez eens gaan natellen of dat ook werkelijk zo was. Hij heeft daarvoor de krantendatabase Mediargus doorzocht.

Pas op, dat is een goed plan. Op zich. Echt waar. Maar de uitvoering… jongens toch, wat een geknoei, wat een geknoei. Lees zelf mee:

Via databank mediargus zocht Apache het aantal artikels op waarin de woorden ‘allochtoon’ of ‘allochtone’ voorkomen. En dat levert een aantal opmerkelijke vaststellingen op. Het voorbije jaar (van 22 september 2011 tot 22 september 2012) verschenen in de kranten De Morgen, De Standaard, De Tijd, Het Nieuwsblad, Het Laatste Nieuws, Gazet van Antwerpen en het Belang  van Limburg samen 999 artikelen met daarin de term ‘allochtone’ en 274 artikels met daarin het woord ‘allochtoon’.  Beide cijfers gewoon optellen kan niet. De kans op dubbeltellingen (artikels waar beide woorden in voor komen) is immers groot.

Dat lijkt natuurlijk nergens op.

Ten eerste: waarom is de verbuiging ‘allochtone’ wel opgenomen in de zoekopdracht, en de verbuiging ‘allochtonen’ niet? Gelieve het onderzoek volledig te voeren.

Ten tweede: de telling van Cochez gaat terug tot het jaar 2001. Op dat moment bestond Het Volk  ook nog, maar die krant telt Cochez niet mee. Gelieve het onderzoek grondig te voeren.

Ten derde: door te tellen van 22 september van jaar X tot 22 september jaar X+1 telt Cochez de artikels die op 22 septembers verschijnen dubbel. Gelieve het onderzoek correct te voeren.

Ten vierde:  Cochez gaat aan de slag met een database en laat zich daarbij blijkbaar beperken door de limieten van die database inzake dubbeltellingen. Pure luiheid, noemen wij dat. Gelieve het onderzoek ernstig te voeren!

Het resultaat van al die slordigheden zijn onvolledige datareeksen die moeilijk te interpreteren zijn. Wij hebben Plasky Statistics daarom op deze zaak gezet. Het resultaat zijn de grafieken die Apache eigenlijk had willen en moeten tonen.

Aantal artikels met de woorden ‘allochtoon’, ‘allochtone’ of ‘allochtonen’ in Vlaamse kranten

Aantal artikels met de woorden ‘allochtoon’, ‘allochtone’ of ‘allochtonen’ in 2010, 2011, 2012

De periodes lopen telkens van 23 september jaar X tot 22 september jaar X+1. De telling gebeurde in de kranten De Morgen, De Standaard, De Tijd, Het Nieuwsblad, Het Laatste Nieuws, Gazet van Antwerpen, Het Belang  van Limburg en Het Volk, telkens zonder bijlages of regionale edities.

Apache mag deze gecorrigeerde data gratis en voor niets overnemen. Wat zijn wij toch een stelletje goedzakken!

UPDATE 28/09/2012

Over dit discalculatief grapje lazen wij in eerste instantie dan nog heen:

In dezelfde periode een jaar eerder (2010-2011) verschenen er 848 artikels met de term ‘allochtone’  en 213 artikels met het woord ‘allochtoon’. In dezelfde periode nog een jaar eerder (2009-2010) ging het om respectievelijk 726 en 168 artikels. De stelling dat het woord steeds minder de krantenkolommen haalt en met uitsterven is bedreigd, houdt dus geen steek. Het tegendeel blijkt waar: de voorbije drie jaar zit het gebruik opnieuw in de lift.

Kijk eens goed naar de laatste drie staafjes van het eerste staafdiagram (van Plasky Statistics of Apache, maakt niet uit) en vertel ons: zit het gebruik de voorbije drie jaar werkelijk opnieuw in de lift? En is dat dan niet jammer van de titel boven het artikel op Apache?

LINKS:

11 gedachtes over “De grafieken die Apache eigenlijk had willen tonen

 1. Ook Plasky Statistics is niet perfect. Je zou eigenlijk het aantal gevonden artikels moeten normaliseren aan de hand van het totaal aantal artikels waarin pakweg Turk, Marokkaan, Roma of Bulgaar voorkwam. Anders kan je niets zeggen of de term nu meer of minder wordt gebruikt. Per artikel dus, want dat is de enige juiste maat denk ik. Gelieve het onderzoek correct te voeren!

 2. Je kan perfect zeggen of de term meer of minder gebruikt wordt. Je kan alleen niet zeggen waarom dat zo is. Ik vermoed dat u daarop doelt. Maar doe gerust zoals Radio Plasky en kom met uw eigen statistieken als die van een ander u niet bevallen.

 3. Akkoord, een kwestie van interpretatie. Maar om de claim van Bart Sturtewagen te verifiëren maakt het wel degelijk een verschil of de term 100 keer voorkomt op 1000 artikels waarin het had kunnen voorkomen, dan wel 90 keer op 100 artikels. Soit, in elk geval een mooi onderzoek. Meer van dat!

 4. Goede Emile,

  We stellen het zeer op prijs dat u kosten noch moeite spaart, zelfs uw afdeling statistiek inschakelt om onze berekeningen te checken. Het zou vaker mogen en moeten gebeuren. Opbouwende kritiek is ons, in tegenstelling tot vele vakbroeders, bijzonder lief. En hoewel we het bijzonder eens zijn met de baseline van Radio Plasky – sarcasme is de enige beschaafde uiting van verzuring – zijn bovenstaande frasen allerminst bedoeld om daar enig spoor van te bevatten.

  Omdat we net als u en uw familieleden slechts begaan zijn met de waarheid, permitteren we ons toch een klein wederwoord. We zullen gelijk even de vier punten overlopen.

  1. We hadden inderdaad ook ‘allochtonen’ kunnen/moeten opnemen in de zoekopdracht, maar zoals uw berekeningen tonen, verandert dat niets aan het totaalbeeld. We zijn er, inderdaad gedreven door luiheid, van uit gegaan dat twee termen het verhaal wel zouden vertellen.
  2. Wat Het Volk betreft: die krant hebben we er (bewust) buiten gelaten. Als je de krant de eerste jaren meerekent, krijg je achteraf een soort vertekening. Doe je het niet, dan kijk je in de beginperiode inderdaad niet naar de volledige krantenmarkt. Maar dat doe je eigenlijk ook niet door ‘metro’ niet in te calculeren. We hebben dat proberen op te lossen door expliciet de onderzochte krantentitels te vermelden.
  3. Daar heeft uw dienst statistiek helemaal gelijk in: we hebben 366 in plaats van 365 dagen geteld. Gelukkig hebben we alle jaren tot schrikkeljaar gemaakt zodat het in verhouding geen verschil maakt.
  4. Hier lijkt uw dienst statistiek zich zelf op glad ijs te bewegen. Luiheid is ons, zoals eerder gezegd, niet geheel vreemd, maar in dit concrete geval hebben we bewust dubbeltellingen willen vermijden. Dat heeft uw dienst statistiek – al dan niet gedreven door luiheid, dat laten we in het midden – blijkbaar wel gedaan. Maak je een grafiek met als grafiektitel ‘aantal artikels met de woorden ‘allochtoon’, ‘allochtone’ of ‘allochtonen’ in Vlaamse kranten’ dan moet je vooraf uitfilteren. Er zijn heel wat artikels waarin allochtoon én allochtone of/én allochtonen voorkomen. Dat is maar een artikel, maar als we jullie methodologie goed hebben begrepen, dan hebben jullie zo’n artikel wel telkens twee of zelfs drie keer geteld.

  Een volgende keer kunnen onze statistische diensten misschien samen werken.

  Met vriendelijke groet,

  Tom

 5. Beste Tom,

  een eerlijke repliek op onze uitzending, dat stellen wij op prijs. Vandaar deze eerlijke repliek op uw eerlijke repliek.

  1. Het totaalbeeld verandert inderdaad weinig, maar de term ‘allochtonen’ komt erg vaak voor – vaker dan ‘allochtoon’ – en had de resultaten wel degelijk kunnen beïnvloeden. U kan nu wel zeggen dat dit niet echt het geval is, en dat is inderdaad zo, maar dat weet u ook maar omdat wij het voor u uitgezocht hebben.

  2. Dat klinkt zeer redelijk.

  3. Dat is een gewiekste uitleg. Maar u geeft niet alleen verhoudingen, u geeft ook exacte cijfers. Die dus niet exact zijn.

  4. U heeft duidelijk niets van onze methodologie begrepen. De zoekopdracht “allochtoon OR allochtone OR allochtonen” geeft het artikel met de titel “Allochtone allochtonen blijken allochtoon” op als 1 hit en niet als 3 hits. Van dubbeltellingen is dus geen sprake als u de Boleaanse operatoren correct aanwendt, wij vermoeden dat u die helemaal niet heeft aangewend.

  Vergeet u niet te reageren op onze opmerking over de stijging van de laatste drie jaar?

 6. Dag Emile,
  Nogmaals, we zijn heel blij dat jullie alles zeer grondig hebben uitgezocht. Wat jullie methodologie betreft, die hebben we nergens gelezen, dus hopelijk neem je ons in dat verband niet teveel kwalijk. De Boleaanse operatoren hebben we inderdaad niet aangewend, zelfs de Booleaanse niet. En wat uw laatste opmerking betreft, daarvan vinden we het niveau nogal gelijklopend met wat we zelf in de zin hierboven schreven. Maar dat is natuurlijk een kwestie van appreciatie.

 7. Zoals ongeveer de helft van de De Standaard-lezers ben ik meer dan gemiddeld tevreden, maar af en toe erger ik mij zoals de geachte radiomakers ook aan het gebruik en misbruik van cijfers en statistieken. Vooral het kritiekloos overnemen van cijfermateriaal is irritant, zoals in volgend artikel:
  http://www.standaard.be/artikel/detail.aspx?artikelid=DMF20120919_00302799
  Ik citeer:”In de studie, die deze week in het vakblad Food and Chemical Toxicology verschijnt, kregen de ratten op het genetisch gemanipuleerd voer borstkliertumoren en leden ze ernstige lever- en nierschade. De helft van de mannetjesratten en 70 procent van de wijfjes stierven voortijdig, tegen slechts 30 procent en 20 procent in een controlegroep.”

  Als 30% van de controlegroep voortijdig sterft, moeten we dan niet ingrijpen? Gaia?

  jos

 8. Wat is dit, Tom, de Peter Vandermeersch-strategie? Op kritische opmerkingen over details antwoorden we zo goed en zo kwaad als het kan, maar als ze de kern van ons artikel aanpakken proberen we er op één of andere manier vanonder te geraken? En je was nog zo oprecht begonnen.

  Mij niet gelaten, natuurlijk. Iedereen doet met kritiek wat hij wil en het is niet mijn artikel waar een manifest foute titel boven prijkt.

 9. Emile,
  Beweer je nu plots dat jullie in een eerste fase slechts enkele kritische opmerkingen over details in ons artikel hebben gepubliceerd? Waarna jullie dan, een dag later plots zelf de kern hebben ontdekt en daar middels een update over hebben gepubliceerd? Natuurlijk doet iedereen met kritiek wat hij wil. Iedereen, inderdaad.
  Wij hebben alvast goed naar die van jou en je statistische dienst geluisterd. De kritiek op ons artikel klopt voor een groot deel, al gaat het, zoals je terecht aanhaalt over details en niet echt over de essentie. Dat maakt de kritiek daarom niet onterecht. We zullen een volgende keer minutieuzer tewerk gaan. En hoewel we, alweer helemaal gemeend, doordrongen zijn van het belang om te reageren op wat lezers terecht of onterecht aankaarten, wordt het nu stilaan tijd om opnieuw wat artikels te gaan schrijven.
  Tom

 10. De eerste vier puntjes van kritiek betroffen de methode waarop de artikels geteld waren. We kunnen stellen dat het om details gaat, omdat de hertelling door Plasky Statistics ongeveer dezelfde evolutie aangeeft als de telling door Apache.

  Omdat detailkritiek onze kernactiviteit is, hebben wij ons mogelijk te enthousiast gestort op de pietepeuterige analyse van de statistische methode, en zijn we daardoor de conclusie wat uit het oog verloren, die we natuurlijk even grondig hadden moeten onderzoeken.

  Die conclusie is volgens Apache dat de laatste drie jaar het gebruik van de onderzochte terminologie gestegen is, en dat dit dus in tegenspraak is met wat Sturtewagen beweert, namelijk dat de terminologie aan het verdwijnen is.

  Alleen blijkt uit de cijfers dat het gebruik niet gestegen is de laatste drie jaar. Wel in 11-12, ook nog 10-11, maar in 09-10 was het niet gestegen, maar gedaald. Je zou kunnen stellen dat het in 11-12 wel gestegen is ten opzichte van 08-09, maar dat is iets helemaal anders dan zeggen dat het “de voorbije drie jaar steeds vaker werd gebruikt.”

  Een andere nuance die ik zie, is dat Sturtewagen misschien wel voor zijn eigen bladen gelijk zou kunnen hebben. In De Standaard en Het Nieuwsblad is het gebruik het voorbije jaar drastisch gedaald (respectievelijk met 21% en 36%), tot onder het niveau van 09-10. In dat jaar lag het aantal artikels het laagst (voor alle kranten samen) sinds 01-02, het jaar voor de opmars echt begon.

  De analyse moet natuurlijk gemaakt worden voor die twee kranten over de hele periode. Daarvoor ontbreekt het ons eventjes aan tijd en zin; wij hebben het intussen ook wel weer gehad met dit onderwerp. Maar op basis van de beschikbare tellingen lijkt het ons niet onmogelijk dat Sturtewagen er oprecht van overtuigd is/was dat de term in elk geval uit zijn eigen krantenkolommen aan het verdwijnen was en dat hij daar nog gelijk in heeft ook.

  Daar valt tegenin te brengen dat het gebruik in zijn kranten in 10-11 wél hoog lag, en dat die daling helemaal niet bij de andere Vlaamse kranten te zien is en dat hij dan ook niet voor die kranten moet spreken.

  Maar in het algemeen durven we toch stellen dat de conclusie van Apache zeker een erg vervelende telfout bevat en daarnaast mogelijk ook overhaast en te weinig genuanceerd is. Misschien was de auteur er iets té hard op gebrand om Sturtewagens ongelijk te bewijzen. Wij kunnen daar wel begrip voor opbrengen.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google photo

Je reageert onder je Google account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s