Tekstblog: een onafhankelijk, online platform voor tekst- en communicatieprofessionals

 

Door: van Hogeschool Gent. Op Posted on 29 december, 2010by

Mannetje leest boek en snapt het nietIn een maatschappij die constant mondeling en schriftelijk communiceert, is helderheid van documenten cruciaal. Lezers en toehoorders hebben behoefte aan ondubbelzinnige informatie van overheden en commerciële organisaties. Dit heeft wereldwijd al geleid tot maatschappelijke en wettelijke initiatieven, zoals de befaamde “plain English” campagne. Maar hoe helder zijn de Nederlandse teksten van vandaag? En kunnen we dat objectief meten?

Helderheid meten met leesbaarheidsformules

Leesbaarheidsonderzoek is ontstaan in de Verenigde Staten in de jaren ’20 van de vorige eeuw. Leerlingen met verschillende leesvaardigheidsniveaus werden steeds vaker in dezelfde groepen ingedeeld. Dit kwam door de toenemende instroom van immigranten in de scholen. Door deze groepsindeling groeide de vraag naar een manier om tekstmateriaal te kunnen afstemmen op de leesvaardigheid van het individu.

Leesbaarheidsformules zijn ontstaan als een antwoord op die vraag. Op basis van een aantal tekstkenmerken, zoals de gemiddelde zinslengte of het gemiddelde aantal lettergrepen per woord, zouden ze een objectieve meting geven van de leesbaarheid van de tekst. Voorbeelden zijn de Flesch Reading Ease formule en de Flesch-Kincaid Grade Level formule, die nog steeds over de hele wereld gebruikt worden. Ze zijn onder meer standaard ingebouwd in de meeste versies van Microsoft Word.

boekje met AVI-markering in linker bovenhoek

Van AVI- naar CLIB-leesniveaus

In ons taalgebied werd de Flesch Reading Ease formule aangepast aan het Nederlands, wat resulteerde in de AVI-leesniveaus. Die AVI-niveaus, die intussen vervangen zijn door de zogenaamde CLIB-niveaus, staan op een groot aantal kinder- en jeugdboeken aangegeven. Zo is snel duidelijk welk leesmateriaal past bij een bepaalde leesvaardigheid. Leesbaarheidsformules blijken nuttig te zijn voor de selectie van leesmateriaal voor taalleerders. Maar kunnen ze ook een nauwkeurige inschatting maken van de helderheid van teksten voor de “gemiddelde” lezer?

Huidige formules zijn oppervlakkig

Veel formules geven de helderheid van een tekst niet goed weer. Dat geldt vooral voor formules die alleen oppervlaktekenmerken van teksten meten, zoals gemiddelde woord- en zinslengte. Een hoge gemiddelde zinslengte bijvoorbeeld kan in 2 situaties voorkomen:

  • bij een moeilijk leesbare tekst met ingewikkelde syntactische structuren;
  • bij een makkelijk leesbare tekst waarin veel eenvoudige nevenschikkingen voorkomen. In dit geval geeft de uitkomst van de leesbaarheidsformule een vertekend beeld. Het gevaar is dan dat schrijvers een tekst onnodig vereenvoudigen.

Bovendien blijkt uit recent onderzoek dat verschillende formules gelijke resultaten opleveren. Het maakt dus nauwelijks uit voor welke taal de formules in eerste instantie ontworpen zijn. Dat is verrassend, maar ook verklaarbaar. De formules nemen namelijk alleen taalonafhankelijke oppervlaktekenmerken mee.

Heropleving van leesbaarheidsonderzoek

Leesbaarheidsonderzoek heeft de afgelopen 10 jaar een forse heropleving gekend. De belangrijkste reden? Taaltechnologie werd een wetenschappelijke discipline, waardoor onderzoekers veel meer talige kenmerken automatisch aan teksten kunnen onttrekken. Ook de enorme vooruitgang in de informatica was van invloed. We kunnen nu veel meer data verwerken en veel complexere berekeningen uitvoeren dan 20 jaar geleden. Toen moesten leesbaarheidsonderzoekers het aantal lettergrepen in een tekst nog handmatig tellen. Ook vanuit de psycholinguïstiek komen interessante nieuwe inzichten, onder meer over de mentale verwerking van teksten en bepalende factoren voor de leesbaarheid ervan. Kortom, het leesbaarheidsonderzoek heeft anno 2010 meer mogelijkheden dan ooit tevoren.

Onderzoek met computationele taalkunde

Aan de Hogeschool Gent is een onderzoeksteam druk bezig met een methode om de leesbaarheid van teksten automatisch te beoordelen. Hiermee kunnen we meer tekstkenmerken dan alleen woordlengte, zinslengte en woordfrequentie meten. Dankzij de computationele taalkunde meten we nu ook:

  • lexicale tekstkenmerken;
  • syntactische tekstkenmerken;
  • discursieve tekstkenmerken.

Deze meting moet leiden tot linguïstisch onderbouwde, transparante helderheidsscores voor het Nederlands. Deze scores kunnen schrijvers bijvoorbeeld helpen bij het redigeren van teksten. De bedoeling is namelijk dat de software na de meting feedback geeft over de oorzaken van leesbaarheidsproblemen. Hierdoor kan een schrijver zijn tekst gericht aanpassen aan de eisen van zijn publiek.

Problemen bij bepalen van leesbaarheid

Om de leesbaarheid van een tekst te bepalen, halen we in Gent tekstkenmerken uit een database met echte teksten. Concreet houdt dat in dat we een aantal teksten waarvan we weten hoe leesbaar ze zijn als basis nemen voor de leesbaarheidsformule. De computer heeft dan dus zowel de subjectieve beoordeling van de moeilijkheid van een tekst, als meerdere objectieve tekstkenmerken. Dan gaat de computer op zoek naar de relatie daartussen, en kan vervolgens automatisch de factoren die leesbaarheid beïnvloeden daaruit afleiden. Hierbij zijn lopen we echter tegen 2 problemen aan:

  • zo’n database bestaat niet voor het Nederlands. Althans niet met teksten voor een volwassen lezerspubliek. Het enige experimentele leesbaarheidsonderzoek in ons taalgebied werd door Staphorsius uitgevoerd op een verzameling kinderboeken.
  • leesbaarheid is subjectief: de attitude en de voorkennis van de lezer hebben een aantoonbare invloed op zijn of haar tekstbegrip.

Help leesbaarheidsformules aanscherpen

We kunnen beide problemen omzeilen door het concept leesbaarheid te beschouwen als de visie die zoveel mogelijk lezers zelf hebben op leesbaarheid. Die mening verzamelen we door middel van 2 webapplicaties:

  1. http://lt3.hogent.be/en/tools/sort-by-readability-nl/ – De bedoeling van deze applicatie is dat zoveel mogelijk lezers hem gebruiken. Hij is openbaar toegankelijk en bijzonder eenvoudig: 2 teksten worden tegelijk getoond en de lezer geeft aan welke het makkelijkst is.
  2. http://lt3.hogent.be/hendi/expert-readers – Deze applicatie is alleen bedoeld voor een testpanel van mensen die beroepsmatig met taal bezig zijn. Zij krijgen de opdracht een groter aantal teksten te rangschikken. Daarnaast geven ze elke tekst een cijfer. Zo worden de verschillen in leesbaarheid beter duidelijk.

Resultaat van het onderzoek

We zijn nog druk bezig met ons onderzoek, maar hopen in 2011 een applicatie af te hebben die de helderheid van alle soorten teksten kan meten. Deze zal niet alleen kijken naar oppervlaktekenmerken, maar ook naar de complexiteit van teksten op een dieper taalkundig niveau.  Dat is handig voor iedereen die op latere leeftijd nog Nederlands wil leren, en nuttig bij het meten van de helderheid van allerlei soorten teksten.

Meer weten?

Wil je de onderzoekers in Gent verder helpen of meer informatie? Bekijk de website van het project. Of neem contact op met Philip van Oosten via philip.vanoosten@hogent.be of Veronique Hoste via veronique.hoste@hogent.be.

Reacties

6 Responses over “Hoe meetbaar is leesbaarheid?”

  1. […] Dit blogartikel was vermeld op Twitter door Muriel Reyserhove, Tekstblog. Tekstblog heeft gezegd: Is de #helderheid van #teksten meetbaar, en hoe? @Hogeschool Gent is druk bezig met #onderzoek hiernaar: http://bit.ly/gNYP73 […]

  2. […] hoe meetbaar is leesbaarheid van Tekstblog Stem of voeg toe aan […]

  3. […] toepassen begrijpelijke teksten opleverde. Zoals Véronique Hoste van de Hogeschool Gent al op tekstblog schrijft:  ”leesbaarheid is subjectief: de attitude en de voorkennis van de lezer hebben een […]

  4. […] toepassen begrijpelijke teksten opleverde. Zoals Véronique Hoste van de Hogeschool Gent al op tekstblog schrijft: ”leesbaarheid is subjectief: de attitude en de voorkennis van de lezer hebben een […]

  5. […] vraag: wat maakt een tekst goed? Uit eerdere artikelen op Tekstblog over tekstkwaliteit en leesbaarheid wordt in ieder geval één ding duidelijk: daar is geen kant-en-klaar antwoord op. Er is veel over […]

  6. […] enkele manier een betrouwbaar houvast voor het verbeteren van de beoordeelde tekst.   Lees ook: Hoe meetbaar is leesbaarheid? van Véronique […]

Schrijf een reactie

Op deze pagina kunnen geen comments worden geplaatst.