In Onze Taal wordt sinds enige tijd een discussie gevoerd over de vraag hoe snel de woordenschat van het Nederlands groeit. Vorig jaar schreef Frank Jansen in het blad dat er zestig woorden per dag bij komen. Een paar maanden later schreef Joop van der Horst in het onzetaalboek Taalalmanak dat deze telling overdreven was: volgens hem komt er maar één woord per dag bij. In het laatste nummer van het blad komt Jansen dan weer op de kwestie terug. Volgens hem was zijn schatting eerder te laag dan te hoog.
Een opmerkelijk aspect aan de hele discussie is dat ze zo duidelijk vanachter de leestafel wordt gevoerd. Jansen en Van der Horst `bewijzen’ hun stellingen door nummers van NRC Handelsblad en enkele andere kranten door te nemen, en de woorden die ze vinden te vergelijken met de woorden in gedrukte woordenboeken. Woorden op radio en woorden op televisie tellen niet mee, en de woorden op Internet evenmin.
Terwijl de laatste zo gemakkelijk te tellen zijn. In zijn laatste artikel geeft Jansen 54 voorbeelden van ‘nieuwe’ woorden die hij gevonden heeft in enkele katernen van NRC Handelsblad, Het Parool, het Algemeen Dagblad en De Telegraaf, allemaal verschenen op 14 november 1997. Hij moet die katernen zeer nauwkeurig zelf hebben doorgenomen. Voor een zoektocht op Internet is dat allemaal niet nodig; daar kan een zoekmachine, een speciaal programma dat een index over tientallen miljoenen webpagina’s bijhoudt, in een handomdraai het nodige werk doen.
Ik heb de proef op de som genomen. De 54 woorden die Jansen noemt heb ik ingevoerd in enkele bekende zoekmachines op Internet — AltaVista (http://www.altavista.digital.com) en Hotbot (http://www.hotbot.com/) en het Nederlandse Vindex (http://www.webwereld.nl/). Vervolgens heb ik alle documenten weggefilterd die op of na 14 november 1997 verschenen. Ik vond bijvoorbeeld twee van de door Jansen geraadpleegde artikelen uit de NRC in de webeditie terug, maar deze telde ik natuurlijk niet mee. Uiteindelijk hield ik 23 woorden over die volgens Jansen op 14 november 1997 nieuw waren, maar die op die dag al kortere of langere tijd via Internet gevonden konden worden: dat is 43 procent. Daarbij valt nog aan te tekenen dat deze drie zoekmachines zeker niet alle pagina’s op Internet geïndexeerd hebben.
Hieronder geef ik een lijst van de 54 woorden die Jansen in zijn laatste artikel noemt; erachter geef ik het aantal Nederlandstalige vindplaatsen (woorden als EU-Minister werden ook gevonden op Duitstalige websites) dat de genoemde zoekmachines mij opleverden, en een representatief voorbeeld van een dergelijke vindplaats:
rijstzaak/rijst-zaak | 0 | ||
reli-zapper/relizapper | 0 | ||
jazz-timing/jazztiming | 0 |
D66-fractieleider
10
http://www.nrc.nl/W2/Nieuws/1997/05/31/Vp/01.html
HMG-directie
8
http://www.pi.net/computer/multim/
11-6-97/mm11-6-97g.html
SRV-bende
0
EU-minister
34
http://www.minjust.nl/c_actual/persber/pb104.htm
VN-ambassadeur
18
http://www.vum.be/dsifvnkris.html
VN-chef
51
http://www.vum.be/dsifwef2.html
VN-commissie
23
http://www.antenna.nl/wvi/nl/ic/mr/mrnl/est32.html
VN-contributie
1
http://www.dailynews.nl/zondag061096/
buitenland/vsvn.htm
VN-gebouw
3
http://www.milieudefensie.nl/julaug96/set.htm
VN-inspecteur
0
VN-resolutie
22
http://wwwdb.europarl.eu.int/dg7/questions/
qe/97/qr/C83/nl/E-2352-96.htm
VN-tribunaal
33
http://sascha.esrac.ele.tue.nl/~ivo/groepsspelen/vn.html
Vestdijk-lezer
0
goede-in-het-algemeen
0
Nederlands-Surinaams
0
Turks/Koerdische
17
http://194.7.253.55/nbifmedtv2.html
zuid-zuidrelatie
0
ad-hocgezelschap
1
http://www.music-meeting.nl/verslag.htm
tripletherapie
1
http://www.nrc.nl/W2/Nieuws/1997/05/16/Opi/01.html
branche-exclusiviteit
7
http://ww.cci.be/brussels/nno35217.html
mediacontract
3
http://mediamaat.atn.nl/
segmentsponsoring
0
sponsorpot
5
http://www.kun.nl/mycelium/reunisten.html
STER-blok
20
http://www.ster.nl/nieuws/persbericht/pers9.html
WK-wedstrijd
3
http://www.rotterdamsdagblad.nl:81/html/001455.html
afscheidsgrap
0
arbo-kritiek
0
bewust-coma
0
ex-veteranendienstplichtige
0
letselschade-advocaat
7
http://www.am.sbi.nl/nieuws/221/221d.htm
St. Maarten-cadeau
0
zelfhelpboek
5
http://home.wxs.nl/~abnervos/bestel.htm
losstraat
0
vlammenmelder
1
http://www.siemens.nl/produkt/gebouw/p3050047.htm
VN-wapeninspecteur
0
box-butler
0
unit-eigenaar
0
verwenunit
0
vip-box
0
vip-boxhouder
0
hetero-stel
3
http://www.telegraaf.nl/krant/naslag/
filmrecensies/film.hollowreed.html
heterosamenleving
0
homonest
0
elandtest
0
lijkenhond
0
zwaan-kleef-aan-dynamiek
0
transdisciplinair
1
http://www2.netcetera.nl/~iaaa/inaugure.html
Aziatisch-economisch
0
ex-B-verpleegkundige
0
A2000-partner
0
thuisservice
0
herhalingsdader
0
Jansens conclusie wordt door deze bevindingen uiteraard niet ondermijnd. Misschien staan er elke dag minder nieuwe woorden in de krant als we Internet in de beschouwingen betrekken, maar daar staat tegenover dat alle Internet-communicatie zelf waarschijnlijk ook weer aan veel nieuwe woorden het licht doet zien. Het is best mogelijk dat we alles bij elkaar dan nog steeds op een getal uitkomen dat groter is dan 60.
Voor goed onderzoek hebben we een Internet-programmaatje nodig dat elke dag permanent het Internet afgraast op zoek naar nieuwe woorden. Zo’n programma heeft een module die automatisch herkent in welke taal een webpagina of een bericht in een nieuwsgroep gesteld is (het zoekprogramma AltaVista heeft zo’n module al); verder houdt het uiteraard een woordenlijst bij van woorden die het al kent. Elk etmaal genereert het programma een lijst met nieuw gevonden woorden.
De eerste maanden moet het programma getraind worden en vindt het overdreven veel ‘nieuwe woorden’, maar na een paar testweken zijn de resultaten bruikbaar voor onderzoek. We moeten dan alleen nog uitvinden welk percentage van het web en van de nieuwsgroepen ongeveer per dag door het programma bezocht en we weten hoeveel nieuwe woorden er per dag bijkomen op Internet. Op het dagelijkse nieuwewoordenbulletin die dat programma elke dag verstuurt, zal ik me onmiddellijk abonneren.
Marc van Oostendorp
Laat een reactie achter