Door Marc van Oostendorp
Omdat het handig was om automatisch te kunnen bepalen of twee woorden op elkaar rijmen, heb ik een Python script geschreven dat dit kan doen. Je kunt het van mijn Github-account halen. Je moet wel een beetje Python beheersen om het te kunnen gebruiken, maar dat kan op een zeer laag beginnersniveau zijn. Het is handig voor als je zelf iets wil maken dat automatisch kan rijmen. (Websites als Mick’s Rijmwoordenboek zijn bedoeld voor mensen en niet voor computers.)
Het woordenboek is gebaseerd op de beroemde, zij het inmiddels al een paar decennia oude database CELEX. Daar wordt ieder Nederlands woord van (onder andere) een fonetische transcriptie voorzien. Van die fonetische transcriptie heb ik het deel geïsoleerd dat rijmt: de beklemtoonde klinker en alles wat daarop volgt. Dat vormt de eerste dictionary in mijn script, die ik rijmwoordenboek heb genoemd. De tweede dictionary bevat die informatie min of meer andersom: je vindt daar voor iedere rijmklank een lijst met alle woorden in Celex die deze rijmklank bevatten; deze noem ik hulprijmwoordenboek. Om alle rijmwoorden voor sla te vinden moet je dat woord dus eerst opzoeken in het rijmwoordenboek om daar de fonetische transcriptie [a] te vinden. Vervolgens zoek je [a] op in het rijmwoordenboek en vind je {‘daarna’, ‘ga’, … }. Omdat dit een beetje omslachtig is, definieer ik aan het eind van het script een functie die dat allemaal voor je doet. Als je rijmwoorden(sla) aanroept, krijg je de lijst met daarna, ga en al die andere woorden automatisch terug.
Foto door Elsemargriet form PxHere
Wouter van der Land zegt
Zeer bedankt voor het delen. Het zou bruikbaar moeten zijn voor het genereren van bepaalde woordspelingen. Met mijn inderdaad lage beginnersniveau van Python ga ik dat eens proberen.
Overigens begreep ik dat je het online Van Dale Rijmwoordenboek ook met een (Python)script kunt benaderen (als het niet inmiddels is afgeschermd). Ook daarmee kun je dus een computer laten werken.
Marc van Oostendorp zegt
Dat wist ik niet, van Van Dale. De kwaliteit van de rijmparen zal daar in een aantal opzichten groter zijn, dus dat lijkt me zeker nuttig. Mijn script is dan weer handiger voor als je in heel grote corpora op rijmen wil zoeken (wat ik wil, waarover later vast een keer meer). Je mag die API van Van Dale vast niet vele keren per seconde benaderen – en terecht.
gerda zegt
idioot