
Het INL gaat aan de slag met de Oxford English Dictionary
- Gegevens
- dinsdag 26 juli 2011 09:58
Het INL heeft begin dit jaar een overeenkomst gesloten om op basis van de Oxford English Dictionary (OED) een diachroon computationeel lexicon te maken voor het Engels.
Door het gebruik van een dergelijk computerlexicon in een zoekmachine, kan een gebruiker bij het zoeken naar 'world' (wereld) meteen alle historische varianten als bijvoorbeeld werld, uarld, uarlde, uorld, varld, varlde, vorld, warlde, enz. vinden. Het kan echter ook ingezet worden bij het scannen (OCR'en) van historisch materiaal, zodat het resultaat minder fouten bevat. Met de bouw van het Engelse lexicon op basis van de OED kunnen we prima illustreren dat de aanpak die wij gevolgd hebben voor het bouwen van een dergelijk lexicon voor het Nederlands op basis van het WNT ook overdraagbaar is op een woordenboek van een andere taal.
Voor de OED is het een manier om sneller spellingvarianten van alle lemmata bij elkaar te krijgen. Deze spellingvarianten van het lemma wordt door de redactie vervolgens aan het kopje van het woordenboekartikel toegevoegd. Het OED wil het lexicon uiteindelijk ook inzetten om corpusmateriaal te verrijken.
Delen van kennis in het kader van IMPACT
Deze werkzaamheden gebeuren in het kader van het IMPACT-project. In dit project ontwikkelen wij methoden en tools, gebouwd om op efficiënte manier computationele lexica te bouwen van historische en hedendaagse taal. Het doel van IMPACT is dat onze aanpak en tools ook voor andere talen ingezet kunnen worden.
Het INL gebruikt data van het woordenboek bij de ontsluiting van met name historische teksten. Het OED had namelijk ook plannen om dit te gaan doen en daardoor konden wij onze kennis hierover delen.



