Het Referentiebestand Nederlands is een corpusgebaseerde lexicale databank van het Nederlands met ruim 45.000 trefwoorden en ruim 90.000 voorbeelden. Voor iedere betekenis van een woord wordt gedetailleerde informatie gegeven met betrekking tot de orthografie, de morfologie, de syntaxis, de semantiek, de pragmatiek en de combinatoriek.

Het bestand is een halfproduct dat ingezet kan worden bij het maken van andere lexica en als component binnen taaltechnologische applicaties zoals een part-of-speech-tagger, een lemmatizer of een semantische tagger. In het RBN worden twee soorten informatie samengebracht: informatie die vooral bedoeld is voor een menselijke gebruiker en informatie die vooral bedoeld is voor automatische taalverwerking. Juist de combinatie van deze twee soorten informatie maakt het RBN tot een breed inzetbaar lexicon.

 

Totstandkoming

Het RBN is onder de auspiciën van de Commissie Lexicografische Vertaalvoorzieningen (CLVV) tot stand gekomen en geredigeerd door een consortium onder leiding van prof. W. Martin. Het consortium bestond uit vier teams:

  • Instituut voor Nederlandse Lexicologie te Leiden
  • drs. A. Abbes, L. Oppentocht en H. Vissia
  • (coördinator: dr. T. Kruyt)
  • Departement Linguïstiek van de KU Leuven
  • lic. G. Ceuppens, dr. G. Craps, A. Quartier, K. Stevens
  • (coördinator: prof. dr. W. Smedts)
  • Vakgroep Nederlands van de Universiteit Utrecht
  • drs. P. Ackema en drs. H. Hoekstra
  • (coördinator: prof. dr. M. Everaert)
  • Onderzoeksgroep Lexicologie van de VU Amsterdam
  • drs. H. Demeersseman, dr. H. van der Vliet, drs. I. Groesz, drs. M. Groot, drs. G. Bilsen, dr. S. Bopp en drs. J. Redel
  • (coördinator: prof. dr. W. Martin en drs. I. Maks)

De eerste versie van het RBN is afgerond in 1998; de tweede versie in 2005.

 

Gebruik en toepassingen

Lexicografisch

Het RBN biedt een rijke verzameling woorden, betekenissen en voorbeelden die als zelfstandig lexicon geraadpleegd kunnen worden. Daarnaast kan het RBN gebruikt worden als basis voor bilinguale lexicografische bestanden. Het beschrijvingsmodel biedt aanknopingspunten om een selectie te maken die bijvoorbeeld rekening houdt met de functie of doelgroep van het woordenboek.

Het RBN is ingezet bij onder meer de volgende bilinguale projecten: Nederlands-Deens, Nederlands-Estisch vv., Nederlands-Fins vv., Nederlands-Indonesisch vv., Nederlands-Portugees vv.

Taaltechnologisch

De diepe structuur en de expliciete en formele beschrijving van de data, maken het RBN geschikt als lexicon binnen een automatisch systeem voor taalverwerking, zoals bijvoorbeeld een lemmatizer, een syntactische tagger of een semantische tagger.

Het RBN is gebruikt als lexicon of onderdeel van een nieuw lexicon binnen onder meer de volgende projecten:

  • Corpus Gesproken Nederlands
  • DOT-termextractor: een prototype voor een termextractor voor het domein Overheidsterminologie (IMS Stuttgart)
  • NL-translex

 

 

Promotie-cd

De TST-centrale heeft in 2005 een promotie-cd voor het RBN gemaakt.

De cd bevat:

  • interviews met gebruikers van het RBN
  • interviews met samenstellers van het RBN
  • een demonstratie van het RBN online
  • achtergrondinformatie over bijvoorbeeld de geografische namen en de lexicale en grammaticale collocaties
  • een toelichting bij het gebruik binnen de bilinguale lexicografie

U kunt de cd bestellen bij Dit e-mailadres is beschermd tegen spambots. U heeft Javascript nodig om het te kunnen zien. . Als u uw naam en postadres opgeeft, sturen wij hem u zo snel mogelijk toe.

 

Publicaties over het RBN:

  • Martin, W. en J. Ploeger. 'Tweetalige woordenboeken voor het Nederlands: het beleid van de Commissie Lexicografische Vertaalvoorzieningen.' In: Neerlandica Extra Muros 37-(1999): 22-32.
  • Vliet, H.D. van der. Het RBN .....