Op dit moment ontwikkelen we GiGaNT: een computationeel lexicon van de Nederlandse taal vanaf de zesde eeuw tot en met het heden. Dit lexicon vormt straks een verzameling van woorden en woordgroepen, waaronder ook named entities (namen van personen, plaatsen, organisaties), in alle mogelijke spelling- en vormvarianten. > Lees verder
Aan elke woordingang van GiGaNT koppelen we relevante taalkundige informatie zoals woordsoort, morfologische analyse en het woordparadigma door de eeuwen heen.
GiGaNT = lexicon met citaten
In GiGaNT worden alle woorden in het lexicon opgenomen met citaten, waarbij elk citaat is voorzien van bron en datum (bibliografische gegevens) en daterings- en lokaliseringsinformatie.
Gebruik van GiGaNT
GiGaNT is ontwikkeld voor computerlinguïstische tools. We bouwen het dan ook samen met een software-toolset voor zowel lexiconontwikkeling als lexicontoepassing. GiGaNT kunt u straks ook online raadplegen als onderdeel van de Taalbank Nederlands.
GiGaNT is volop in ontwikkeling. De eerste basismodule, gebaseerd op het materiaal van het Woordenboek der Nederlandsche Taal, komt vanaf begin 2013 op deze site (www.inl.nl) als webservice beschikbaar. Op dit moment vindt u al links naar drie working papers en lexicale data. > Lees verder
De regels en principes die ten grondslag liggen aan de drie onderstaande aspecten van GiGaNT hebben we beschreven in onderstaande handleidingen.
1 Morfosyntactische verrijking
handleiding Ruitenberg en Van pellicom et al. 2012
2 Lemmatiseerprincipes
handleiding Mooijaart 2012
3 Morfologische analyse
handleiding Karsdorp 2010
We ontwikkelden ook een morfologische parser
en een benchmark set voor historische morfologie.