Gekaapte Brieven

Het corpus Gekaapte Brieven bevat 6000 brieven en andere documenten uit de Sailing Letters: Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw van en aan het thuisfront, die zijn buitgemaakt door kapers en in Britse archieven zijn bewaard. De teksten in het corpus zijn aangevuld met taalkundige informatie.

Tags: ,

Couranten Corpus

Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn. De informatie in deze kranten is van belang voor onderzoekers van verschillende disciplines, variërend van historici tot historische taalkundigen, literatuurwetenschappers en kunsthistorici.

Tags: ,

Corpus Juridisch Nederlands

Het Corpus Juridisch Nederlands omvat een verzameling van 5.856 wetsteksten uit de periode 1814 tot 1989, die per jaar zijn samengesteld.

Tags: ,

Uitbreiding Corpus Hedendaags Nederlands

Het vernieuwde Corpus Hedendaags Nederlands (CHN) is sterk uitgebreid en bevat nu meer dan 2,5 miljoen teksten uit onder meer boeken, blogs, kranten, tijdschriften en journaaluitzendingen uit Nederland en de Caribische rijksdelen, Vlaanderen en Suriname. In de nieuwe versie van het CHN zijn 1.700.000 teksten toegevoegd: het corpus bestaat nu uit bijna 1 miljard woorden.…

Tags: ,

Brieven als Buit

Het corpus Brieven als Buit (origineel) bevat 1.000 Sailing Letters: Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw van en aan het thuisfront, die zijn buitgemaakt door kapers en in Britse archieven zijn bewaard. De teksten in het corpus zijn aangevuld met taalkundige informatie. Brieven als Buit-2 is een aanvulling op het originele corpus en bevat ruim 1.300 Sailing Letters. Deze teksten zijn niet taalkundig verrijkt maar wel voorzien van metadata.

Tags: ,

Nederlab

Nederlab is een webinterface die onderzoekers in staat stelt verspreide digitale historische corpora als eenheid te doorzoeken en te analyseren; dit geldt zowel voor de teksten zelf als voor de metadata.

Tags: ,

Eindhoven-corpus

Het Eindhoven-corpus is een verzameling Nederlandstalige geschreven en (uitgeschreven) gesproken teksten uit de periode van 1960 tot 1976. Het bevat materiaal uit kranten en tijdschriften en correspondentie tussen de regering en de Staten-Generaal, en diverse gesproken bronnen. Het is in diverse fases verbeterd en inmiddels bruikbaar gemaakt in een hedendaagse corpusapplicatie.

Tags: ,

Corpus Middel­nederlands

Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse rijm- en prozateksten uit de periode 1300-1550. Het corpus bevat veel literair materiaal, waaronder de Beatrijs en de Reynaert.

Tags: ,

Corpus Gysseling

Het Corpus Gysseling is een verzameling 13e-eeuwse Middelnederlandse teksten. Het zijn voornamelijk ambtelijke en literaire teksten die gebruikt zijn als bronnenmateriaal voor het Vroegmiddelnederlands Woordenboek (VMNW). De teksten in het corpus zijn aangevuld met taalkundige informatie.

Tags: ,

Corpus Oudnederlands

Het Corpus Oudnederlands is de verzameling van al het bekende Nederlandse woordmateriaal uit de periode 475-1200. Het bestaat uit drie grote teksten (Wachtendonkse Psalmen, Leidse Willeram, Mittelfränkische Reimbibel) en een aantal kleinere teksten, fragmenten, losse woorden en plaatsnamen. Het corpus is taalkundig verrijkt met woordsoort en lemma, en is gebruikt als bronnenmateriaal voor het Oudnederlands Woordenboek (ONW).

Tags: ,

Corpus Hedendaags Nederlands

Het Corpus Hedendaags Nederlands (CHN) is een groeiende tekstverzameling van meer dan 2.500.000 teksten uit kranten, tijdschriften, journaaluitzendingen, blogs, websites en romans. Het corpus is automatisch aangevuld met taalkundige informatie zoals woordsoort en lemma.

Tags: ,

Corpora

Een corpus is een grote verzameling geschreven of gesproken teksten, gemaakt om een taal te kunnen bestuderen en beschrijven. Onze historische corpora zijn: het Corpus Gysseling, het Corpus Oudnederlands en het Corpus Middelnederlands. Ons hedendaagse corpus is het Corpus Hedendaags Nederlands (CHN).

Tags: , ,


Terug naar 'Zoeken op tags'