Naam:Corpus Gesproken Nederlands
Afkorting:CGN
Omschrijving:Het CGN is een verzameling van 900 uur (± 9 miljoen woorden) hedendaags Nederlandse spraak, afkomstig van Vlamingen en Nederlanders. De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica, frequentielijsten en de corpusexploratiesoftware Corex behoren ook tot het CGN.
Bestellen:Neem contact op met de Dit e-mailadres is beschermd tegen spambots. U heeft Javascript nodig om het te kunnen zien.
Servicedesk:reactieformulier
Prijzen (excl. btw):€ 0 (niet-commercieel gebruik, geheel)
€ 15000 (commercieel gebruik, geheel)
Product sheet:klik op de afbeelding om te downloaden
Documentatie:CGN-website (o.a. projectinformatie, transcriptieprotocollen, updates, support etc.)
artikel: Over het Corpus Gesproken Nederlands
Evaluatierapport BAS
Demomateriaal:CGN-webcursus
CGN-demo
Versie/jaar:versie 2.0, 2006
Datatype/formaat:Spraakbestanden (wav), annotaties (xml)
Talen:Nederlands, Vlaams
Distributievorm:harddisk
Producent:CGN-consortium o.l.v. Language and Speech, Nijmegen en ELIS, Gent
Gerelateerd:CGN-annotatie-dvd, CGN-lexicon, JASMIN-spraakcorpus, Frequentielijsten Corpora, CGN-workshops