Corpus français - Université de Leipzig

Mot-clé:
Texte de base: toute distinction entre minuscules et majuscules au début d'un mot
Changez le corpus:

Le Corpus français est une base de données composée de près de 37 millions de phrases, soit environ 700 millions de mots. Il a été extrait et constitué par le groupe de recherche TAL de l'Université de Leipzig / Allemagne, et aménagé avec le concours de Daniel Elmiger et Alain Kamber (Université de Neuchâtel / Suisse). Les interfaces et outils de recherche ont été développés dans le cadre du projet Leipzig Corpora Collection of Computer Science de l'Université de Leipzig.

Le corpus, dédié à l'étude du français contemporain écrit, est composé de trois parties: Si vous souhaitez obtenir des informations supplémentaires ou des instructions sur la façon d'utiliser le corpus, veuillez cliquer ici.