Welcome to the VLO!
Use the search bar below to start searching through hundreds of thousands of language resources, or continue to browse everything and use facets to narrow down to your area of interest or discover new resources.
See all records Learn more Take a quick tourUse the categories below to limit the search results to those matching the selected value(s).
Show more facetsThese levels provide an indication of the degree to which resources and tools are publicly accessible. Please check the specific conditions on any resource or tool that you end up using.
The Gender Identification Resource for Literature and Style (GIRLS)Le corpus GIRLS est constitué de 64 romans français d…
The Gender Identification Resource for Literature and Style (GIRLS)Le corpus GIRLS est constitué de 64 romans français du XIXe siècle, dont la moitié a été écrite par des femmes et l'autre par des hommes. Il y a un seul livre par personne. Ces textes sont dans le domaine public et ont été récupérés de manière automatiq…
Lexique4linguists fournit un équivalent de la base de données lexicale du français Lexique dans sa version la plus récen…
Lexique4linguists fournit un équivalent de la base de données lexicale du français Lexique dans sa version la plus récente sous une forme plus adaptée aux besoins des linguistes. La base de données est construite à partir des deux types d’unités lexicales généralement reconnues et étudiées par les linguistes, à savoir …
Mediapi-RGB is a bilingual corpus of French Sign Language (LSF) and written French in the form of subtitled videos, acco…
Mediapi-RGB is a bilingual corpus of French Sign Language (LSF) and written French in the form of subtitled videos, accompanied by complementary data (various representations, segmentation, vocabulary, etc.). It can be used in academic research for a wide range of tasks, such as training or evaluating sign language (SL…
Corpus d'interaction spontané de deux enfants autistes de haut niveau.
Corpus d'interaction spontané de deux enfants autistes de haut niveau.
PROLINGSA (Linguistic Progress during Study Abroad) is a longitudinal corpus that provides insights into the linguistic …
PROLINGSA (Linguistic Progress during Study Abroad) is a longitudinal corpus that provides insights into the linguistic development of five francophone Erasmus+ students spending an academic year abroad on an British or Irish campus. The project aims to explore the dynamics of second language development in an Anglopho…
French corpus of laboratory speech, designed to test the role of prosodic cues (specifically the Initial Accent in Frenc…
French corpus of laboratory speech, designed to test the role of prosodic cues (specifically the Initial Accent in French) in disambiguating syntactically ambiguous sentences (similar to the "Old men and women" paradigm). Approx. 3000 sentences, varying in constituants' length and syntactic scope.6 Speakers * 64 senten…
Le corpus contient un ensemble de scans du journal intime de Leonore Alt (1901-2003), pour une courte période autour de …
Le corpus contient un ensemble de scans du journal intime de Leonore Alt (1901-2003), pour une courte période autour de 1941-1942 (pour l'instant), qui présente un intérêt historique particulier lié à la description du contexte berlinois et à la perception des premiers départs de trains de déportés juifs. Le corpus com…
The German corpus consists of twelve documents (Berichte) of the Commissioner of the Government for Migration, Refugees …
The German corpus consists of twelve documents (Berichte) of the Commissioner of the Government for Migration, Refugees and Integration (Beauftragte der Bundesregierung für Migration, Flüchtlinge und Integration) between 1991 and 2014.; Présentation du corpus Ce corpus, créé ad hoc pour l'article « Dire l’intégration.…
The French corpus consists of eighteen documents from the Higher Council for Integration (Haut Conseil à l'Intégration) …
The French corpus consists of eighteen documents from the Higher Council for Integration (Haut Conseil à l'Intégration) between 1991, which is the publication year of the first report, and 2012, which is the year when the Higher Council for Integration ceased its activity. Please note that the dates in the ISO code c…
The initial corpus was converted into TEI within the framework of the CoMeRe (Communication médiée par les résea…
The initial corpus was converted into TEI within the framework of the CoMeRe (Communication médiée par les réseaux) http://comere.org. This project aims to assemble different network-mediated communication corpora in French (Internet, telecommunication), to structure them in a standard format an…