Grandes formes éditoriales dans Gallica au 19e siècle
Corpus d'entraînement
Catégorisation
Le modèle reprend des catégories documentaires et thématiques utilisées par la Bibliothèque Nationales pour structurer ses fonds (cotation Clément). Les catégories présentent l'intérêt d'être contemporaines de la publication des documents et de limiter le risque d'anachronisme. Les "romans" couvrent ainsi d'autres formes de créations en proses (nouvelles et contes).Le modèle actuel a retenu 13 classifications :
- Droit (E)
- Géographie (G)
- Histoire (L sauf cotes de la Biographie et des Actualités politiques)
- Biographie (Ln27)
- Bibliographie (Q)
- Sciences philosophiques, morales et physiques (R)
- Sciences naturelles (S)
- Sciences médicales (T)
- Ingénierie et histoire de l'art (V)
- Linguistique et rhétorique (X)
- Poésie (Y)
- Roman (Y2)
- Théâtre (Yth)
Le modèle inclut également une catégorie reconstruite à partir d'ouvrages normalement inclus dans la catégorie histoire au titre de sources historiques mais qui constituent principalement des documents d'actualité politique (Lb43-Lb61)
Paramètres
Évaluation
Corpus applicable
Description
Modèle entraîné à partir de 13 grandes classifications documentaires établies par la Bibliothèque Nationale de France au 19e siècle (cotation Clément)Modèle
Télécharger le modèle au format RCorpus
Télécharger le corpus d'entraînementFormat original
Auteur
Citer ce document
“Grandes formes éditoriales dans Gallica au 19e siècle,” Generotheque, consulté le 15 octobre 2024, http://www.numapresse.org/generotheque/items/show/5.