Cette formation est organisée par le CRBC dans le cadre du projet COLaF (Corpus et Outils pour les langues de France) co-porté par l'équipe ALMAnaCH (Inria), avec le soutien du Datalab MSHB de Brest.
Dans le cadre d’une recherche, la première étape, celle de l’acquisition des données textuelles d’un corpus, est coûteuse en temps. L’outil eScriptorium facilite la transcription des sources, qu’elles soient imprimées ou manuscrites. Il permet en effet l’application de modèles de reconnaissance automatique des écritures (couramment appelée OCR, optical character recognition), entraînés avec de l’intelligence artificielle, dans une interface graphique accessible à toustes. L’outil sert également à la correction manuelle de la transcription automatique et permet ainsi d’obtenir des textes vérifiés dans un laps de temps raisonnable. La formation à eScriptorium permettra tant de comprendre les principes de l’OCR que de prendre en main l’outil.
9h30-12h30 : formation
14h-17h : exercices
Cette formation s'adresse en priorité aux membres du CRBC et des écoles doctorales ESC et ALL.
Les autres membres de la communauté universitaire verront leur inscription confirmée dans la limite des places disponibles restantes.
En Bretagne, pour un accompagnement à la prise en main d'eScriptorium, vous pouvez contacter la plateforme Humanités numériques de la MSHB. Un atelier "Numériser, transcrire automatiquement et organiser son corpus" aura lieu le 15 mai à Lorient.

Informations pratiques
Cette formation se déroulera en présentiel uniquement.
Elle sera animée par Lucence Ing (INRIA)
L'inscription est gratuite mais obligatoire pour participer. Le nombre d'inscriptions est limité à 15 personnes par atelier.