La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées

Ce tutoriel a pour but de décrire les bonnes pratiques pour la création d’ensembles de données et la spécialisation des modèles en fonction d’un projet HTR (Handwritten Text Recognition) ou OCR (Optical Character Recognition) sur des documents qui n’utilisent pas l’alphabet latin et donc pour lesque...

Full description

Bibliographic Details
Main Author: Chahan Vidal-Gorène
Format: Article
Language:fra
Published: Editorial Board of the Programming Historian 2023-01-01
Series:The Programming Historian en Français
Online Access:https://programminghistorian.org/fr/lecons/transcription-automatisee-graphies-non-latines
_version_ 1797868025195528192
author Chahan Vidal-Gorène
author_facet Chahan Vidal-Gorène
author_sort Chahan Vidal-Gorène
collection DOAJ
description Ce tutoriel a pour but de décrire les bonnes pratiques pour la création d’ensembles de données et la spécialisation des modèles en fonction d’un projet HTR (Handwritten Text Recognition) ou OCR (Optical Character Recognition) sur des documents qui n’utilisent pas l’alphabet latin et donc pour lesquels il n’existe pas ou très peu de données d’entraînement déjà disponibles. Le tutoriel a ainsi pour but de montrer des approches de minimal computing (ou d’investissement technique minimal) pour l’analyse de collections numériques à grande échelle pour des langues peu dotées. Notre tutoriel se concentrera sur un exemple en grec ancien, puis proposera une ouverture sur le traitement d’écritures arabes maghrébines manuscrites.
first_indexed 2024-04-09T23:49:32Z
format Article
id doaj.art-c1b463db3eae440189ed5eb603476f96
institution Directory Open Access Journal
issn 2631-9462
language fra
last_indexed 2024-04-09T23:49:32Z
publishDate 2023-01-01
publisher Editorial Board of the Programming Historian
record_format Article
series The Programming Historian en Français
spelling doaj.art-c1b463db3eae440189ed5eb603476f962023-03-17T14:35:22ZfraEditorial Board of the Programming HistorianThe Programming Historian en Français2631-94622023-01-015https://doi.org/10.46430/phfr0023La reconnaissance automatique d'écriture à l'épreuve des langues peu dotéesChahan Vidal-Gorène0https://orcid.org/0000-0003-1567-6508l’École nationale des Chartes-PSLCe tutoriel a pour but de décrire les bonnes pratiques pour la création d’ensembles de données et la spécialisation des modèles en fonction d’un projet HTR (Handwritten Text Recognition) ou OCR (Optical Character Recognition) sur des documents qui n’utilisent pas l’alphabet latin et donc pour lesquels il n’existe pas ou très peu de données d’entraînement déjà disponibles. Le tutoriel a ainsi pour but de montrer des approches de minimal computing (ou d’investissement technique minimal) pour l’analyse de collections numériques à grande échelle pour des langues peu dotées. Notre tutoriel se concentrera sur un exemple en grec ancien, puis proposera une ouverture sur le traitement d’écritures arabes maghrébines manuscrites.https://programminghistorian.org/fr/lecons/transcription-automatisee-graphies-non-latines
spellingShingle Chahan Vidal-Gorène
La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées
The Programming Historian en Français
title La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées
title_full La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées
title_fullStr La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées
title_full_unstemmed La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées
title_short La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées
title_sort la reconnaissance automatique d ecriture a l epreuve des langues peu dotees
url https://programminghistorian.org/fr/lecons/transcription-automatisee-graphies-non-latines
work_keys_str_mv AT chahanvidalgorene lareconnaissanceautomatiquedecriturealepreuvedeslanguespeudotees