Evaluating Deep Learning Methods for Word Segmentation of Scripta Continua Texts in Old French and Latin

Tokenization of modern and old Western European languages seems to be fairly simple, as it stands on the presence mostly of markers such as spaces and punctuation. However, when dealing with old sources like manuscripts written in scripta continua, antiquity epigraphy or Middle Age manuscripts, (1)...

Full description

Bibliographic Details
Main Author:	Thibault Clérice
Format:	Article
Language:	English
Published:	Nicolas Turenne 2020-04-01
Series:	Journal of Data Mining and Digital Humanities
Subjects:	convolutional network scripta continua tokenization old french word segmentation [shs.langue]humanities and social sciences/linguistics [shs.class]humanities and social sciences/classical studies [info]computer science [cs]
Online Access:	https://jdmdh.episciences.org/5581/pdf

Internet

https://jdmdh.episciences.org/5581/pdf

Evaluating Deep Learning Methods for Word Segmentation of Scripta Continua Texts in Old French and Latin

Internet

Similar Items