Abstract

Dans le cas d'une écriture liée, la segmentation en caractères de l'image numérique d'un manuscrit, en tant que traitement préliminaire à la reconnaissance du texte, pose problème. Cet article décrit une méthode de sur-segmentation par rapport à la segmentation en caractères dont le but est de fournir, sous la forme d'une suite, un ensemble restreint mais suffisant de positions potentielles de caractères qui serviront d'hypothèses à l'étape de reconnaissance. Supposant que les lignes du texte sont approximativement horizontales, la méthode procède à une segmentation en traits verticaux et horizontaux à partir du contour extraits de l'image. Les segments verticaux sont ensuite ordonnés pour fournir la suite des positions potentielles de caractères, à partir de laquelle il s'agira ensuite de reconna\^{\i}tre le texte en appliquant localement une méthode de reconnaissance des caractères. Le fonctionnement de la méthode est illustré sur quelques exemples de manuscrits anciens.

Details

Actions