Infoscience

Report

Apprentissage de prototypes de caracteres a partir de l'image d'un texte manuscrit et avec l'aide d'un operateur

Ce rapport décrit la réalisation d'une interface permettant à un opérateur d'extraire de l'image d'un texte manuscrit des prototypes de caractères et des les accumuler dans une base de données devant servir ultérieurement à la reconnaissance de l'écrit. L'utilité d'une telle interface intervient dans le cas où la reconnaissance de l'écrit s'applique à de longs documents ayant un style particulier (par ex. documents anciens). La méthode utilisée part d'une représentation des caractères par le contour et résout la difficulté que constitue l'isolement d'un caractère en sur-segmentant légérement l'image des contours par rapport à une segmentation en caractères. L'opérateur rassemble ensuite les segments pour former les prototypes de caractère. This report describes the realisation of an interface by which an operator can extract character prototypes from the image of a handwritten text and accumulate them into a database, which will be used afterwards for text recognition. Such an interface is usefull in the case where text recognition is required for long documents with a particular writing style (e.g. ancient documents). The method applied in this system, based on a boundary representation of characters, solves in the following manner the difficulty of isolating a character. The boundary image is slightly over-segmented with respect to a segmentation into characters. The operator gathers then the segments composing a single character.

Related material