Infoscience

Report

Approches generatives pour le traitement de sequences d'images: application a la reconnaissance dynamique des gestes de la main

Cet article propose deux approches génératives pour le traitement de séquences d'images appliquées à la reconnaissance dynamique des gestes de la main. Dans un premier temps, un modèle probabiliste gaussien de régions homogènes de teinte chair (blob) est présenté. Les paramètres des blobs sont calculés par un algorithme EM (Expectation-Maximisation). Les blobs obtenus sont moins nombreux et plus stables que les zones de pixels de teinte chair connexes dont les blobs sont issus. Dans un second temps, l'article décrit un modèle hybride à base de réseaux de neurones et de modèles de Markov cachés pour traiter des séquences de données et ainsi reconnaitre les trajectoires formées par les blobs comme des gestes. Les paramètres du modèle sont calculés également par un algorithme EM. Le modèle obtenu est capable d'effectuer des tâches de prédiction et de classification. Une extension générative de ce modèle est proposée pour prendre en compte la probabilité d'observation des entrées. Ainsi, le nouveau modèle génératif est capable de rejeter une séquence d'entrée qui n'a jamais été apprise.

Related material