Normal view MARC view ISBD view

Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas

By:

Ríos, Gastón Gustavo

Contributor(s):

Material type: Article

ArticleDescription: 1 archivo (629,5 kB) : il. colSubject(s):

Online resources:

Click here to access online

Summary: Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas.

Average rating: 0.0 (0 votes)

Holdings ( 1 )
Title notes ( 3 )

Holdings
Item type	Home library	Collection	Call number	URL	Status	Date due	Barcode
Capítulo de libro	Biblioteca de la Facultad de Informática	Biblioteca digital	A1340 (Browse shelf(Opens below))	Link to resource	No corresponde

Browsing Biblioteca de la Facultad de Informática shelves, Collection: Biblioteca digital Close shelf browser (Hides shelf browser)

Previous								Next
Previous	A1337 Implementación en SHACL de reglas de verificación de consistencia semántica para gestión de requisitos	A1338 Implantación de GDE en el Municipio de Lobería	A1339 Hera : una Herramienta para la Evaluación de Recursos Académicos	A1340 Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas	A1341 Experiencia de desarrollo de una aplicación de reconocimiento de canciones mediante la técnica de huella de audio	A1342 EVOTEM : una herramienta de software para el análisis de la evolución temática de publicaciones científicas en español	A1343 Estudios de casos realizados en PyMEs de Argentina para validar un conjunto de métricas para el despliegue de sistemas de software	Next

Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca)

Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas.

Congreso Argentino de Ciencias de la Computación (29no : 2023 : Luján, Argentina)