Sistema de Ayuda a al Gestión Documental basado en Visión por Computador y Realidad Aumentada.
Esta cátedra, llevada a cabo por la Universidad de Castilla-La Mancha, tiene como objetivo el desarrollo de un sistema de gestión documental que proporcione ayuda a los trabajadores con discapacidad intelectual o sensorial utilizando tecnologías como la realidad aumentada y la visión por computador.
Para ello, el sistema identifica el documento con el que está trabajando el usuario, así como la interacción directa que se realiza sobre el mismo. Un sistema de cómputo analiza la entrada y muestra información ampliada multimodal (visual y auditiva) sobre el nodo de información de trabajo actual.
La solución propuesta empleará los siguientes componentes hardware:
- Cámara USB: El sistema emplea una cámara de bajo coste como entrada al módulo de visión por computador.
- Cañón de proyección: El sistema empleará un cañón de proyección para mostrar información visual directamente alineada sobre el documento del mundo físico. El sistema responderá a las peticiones que el usuario realice directamente sobre el espacio físico ampliando información relacionada que sea relevante a la acción que quiera realizar.
- Sistema de cómputo: El sistema de cómputo se encargará de tomar como entrada las imágenes obtenidas por la cámara USB y generar la salida para el cañón de proyección. Esta salida deberá tener en cuenta el posicionamiento 3D relativo entre el documento y el cañón para que el registro de la amplificación visual sea perfecto. El documento podrá moverse dentro de una región del escritorio y la amplificación deberá quedar perfectamente alineada en el espacio físico. El sistema de cómputo además deberá generar información auditiva relevante al documento que está siendo tratado (por ejemplo, sintetizando voz o generando alertas sonoras), así como mostrar información adicional en una pantalla.
A partir de este objetivo general se pueden identificar los siguientes objetivos específicos y resultados esperados:
En definitiva, el proyecto ARgos facilitará la integración laboral de cualquier persona con discapacidad que tenga que gestionar documentación impresa.
- Sistema de identificación de documentos. ARgos contará con un sistema de identificación rápida de documentos empleando algoritmos específicos de visión por computador. A partir de una imagen 2D, el sistema calculará la distorsión debida a la proyección en perspectiva (a partir de los parámetros extrínsecos e intrínsecos de la cámara), y comparará el documento que está siendo analizado con una base de datos de documentos conocidos por el sistema.
- Interacción en el espacio físico. El usuario podrá interactuar directamente en el espacio físico señalando con el dedo sobre el papel. El sistema podría aceptar igualmente órdenes de voz, de modo que no sea necesario tocar el ratón o el teclado del ordenador para la utilización del mismo.
- Amplificación multimodal. ARgos contará con diferentes modos de amplificación de la información del mundo real. Por un lado, la información visual se amplificará empleando el cañón de proyección que mostrará información relevante al contexto directamente sobre el espacio del papel. El sistema de cómputo generará a la vez información auditiva relevante a la operación que se está realizando (síntesis de voz y alertas sonoras). La pantalla del sistema de cómputo podrá mostrar información 3D perfectamente alineada en el espacio del documento, así como otras fuentes de información visual adicionales.
- Componentes de bajo coste. Para facilitar la implantación real en el entorno de trabajo, ARgos deberá funcionar con componentes de bajo coste incorporando mecanismos de corrección de distorsión y registro 3D totalmente software.
Enlaces relacionados