Identificación biométrica a través del andar humano: enfoques y desarrollos

Vol. 25, núm. 2 marzo-abril 2024

Identificación biométrica a través del andar humano: enfoques y desarrollos

José Misael Burruel Zazueta, Héctor Rodríguez Rangel, Luis Alberto Morales Rosales, Vicenç Puig Cayuela y Gloria Ekaterine Peralta Peñuñuri Cita

Resumen

En un contexto donde el reconocimiento de personas cobra protagonismo, particularmente en el ámbito de la seguridad, emerge el Reconocimiento del Andar Humano (rah) como una técnica biométrica clave. Este enfoque, centrado en la forma de caminar, ha experimentado un notable auge en la investigación reciente, gracias a sus ventajas intrínsecas. La capacidad de llevar a cabo el reconocimiento a distancia, incluso sin el consentimiento explícito, posiciona al rah como una herramienta de vanguardia. Se distinguen dos enfoques computacionales: el basado en modelos, que explora el movimiento del cuerpo humano, y el basado en apariencias, que extrae la esencia de la forma de caminar desde la silueta. La versatilidad del rah radica en su independencia respecto al tipo de cámara utilizada, proporcionando información detallada sobre ángulos de flexión, frecuencia de zancada y longitud de partes del cuerpo. Este trabajo ofrece un análisis evolutivo del rah a lo largo del tiempo, destacando contribuciones significativas que han marcado pautas en la investigación.
Palabras clave: reconocimiento de personas, características biométricas, Reconocimiento del Andar Humano (rah), enfoque basado en modelos, enfoque basado en apariencias.

Biometric identification through human gait: approaches and developments

Abstract

In a context where the recognition of people takes center stage, particularly in the field of security, Human Gait Recognition (hgr) emerges as a key biometric technique. Focused on the way individuals walk, this approach has experienced a noteworthy surge in recent research due to its intrinsic advantages. The capability to perform recognition remotely, even without explicit consent, positions hgr as a cutting-edge tool. Two computational approaches stand out: model-based, that explores human body movement, and appearance-based, that extracts the essence of walking from silhouettes. hgr ‘s versatility lies in its independence from the type of camera used, providing detailed information on walking angles, stride frequency, and body part length. This work offers an evolutionary analysis of hgr over time, highlighting significant contributions that have set the course for research in the field.
Keywords: person recognition, biometric features, Human Gait Recognition (hgr), model-based approach, appearance-based approach.


Introducción

En la era digital actual, la identificación de personas se ha convertido en un tema fascinante que va más allá de las clásicas contraseñas y pin. ¿Te has preguntado alguna vez cómo tu teléfono inteligente sabe que eres tú al desbloquearlo? ¡Bienvenido al emocionante mundo de las características biométricas!

Estamos hablando de medidas biológicas que nos hacen únicos, como nuestras huellas dactilares, rostros, voces, iris o incluso nuestras venas. ¿Quién iba a pensar que algo tan personal como la forma en que caminamos también podría ser una firma única? El Reconocimiento del Andar Humano (rah) es como la huella dactilar de tu estilo al caminar.

Este juego de tecnología no se limita a los smartphones; lo encuentras en cerraduras inteligentes, sistemas de videovigilancia y otras aplicaciones. Imagina que tu forma de caminar no sólo te lleva de un lugar a otro, ¡sino que también te identifica en el camino!



Video 1. Escena de reconocimiento del andar humano en la película Misión imposible v.
Crédito: Cinemart, 2023.


¿Recuerdas que en la película Misión Imposible v los protagonistas se enfrentaron a un reconocedor del andar humano? El contexto se desarrolla cuando para lograr obtener acceso a un área restringida, los protagonistas de la película tienen que sortear algunas medidas de seguridad biométricas. Lectura de iris ocular, reconocimiento facial, huellas dactilares y finalmente el reconocimiento del andar humano. Los primeros tres reconocimientos fueron fácilmente evadidos ya que generaron copias exactas de estas características. Pero ¿y el rah? En la película se concluye que es imposible que el intruso logre generar un patrón de caminata exactamente igual al de la persona registrada para el acceso. Por lo que la misión consistirá en cambiar el chip donde se encuentra el registro con los patrones de caminata almacenados de la persona que originalmente tiene acceso y colocar un chip con los patrones de caminata del intruso, de esa forma el registro coincidiría con el patrón de caminata del intruso a la hora de pasar por el pasillo en donde se encuentra el reconocedor del andar humano.

Esta escena describe el funcionamiento del rah de forma muy cercana a la realidad. Los patrones que representan nuestra forma de caminar pueden ser almacenados y utilizados para futuras comparaciones, ya sea, para autentificación (comparar una nueva caminata con una almacenada) o identificación (comparar una nueva caminata con varios registros) (ver video 1).

En los últimos años, la investigación sobre rah ha aumentado debido a que ofrece ventajas, como la capacidad de realizar el reconocimiento a distancia de manera silenciosa, es decir, no requiere cooperación del usuario. Además, el hecho de que alguien oculte su rostro frente a una cámara no tiene ningún efecto en el rah. Por lo que, el rah es una técnica potencialmente útil para sistemas de identificación de personas que requieren la mínima cooperación de los usuarios, especialmente para actividades de vigilancia silenciosa en áreas de riesgo.

Reconocimiento del andar humano

Figura 1. Reconocimiento del andar humano mediante enfoques basados en modelos y apariencias.
Crédito: elaboración propia.

RAH en dos enfoques

El mundo del rah comenzó a tomar forma en 1994, con el desarrollo un primer sistema (Lin, B., et al., 1994). Desde entonces, los investigadores han explorado dos enfoques computacionales.

Por un lado, el enfoque basado en modelos se sumerge en características vinculadas al movimiento del cuerpo humano, como la flexión de extremidades y la frecuencia de pasos (Bouchrika, I., 2018). Por otro lado, el enfoque basado en apariencias se embarca en la tarea de extraer la esencia de la forma de caminar de una persona a través de su silueta (Bouchrika, I., 2018).

Enfoque basado en modelos

En el enfoque basado en modelos, el proceso se inicia creando un modelo que se asemeje a la persona presente en la imagen. Este modelo abarca las piernas, el torso, la cabeza y los brazos. Posteriormente, se procede a recopilar información detallada sobre la manera de caminar: sobre los ángulos de flexión, la frecuencia de zancada, la longitud de las diferentes partes del cuerpo, entre otros. Una de sus ventajas es que no importa el tipo de cámara utilizada para grabar la secuencia de caminar.

Sin embargo, es importante señalar que esta metodología presenta una desventaja significativa, que se encuentra en la necesidad de realizar un procesamiento extenso, lo que implica mayor potencia computacional y un aumento en el tiempo necesario para llevar a cabo dicho procesamiento. A pesar de este inconveniente, sigue siendo una herramienta valiosa en el campo del rah, pues ofrece una detallada visión de cómo nos movemos.

Este enfoque se desglosa en tres tipos distintos de métodos para identificar a quién pertenecen las características de caminata de cada sujeto. En los primeros intentos por abordar el desafío del rah, se empleaban algoritmos matemáticos y estadísticos. A medida que la tecnología avanzaba, se fueron introduciendo sistemas basados en redes neuronales artificiales,1 una joya del aprendizaje profundo, que es un subcampo de la inteligencia artificial. Finalmente, se ha visto la implementación de modelos basados en redes neuronales artificiales en tres dimensiones.2 Esta transición temporal es un emocionante testimonio de cómo la convergencia de la inteligencia artificial y la tecnología tridimensional ha transformado la manera en que comprendemos y aplicamos estas técnicas biométricas.

Los pioneros en el desarrollo de sistemas de rah dieron sus primeros pasos en la década de los noventa. En 1994, Lin y colaboradores utilizaron modelos de estructuras en dos dimensiones para explorar la dinámica de la marcha. Mientras tanto, en 1997, Cunado y colaboradores introdujeron algo denominado sistema basado en modelos de movimiento.3 En ambos casos, aplicaron un algoritmo de aprendizaje automático o machine learning conocido como K-vecinos más cercanos4 para analizar las diversas formas de caminar. Los resultados fueron notables, con tasas de reconocimiento del 81% y 90%, respectivamente.

Siguiendo la línea de investigación basada en modelos, en 2002, BenAbdelkader et al. llevaron a cabo un modelado del cuerpo humano. Utilizaron características como la longitud de los pasos y la velocidad al caminar, y emplearon un algoritmo gaussiano bivariable.5 Este enfoque continuo en la modelización detallada y el uso estratégico de algoritmos de aprendizaje automático ha sido fundamental para avanzar en la precisión y eficacia del rah. Estamos, literalmente, dando pasos firmes hacia un futuro más sofisticado en la identificación biométrica.

Una contribución crucial surgió en 2008 cuando se introdujo por primera vez una red neuronal artificial (ann, del inglés Artificial Neural Network), para clasificar características extraídas del modo de caminar de una persona a partir de modelos estructurales en dos dimensiones. Los arquitectos de este avance (Yoo et al., 2008) lograron una impresionante tasa de reconocimiento del 90%, utilizando 630 videos de la base de datos soton (Shutler et al., 2004). La eficiencia demostrada provocó que numerosos investigadores adoptaran y exploraran estas técnicas basadas en redes neuronales a partir de ese año, lo que catalizó un cambio significativo en la dirección de la investigación.

En una variante distinta, dos expertos en la materia (Ariyanto y Nixon, 2012) idearon un sistema para la identificación de personas en videos. La singularidad de su método radicó en la creación de una imagen tridimensional del cuerpo humano en movimiento, una suerte de escultura compuesta por pequeñas piezas: 11 puntos que conectaban la cabeza, el torso y las piernas (ver figura 2). De esta manera, se permitía el estudio detallado de aspectos clave, como el ángulo de movimiento, la longitud de las diferentes partes del cuerpo, la distancia que abarca cada paso y la dirección de los pies.

Lo anterior, además de ser un logro en la comprensión de la biomecánica del caminar, sentó las bases para una tendencia que se ha mantenido hasta la actualidad: el enfoque en los puntos clave del cuerpo humano y el uso de técnicas basadas en redes neuronales para su análisis. Estamos presenciando el inicio de una era donde la combinación de la representación tridimensional y la inteligencia artificial redefine nuestra comprensión de la identificación biométrica.

Enfoque basado en apariencias

Cuerpo humano en 3 dimensiones
Figura 2. Ejemplo de modelo del cuerpo humano en 3 dimensiones.
Crédito: elaboración propia.

Los sistemas basados en apariencia se adentran en la búsqueda de detalles en el movimiento o el cuerpo humano sin depender de un modelo previamente establecido. Esta aproximación presenta ventajas notables; por ejemplo, no requiere videos de alta calidad y no exige el uso de una computadora especializada, a diferencia del enfoque basado en modelos, lo que los hace más accesibles y prácticos en diversos escenarios. Sin embargo, como contrapartida, pueden ser sensibles al ángulo de la cámara en relación con las personas y cualquier objeto que pueda obstaculizar la visión. Este equilibrio entre accesibilidad y desafíos técnicos destaca la complejidad inherente al fascinante campo del rah.

En el año 2005, un destacado equipo de expertos (Sarkar, S., et al., 2005) presentó el primer sistema de reconocimiento de personas basado en apariencia. Este innovador enfoque utilizó siluetas humanas para identificar las características del ciclo de caminar de una persona, logrando una efectividad del 95%, incluso en condiciones de baja iluminación o con una calidad de video limitada. El proceso implicaba el uso de secuencias de video donde se detectaba la forma humana y se eliminaba el fondo, permitiendo así extraer la silueta de la persona. Con estas siluetas en mano, se calculaba la periodicidad del ciclo de caminar, lo que facilitaba la identificación precisa de la persona.

Además, en 2006, dos investigadores, Han y Bhanu, ampliando la propuesta de extracción de siluetas de Sarkar et al., desarrollaron una técnica revolucionaria para el reconocimiento de personas en videos: imágenes de energía de marcha (gei, del inglés Gait Energy Image; ver figura 3). En ella, se generaban múltiples imágenes de siluetas por cada video, de las cuales se obtenía una única gei. Su principal ventaja es la capacidad para condensar todo el ciclo de caminata en una única imagen, facilitando así la identificación de las características distintivas de la persona. Este avance fue de suma importancia para los sistemas de reconocimiento basados en apariencias, y además, abrió el camino para futuras investigaciones en el emocionante campo del rah.

Posteriormente, el aprendizaje profundo también emerge como un conjunto de técnicas sumamente valiosas para el reconocimiento automático de personas a través de imágenes del ciclo de la caminata. En particular, las redes neuronales profundas6 tienen la capacidad de extraer características significativas de las imágenes, lo que las convierte en una herramienta excepcionalmente efectiva para el reconocimiento de personas.

Imagen de energía de marcha
Figura 3. Ejemplo de imagen de energía de marcha, a partir del enfoque basado en apariencias.
Crédito: elaboración propia.

Dentro de este contexto, la técnica más prominente es la red neuronal convolucional (cnn, del inglés Convolutional Neural Network). Esta técnica ha demostrado un desempeño notable en la identificación de personas en diversas bases de datos. La capacidad de las cnn para procesar de manera eficiente información visual compleja, como las variaciones en el ciclo de caminar, ha impulsado su popularidad y éxito en el ámbito del reconocimiento biométrico.

GaitNet representa un avance significativo en el reconocimiento automático de personas en videos mediante aprendizaje profundo. Este sistema, desarrollado por expertos de Google (Song et al., 2016), emplea dos tipos de cnn para analizar de manera integral los videos y mejorar la precisión del reconocimiento. En una primera etapa, segmenta el video para obtener una imagen que representa el ciclo de la caminata de la persona o imagen de energía de marcha (gei). Posteriormente, otra red neuronal analiza esta imagen para extraer características esenciales que permiten la identificación precisa de la persona. La integración de ambas redes potencia el rendimiento del sistema de manera sinérgica.

En términos de resultados, GaitNet ha demostrado su eficacia con un rendimiento destacado del 89.9% en la base de datos de videos casia-b. Esta base de datos, que alberga 13640 videos de 124 personas capturados desde diversos ángulos y con variadas formas de caminar, se ha convertido en una referencia clave para mejorar el reconocimiento automático de personas. El éxito de GaitNet, además de validar la utilidad del aprendizaje profundo en este contexto, destaca la importancia de bases de datos ricas y variadas para impulsar el avance de las tecnologías biométricas.

A partir de 2020, ha surgido una técnica notable en el reconocimiento automático de personas denominada redes neuronales convolucionales en 3D (cnn3D) . En ella, las imágenes de las personas se organizan en conjuntos de datos tridimensionales, permitiendo que la red neuronal procese esta información de manera más eficiente. Los resultados obtenidos mediante la aplicación de esta técnica han sido extraordinarios, logrando una efectividad que supera el 90% en diversas bases de datos de rah. Según la investigación liderada por Lin, B. et al., esta técnica se posiciona como la más destacada hasta la fecha en términos de rendimiento. Estamos presenciando una era emocionante en la cual la combinación de aprendizaje profundo y representación tridimensional redefine los límites del rah.

Conclusiones

En la línea de investigación del rah, se han realizado contribuciones significativas que han impulsado la identificación de personas a través de su forma de caminar. En este sentido, el enfoque basado en modelos tiende a profundizar en el análisis minucioso de ángulos, longitudes, cadencia y otros aspectos específicos del comportamiento de las partes del cuerpo. Por otro lado, el enfoque basado en apariencias se inclina hacia el análisis integral del cuerpo, representando todo el ciclo de caminata en una sola imagen.

Esta dualidad entre los enfoques ilustra las diversas perspectivas adoptadas para abordar el problema del rah y sugiere una interesante alternancia de ventajas y desventajas entre ellos. Aquello que se percibe como una fortaleza en el enfoque basado en modelos puede, irónicamente, constituir una limitación en el enfoque basado en apariencias, y viceversa.

Desde cerraduras inteligentes hasta sistemas de videovigilancia, la variedad de enfoques permite adaptar las soluciones a las especificidades de cada contexto, cubriendo así una amplia gama de necesidades y exigencias en el ámbito del rah. Esta sinergia de enfoques no sólo impulsa la evolución continua del rah, sino que también destaca la importancia de considerar la diversidad como un elemento clave en el diseño y la implementación de sistemas biométricos avanzados.

Referencias

  • Ariyanto, G., y Nixon, M. S. (2012, marzo). Marionette mass-spring model for 3D gait biometrics [Conferencia]. 2012 5th iapr International Conference on Biometrics (icb), New Delhi, India. https://doi.org/10.1109/ICB.2012.6199832.
  • BenAbdelkader, C, Cutler, R., y Davis, L. (2022). Stride and cadence as a biometric in automatic person identification and verification (pp. 372-377). Proceedings of Fifth ieee International Conference on Automatic Face Gesture Recognition, Washington, dc, usa. ieee. https://doi.org/10.1109/AFGR.2002.1004182.
  • Bouchrika, I. (2018). A Survey of Using Biometrics for Smart Visual Surveillance: Gait Recognition. En P. Karampelas y T. Bourlai (Eds.), Surveillance in Action. Advanced Sciences and Technologies for Security Applications (pp. 3-23). Springer, Cham. https://doi.org/10.1007/978-3-319-68533-5_1.
  • Cinemart. (2023, 17 de julio). MISSION: IMPOSSIBLE – ROGUE NATION (2015) | Underground Water Full Scene | Underwater Scene 4K uhd [Video]. YouTube. https://youtu.be/88gJeeydT4E?si=7Ca2R9sCBcYACyS3.
  • Cunado, D., Nixon, M.S., y Carter, J.N. (1997). Using gait as a biometric, via phase-weighted magnitude spectra. En J. Bigün, G. Chollet, y G. Borgefors, G. (Eds.), Audio- and Video-based Biometric Person Authentication. AVBPA 1997. Lecture Notes in Computer Science, 1206. Springer. https://doi.org/10.1007/BFb0015984.
  • Han, J. y Bhanu, B. (2006, febrero). Individual recognition using gait energy image. ieee Transactions on Pattern Analysis and Machine Intelligence, 28(2), 316-322. https://doi.org/10.1109/TPAMI.2006.38.
  • Lin, B., Zhang, S., y Bao, F. (2020). Gait Recognition with Multiple-Temporal-Scale 3D Convolutional Neural Network. En Proceedings of the 28th acm International Conference on Multimedia (3054-3062). Association for Computing Machinery. https://doi.org/10.1145/3394171.3413861.
  • Niyogi, S. A., y Adelson, E. H. (1994). Analyzing and recognizing walking figures in XYT. En 1994 Proceedings of ieee Conference on Computer Vision and Pattern Recognition (pp. 469-474). ieee Transactions on Pattern Analysis and Machine Intelligence, 27(2), 162-177. https://doi.org/10.1109/TPAMI.2005.39.
  • Shutler, J. D., Grant, M. G., Nixon, M. S., y Carter, J. N. (2004). On a large sequence-based human gait database. En A. Lotfi, y J. M. Garibaldi (Eds.), Applications and Science in Soft Computing. Advances in Soft Computing (pp. 339-346). Springer. https://doi.org/10.1007/978-3-540-45240-9_46.
  • Song, C., Huang, Y., Huang, Y., Jia, N., y Wang, L. (2019, diciembre). Gaitnet: An end-to-end network for gait based human identification. Pattern recognition, 96. https://doi.org/10.1016/j.patcog.2019.106988.
  • Thavalengal, S., Andorko, I., Drimbarean, A., Bigioi, P., y Corcoran, P. (2015, mayo). Proof-of-concept and evaluation of a dual function visible/nir camera for iris authentication in smartphones. ieee Transactions on Consumer Electronics, 61(2), 137-143). https://doi.org/10.1109/TCE.2015.7150566.
  • Yang, W., Hu, J., y Wang, S. (2014). A Delaunay quadrangle-based fingerprint authentication system with template protection using topology code for local registration and security enhancement. ieee transactions on Information Forensics and Security, 9(7), 1179-1192. http://dx.doi.org/10.1109/TIFS.2014.2328095.
  • Yoo, J.-H., Hwang, D., Moon, K.-Y., y Nixon, M. S. (2008). Automated human recognition by gait using neural network. En 2008 First Workshops on Image Processing Theory, Tools and Applications, Sousse, Tunisia (pp. 1-6). ieee. https://doi.org/10.1109/IPTA.2008.4743792.


Recepción: 12/9/2018. Aprobación: 4/10/2018.

Facebook
Twitter
YouTube
Instagram

Revista Digital Universitaria Publicación bimestral Vol. 18, Núm. 6julio-agosto 2017 ISSN: 1607 - 6079