6. Métodos de captura de movimiento.


En la actualidad son numerosos los sistemas de captura de movimientos, y las tecnologías relacionadas con el mocap, las cuales consisten en el análisis y grabación de los datos de un movimiento. En las sesiones de captura lo que se analiza son las posiciones, las fuerzas, las velocidades y los impulsos de los movimientos del actor, tomando como referencia variables sacadas en un tiempo determinado (por ejemplo, tomando datos cada 2 ms). Para la captura hay diferentes equipos basados en tecnologías diferentes, las más conocidas son las ópticas de marcado, que se reconocen por usar deflectores en puntos estratégicos del cuerpo y las inerciales, como el mando Wiimote de las videoconsolas Wii que constituye un ejemplo muy básico de mocap de este tipo.

A continuación se describen brevemente las distintas tecnologías utilizadas para la captura de movimientos.

6.1 Captura de movimientos electromecánica

Los sistemas de captura de movimiento electromecánicos son aquellos sistemas en los que de forma general se realiza la captura de movimiento utilizando sensores mecánicos.

En el proceso de captura de movimientos, el actor o intérprete viste unos trajes especiales, adaptables al cuerpo humano. Los trajes son generalmente estructuras rígidas compuestas de barras metálicas o plásticas unidas mediante potenciómetros colocados en las principales articulaciones. El actor coloca la estructura en su cuerpo y mientras se mueve el traje se adapta a sus movimientos, y los potenciómetros recogen datos sobre el grado de apertura de las articulaciones.

Los potenciómetros constan de un elemento deslizante acoplado a una resistencia, que produce una variación de tensión que puede medirse para conocer el grado de apertura de la articulación a la que está acoplado, si bien los potenciómetros usados en captura de movimiento son mucho más complejos que los usados tradicionalmente en la industria electrónica. A veces, a estos sensores se les denomina sensores angulares digitales o analógicos. Los sensores angulares pueden enviar la información mediante cables, pero lo más frecuente es que lo hagan mediante radiofrecuencia.

Actriz vistiendo un traje electromecánico, en diferentes posiciones. (http://goo.gl/1qu2QD).

Actriz vistiendo un traje electromecánico, en diferentes posiciones. (http://goo.gl/1qu2QD).

Los sistemas de captura de movimiento electromecánicos tienen el problema, con respecto a otros sistemas de captura de movimientos, de ser incapaces de medir translaciones globales: son capaces de medir las posiciones relativas de los miembros, pero no el desplazamiento del actor en el escenario. Por este motivo, a veces se añade un sensor electromagnético al conjunto, aunque esto implica que podamos tener los problemas típicos de los sistemas electromagnéticos, como la interferencia producida por metales, cables, etc.

Además, estos sistemas asumen que la mayoría de los huesos humanos están unidos por articulaciones «bisagra», donde el único valor a medir es el grado de apertura, por lo que no tienen en cuenta rotaciones complejas que se producen frecuentemente en las articulaciones humanas, como los movimientos de hombros o los giros de los antebrazos. Los trajes electromecánicos no permiten variar la posición de los sensores, son pesados y suelen restringir el movimiento del actor. También tienen el problema de su limitado tiempo de vida. Sin embargo, con respecto a otros sistemas MoCap, tienen la ventaja de proporcionar, a un coste relativamente bajo, capacidad para registrar en tiempo real el movimiento de los actores, a una frecuencia alta, tener un alcance casi ilimitado y eliminar los problemas de oclusión típicos de los sistemas electromagnéticos.

Un sistema electromecánico completo tiene un precio comprendido entre 25000 y 75000 dólares (al margen el precio del sistema de posicionamiento global, en caso de utilizarse). También existen otras soluciones para movimientos que requieran mayor precisión como guantes, que se centran en capturar los movimientos de las articulaciones de la mano, pero los electromecánicos son muy pesados y por eso no se utilizan mucho.

6.2. Captura de movimientos electromagnética

En los sistemas de captura de movimiento electromagnéticos se dispone de una colección de sensores electromagnéticos que miden la relación espacial con un transmisor cercano. Los sensores se colocan en el cuerpo y se conectan a una unidad electrónica central, casi siempre mediante cables. Están constituidos por tres espiras ortogonales que miden el flujo magnético, determinando tanto la posición como la orientación del sensor.

Un transmisor genera un campo electromagnético de baja frecuencia que los receptores detectan y transmiten a la unidad electrónica de control, donde se filtra y amplifica. Después se envía a un ordenador central, donde se infiere la posición de todos los sensores en el espacio así como su orientación.

4

Sensor electromagnético (http://goo.gl/9GYkIY)

Un sistema magnético típico consta de un transmisor, hasta 18 sensores, una unidad de control electrónica y un software propietario para el procesamiento. Un rastreador magnético de última generación puede tener hasta 90 sensores y es capaz de capturar hasta 144 muestras por segundo, si bien este valor puede depender del número de sensores. El coste de estos sistemas varía de 5000 a 15000 dólares, lo cual supone un importante ahorro con respecto a los sistemas ópticos.

Si se desea aprovechar la capacidad de los rastreadores magnéticos de trabajar en tiempo real se debe conectar el sistema a un sistema computador con capacidad para renderizar un gran número de polígonos en tiempo real. Si el proyecto lo requiere, el coste del computador puede superar el coste del rastreador magnético.

El proceso de captura completo no es en tiempo real, pero se le aproxima bastante, dependiendo mucho de la cantidad de ampliación, filtrado y procesado de datos que se realice, así como del tiempo de respuesta de la conexión entre la unidad de control y el ordenador. La latencia de un rastreador magnético es el tiempo que transcurre entre la recogida de datos y la observación del resultado. Este valor puede variar desde varios milisegundos a unos pocos segundos. Dado que todos los datos que se recolectan están en relación con la posición del emisor, es más fácil procesar los datos que en otros sistemas MoCap.

Existen dos tipos de rastreadores electromagnéticos: los que usan pulsos magnéticos cuadrados (como Flock of Birds de Ascension Technology Corporation) y los que usan campos magnéticos sinusoidales (como el Patriot de Polhemus). Cada uno de ellos tiene problemas de interferencias con distintos materiales metálicos debido a su conductividad, que hace que se creen corrientes eléctricas en los metales que generan campos magnéticos que interfieren con el campo magnético del transmisor. Por este motivo, la captura de movimiento magnética es difícil de transportar a diferentes escenarios. Además, el número de capturas por segundo es generalmente demasiado bajo para registrar objetos a altas velocidades, y la precisión es del orden de 10 veces menor que con sistemas ópticos.

6.3. Captura óptica de movimiento.

Los sistemas ópticos utilizan los datos recogidos por sensores de imagen para inferir la posición de un elemento en el espacio, utilizando una o más cámaras sincronizadas para proporcionar proyecciones simultáneas. Lo habitual es que los datos se recojan utilizando indicadores (markers) pegados al actor, pero los sistemas más recientes permiten recoger datos fiables rastreando superficies del sujeto identificadas dinámicamente. Estos sistemas producen datos con 3 grados se libertad para cada indicador; la orientación de una superficie se infiere utilizando la posición relativa de al menos 3 indicadores.

Los sistemas ópticos de captura de movimiento son, en general, métodos muy fiables para capturar determinados movimientos cuando se utilizan sistemas de última generación. Además, permiten la grabación en tiempo real, con ciertas limitaciones como el número de indicadores, el número de actores y de cámaras.

Los sistemas ópticos más habituales se basan en un único ordenador que recibe la entrada de varias cámaras digitales CCD (charge-coupled device). Las CCD crean una representación digital de la imagen con una resolución que puede variar de 128×128 hasta 4096×4096 o más. Cuanto mayor sea la resolución mejor será la captura, pero hay otros factores a considerar; por ejemplo, actualmente una cámara de 4096×4096 sería capaz de capturar muy pocos fotogramas por segundo. El número de cámaras se comprende habitualmente entre 4 y 32. Aunque sería suficiente con dos cámaras para obtener la posición de cualquier indicador, son necesarias más cámaras para mantener siempre un rayo visual entre al menos dos cámaras y cualquier indicador. Sin embargo, añadir cámaras innecesariamente sólo complica el procesamiento de la información.

Las cámaras tienen una velocidad de captura de entre 30 y 1000 fotogramas por segundo, con lo cual permiten rodar objetos a velocidades más altas que otros sistemas de captura.

Cámaras de captura de movimiento marca OptiTrack (http://goo.gl/TjCrMZ)

Cámaras de captura de movimiento marca OptiTrack (http://goo.gl/TjCrMZ)

En los sistemas ópticos, se debe calibrar las cámaras mediante el rastreo de un objeto conocido que el software reconozca, de forma que se calcule la posición de cada cámara con respecto a un punto conocido. Si la cámara se mueve mínimamente, se deberá recalibrar.

6.3.1. Mediante indicadores pasivos.

Los indicadores pasivos están recubiertos de un material reflectante y se adhieren al traje del actor en puntos estratégicos. La luz que reflejan se origina cerca de las cámaras, y es recogida por éstas. Las cámaras pueden configurarse con un umbral de luz, de tal forma que sólo recojan la luz reflejada por los indicadores, no la luz reflejada por la superficie del sujeto.

Suponiendo que al menos 2 cámaras registren un marcador, se puede inferir la posición del marcador en el espacio. En este caso, el número de cámaras oscila entre 4 y 32. También hay sistemas de más de 300 cámaras para tratar de solucionar uno de los problemas de los indicadores pasivos: dado que todos los indicadores tienen el mismo aspecto, se produce lo que se denomina intercambio de indicadores (marker swap): el sistema puede confundir unos indicadores con otros. Además, pueden necesitarse más cámaras para cubrir totalmente todas las superficies del sujeto o para grabar a varios actores, como se dijo antes.

6

Marcador pasivo Optitrak (http://goo.gl/Z58SGo)

Los sistemas ópticos mediante indicadores pasivos no necesitan que el actor se coloque dispositivos electrónicos en el cuerpo, sino un gran número de bolas de goma cubiertas de material reflectante. Este tipo de sistemas pueden capturar un gran número de marcadores a frecuencias del orden de hasta 2000 fotogramas/segundo, si bien hay que compensar la velocidad de captura con la resolución. Existen sistemas de 4 megapíxels a 360 hercios por 100000 dólares, y sistemas de 0,3 megapíxels a 120 hercios por 50000 dólares.

6.3.2. Mediante indicadores activos.

En este sistema de captura, los indicadores emiten su propia luz (LEDs), con lo cual se consigue aumentar la distancia a la que se puede desplazar el sujeto.

Traje con indicadores activos (http://goo.gl/mGS4aC)

Traje con indicadores activos (http://goo.gl/mGS4aC)

La posición de los indicadores se determina iluminando un indicador en cada instante de tiempo a una frecuencia muy alta (lo cual perjudicaría la frecuencia de muestreo), o bien varios indicadores de cada vez, con procesamiento adicional para calcular la identidad de cada indicador a partir de su posición relativa. Para ello, los indicadores han de estar sincronizados con todas las cámaras para iluminarse en una sola captura.

 

6.3.3. Mediante indicadores activos modulados en el tiempo.

Se trata de una mejora con respecto a los indicadores activos, en la cual los marcadores no se iluminan uno de cada vez, sino que se iluminan muchos a la vez mediante luz estroboscópica, determinándose la identidad de cada indicador mediante la frecuencia de destello. De esta forma se consiguen frecuencias de captura mayores que con los sistemas activos estándar, con el inconveniente de aumentar la carga computacional, si bien esto en la actualidad no supone un problema.

Los sistemas con indicadores activos modulados en el tiempo permiten aplicar los movimientos del actor sobre el personaje animado, permitiendo observar el resultado en tiempo real. Al existir un único identificador para cada indicador, se elimina el problema del intercambio de indicadores. Además, este sistema permite rodar al aire libre bajo la luz directa del sol.

El procesamiento de los identificadores modulados se realiza en tiempo real en las cámaras, lo que permite tanto altas frecuencias de captura como mayor precisión a la hora de determinar la posición exacta del indicador, utilizando un algoritmo para aumentar la precisión de la información capturada.

Algunos sistemas de captura de movimiento formados por ocho cámaras de 12 megapíxels son capaces de capturar hasta 480 fotogramas por segundo a precios inferiores a 50000 dólares.

Nota: Otras fuentes hablan de sistemas con indicadores activos modulados mediante la amplitud o la frecuencia de la luz recibida, sin hacer referencia a la luz estroboscópica.

6.3.4. Mediante indicadores semi-pasivos imperceptibles (Semi-passive Imperceptible Marker).

A diferencia de los sistemas anteriores, en el caso de los indicadores semipasivos son los propios indicadores los que detectan su propia posición y orientación.

Los sistemas ópticos semipasivos utilizan cañones emisores de múltiples LEDS para codificar el espacio mediante la emisión de luz. Los indicadores son etiquetas fotosensibles que determinan no sólo su posición, sino también su orientación e incidencia de la iluminación, y se pueden colocar disimuladamente (por eso se les llama imperceptibles) en la ropa o en otros objetos.

Este sistema permite la captura bajo la luz natural y un número ilimitado de etiquetas indicadoras. Dado que no se utilizan, como en otros sistemas ópticos, cámaras de alta frecuencia, se reduce considerablemente el tráfico de datos generado. Cada indicador procesa su posición y ésta no tiene que calcularse a partir de imágenes. Estos sistemas son ideales para la captura de movimientos en tiempo real.

6.3.5. Sin marcadores.

Son sistemas en los que el seguimiento de los movimientos de los actores no requiere que éstos vistan equipos especiales, si bien en algunos sistemas se utilizan trajes especiales que facilitan la identificación de superficies. Utilizan algoritmos que analizan distintas fuentes de entrada de imágenes identificando formas humanas y descomponiéndolas en trozos para realizar el seguimiento de sus movimientos. Estos sistemas funcionan bien con movimientos generales pero suelen tener dificultades con movimientos específicos, como los de los dedos o la cara. Existen prototipos de sistemas de este estilo en la Universidad de Stanford, en el Instituto Tecnológico de Massachusetts (Massachusetts Institute of Technology, MIT) y en la Sociedad Max Plank. También existen sistemas comerciales, llamados sistemas basados en video, consistentes en obtener datos de movimiento haciendo un seguimiento de ciertos patrones en una secuencia de imágenes.

6.4. Captura mediante fibra óptica.

Los primeros sistemas de este estilo son los guantes de fibra óptica, pero en la actualmente se intenta aplicar esta técnica a la captura de movimientos del cuerpo entero. Los guantes de fibra óptica están constituidos por un conjunto de fibras ópticas que, al doblarse, atenúan la luz trasmitida, permitiendo calcular la posición de los dedos de la mano. El primer ejemplo de sistema de este tipo es el Dataglove.

5DT Data Glove 5 Ultra (http://goo.gl/KqUTas)

5DT Data Glove 5 Ultra (http://goo.gl/KqUTas)

Los 5DT Data Glove 5 Ultra son diseñados para el cumplimiento de estrictos requerimientos de los modernos MoCap y animación profesional. Ofrecen un gran confort, un uso sencillo, con una gran aplicación SDK para el desarrollo de aplicaciones. La alta calidad, el bajo cruce de relaciones y la alta captura de datos la hace ideal para la animación realista en tiempo real.

Los 5DT Data Glove 5 Ultra miden la flexión de los dedos (un sensor por dedo) de la mano del usuario.El sistema de interface del ordenador vía cable USB. Un puerto serial A (RS 232 con plataforma independiente) es una opción válida para trabajar con 5DT Data Glove 5 Ultra con un kit de interface. Esta proporciona una calidad de 10 bit de resolución en la flexión, extremadamente cómodo, poca desviación y una arquitectura abierta. Los 5DT Data Glove 5 Ultra con un kit de interface Wireles con el ordenador vía tecnología Bloetooth (distancia superior a 20 metros de alcance) con una conexión de alta velocidad para una autonomía superior a ocho horas con una sola batería. Están disponibles modelos tanto para la mano derecha como para la mano izquierda. Solo disponible una sola talla (licra elástica)

Características:

  • Tecnología de sensores avanzada.
  • Amplia gama de aplicaciones de apoyo.
  • Calidad asequible.
  • Confort extremo.
  • Talla única.
  • Calibración automática con un mínimo de 10-bit de resolución.
  • Plataforma independiente, con puerto USB e interface (RS 232).
  • Plataforma cruzada SDK (Windows, Linux and Mac).
  • Alto rango de subida de datos.
  • Procesado On-board.
  • Poco cruce de datos entre dedos.
  • Versión Wireless disponible.

Para captura de movimientos del cuerpo,  se fijan sobre distintas partes del cuerpo sensores flexibles de fibra óptica que miden las rotaciones de las articulaciones. Al igual que los sistemas electromecánicos, no se mide la posición del actor en el escenario. El sistema se puede complementar con sistemas electromagnéticos para medir la posición de la cabeza y el torso, como en el caso del Shapewrap II de Measurand.

Shapewrap II (http://goo.gl/odjfAl)

Shapewrap II (http://goo.gl/odjfAl)

 

6.5. Captura mediante ultrasonidos

En general, en los sistemas de captura de movimientos mediante ultrasonidos se utilizan emisores que generan pulsos ultrasónicos (imperceptibles por los seres humanos) que son capturados por uno o varios receptores situados en posiciones conocidas, permitiendo averiguar la posición del emisor en el espacio, e incluso su orientación en algunos casos.

Los emisores utilizados son todavía demasiado voluminosos y los sistemas actuales no son capaces de trabajar con movimientos bruscos. Estos sistemas se suelen combinar con sistemas inerciales. Sin embargo, el uso de sistemas ultrasónicos permite obtener un importante ahorro con respecto a otros sistemas de captura de movimientos, ya que en algunos prototipos, el precio actual es inferior a 3000 dólares.

6.6. Captura mediante sistemas inerciales

Los sistemas inerciales utilizan unos pequeños sensores (normalmente acelerómetros y giroscopios) que recogen información sobre la aceleración y la velocidad angular del sensor. Conociendo la posición y la velocidad angular inicial e integrando las informaciones que recogen los sensores, es posible determinar la posición, eje de giro y velocidad angular de cualquier sensor. Los datos recogidos por los sensores inerciales (inertial guidance system) se transmiten a un ordenador, donde se puede observar sobre una figura animada el movimiento completo registrado. En los sistemas inerciales puros puede producirse el problema de la deriva de integración (integration drift: los errores numéricos se acumulan sobre la velocidad u orientación del sensor), por lo cual es común combinar esta técnica con otros métodos de captura.

Este tipo de sistemas de captura de movimiento no utiliza mecanismos externos como cámaras; y como en el caso de los sistemas ópticos, cuantos más sensores se utilicen, más real es el movimiento reproducido. Son fáciles de transportar y tienen grandes rangos de captura, es decir alta precisió.

Uno de los sistemas más conocidos de este tipo son los mandos inalámbricos de la Wii de Nintendo (Wiimote o Wii remote), si bien para captura de movimiento se emplean otros sensores mucho más precisos y con mayor frecuencia de captura, generalmente acoplados a unos trajes especiales con varios sensores y en donde se ubica también una unidad transmisora.

Existen trajes de prestaciones muy variadas cuyos precios básicos varían entre 25000 y 80000 dólares.

6.7 Seguimiento de ojos

La combinación de seguimiento de los ojos con seguimiento cabezal óptico da líneas exactas de la vista, mientras que el usuario es capaz de moverse libremente dentro del área de seguimiento. Varias interfaces permiten el uso de cámaras con sistemas de seguimiento ocular.  La empresa SMI (Senso Motoric Instruments) ha desarrollado unas gafas que permiten el seguimiento de los ojos y combinado con la cámara sabe en qué punto estas deteniendo la mirada.  Actualmente este sistemas tiene un coste unos 9900 Euros.

Gafas captura ocular (www.eyetracking-glasses.com)

Gafas captura ocular (www.eyetracking-glasses.com)

6.8 Captura de movimiento en los videojuegos

En la actualidad la captura de datos se ha implementado en el ámbito de los videojuegos, de forma que permite una novedosa jugabilidad en entornos virtuales, creando una mejor inmersión en el juego. Las principales empresas que tienen estos sistemas son Sony (PlayStation Move), Microsoft (Kinect) y Nintendo.

6.8.1 Nintendo, Wii Remote.

Wii es una videoconsola producida por Nintendo y que apareció a finales de 2006 en Norteamérica y el 8 de diciembre del mismo año en Europa. Pertenece a la séptima generación de consolas y es la sucesora directa de Nintendo GameCube y compitió con Xbox 360 de Microsoft y PlayStation 3 de Sony. Desde Nintendo se afirmó que Wii está destinada a una audiencia más amplia a diferencia de las otras dos consolas mencionadas previamente. Desde su aparición, la consola superó a sus competidoras en cuanto a ventas y, en diciembre de 2009, rompió el récord como la consola más vendida en un solo mes en Estados Unidos.

La característica más distintiva de la consola es su mando inalámbrico, el Wii Remote, que  puede usarse como un dispositivo de mano con el que se puede apuntar y señalar, además de poder detectar movimientos en un plano tridimensional.

Desde su lanzamiento, recibió premios por la innovación de su controlador y la tecnología que incorpora en el sistema de juego.

Wii Remote

El Wii Remote tiene la capacidad de detectar la aceleración a lo largo de tres ejes mediante la utilización de un acelerómetro ADXL330. El Wiimote también cuenta con un sensor óptico PixArt, lo que le permite determinar el lugar al que el Wiimote está apuntando; además de agregar una brújula electrónica en el WiiMotionPlus.

A diferencia de un mando que detecta la luz de una pantalla de televisión, el Wiimote detecta la luz de la Barra sensor de la consola, lo que permite el uso coherente, independientemente del tipo o tamaño de la televisión. Esta barra mide aproximadamente 20 cm de longitud y cuenta con diez LED infrarrojos, con cinco LED dispuestos en cada extremo de la barra. En cada grupo de cinco LED, el LED más lejano fuera del centro apunta ligeramente lejos del centro, el LED más cercano al centro apunta ligeramente hacia el centro, mientras que los tres LED entre ellos están apuntando directamente hacia adelante y agrupados. La barra puede ser colocada por encima o por debajo de la televisión, y debe centrarse. Si está colocada por encima, el sensor debe estar alineado con la parte delantera de la televisión, y si coloca en la parte inferior, debe alinearse con la parte delantera de la superficie de la televisión en la que se coloca. No es necesario señalar directamente a la barra sensor, pero apuntar significativamente fuera de la barra de posición perturbará la capacidad de detección debido al limitado ángulo de visión del Wiimote.

Barra sensor de la consola (http://goo.gl/OUqEfU)

Barra sensor de la consola (http://goo.gl/OUqEfU)

El uso de la barra de sensores permite al Wiimote ser utilizado como un dispositivo de señalamiento preciso de hasta 5 metros de distancia de la barra. El sensor de imagen del Wiimote se utiliza para localizar los puntos de luz de la barra con respecto al campo de visión del Wiimote. La luz emitida desde cada extremo de la barra de sensores se centra en el sensor de imagen que ve la luz brillante como dos puntos separados por una distancia de «mi» en el sensor de imagen. La segunda distancia «m» entre los dos grupos de emisores de luz de la barra sensor es una distancia fija. A partir de estas dos distancias y mi m, el procesador de la consola Wii calcula la distancia entre el Wiimote y la barra de sensores utilizando la triangulación. Además, la rotación del Wiimote con respecto al suelo también puede ser calculada a partir del ángulo relativo de los dos puntos de luz en el sensor de imagen. Los juegos pueden ser programados para detectar si el sensor de imagen está o no cubierto.

Wiimote (http://goo.gl/0QEj7W)

Wiimote (http://goo.gl/0QEj7W)

La barra de sensores es necesaria cuando el Wiimote está controlando movimientos arriba-abajo o izquierda-derecha de un cursor en la pantalla del televisor para apuntar a las opciones de menú u objetos como los enemigos en un juego. Debido a que la barra de sensores también permite calcular la distancia entre el Wiimote y la sensibilidad de la Barra, el Wiimote también puede controlar el movimiento lento adelante-atrás hacia un objeto en un juego en 3 dimensiones. El movimiento rápido hacia delante o hacia atrás, como los puñetazos en un juego de boxeo, está controlado por los sensores de aceleración. Usando estos sensores de aceleración (que actúan como sensores de inclinación), el Wiimote también puede controlar la rotación de un cursor u otros objetos.

El uso de un sensor infrarrojo para detectar posición puede causar algunos problemas cuando otras fuentes de infrarrojos se encuentran alrededor, como bombillas incandescentes o velas. Esto puede ser fácilmente mitigado por el uso de luces fluorescentes alrededor de la Wii, ya que emiten poca o ninguna luz infrarroja. Usuarios innovadores han utilizado otras fuentes de luz IR como sustitutos de la barra de sensores, como un par de linternas y un par de velas. Tales sustitutos de la barra de sensores ilustran el hecho de que un par de luces estáticas proporcionan una calibración continua de la dirección que el Wiimote está apuntando y su ubicación física en relación con las fuentes luminosas. No hay manera de calibrar la posición del cursor en relación con la que el usuario está señalando con el controlador sin las dos fuentes estables de referencia de la luz proporcionada por la barra de sensores o sustitutos.

Los LEDs pueden verse a través de algunas cámaras y otros dispositivos con un mayor espectro visible que el ojo humano.

La posición y seguimiento del movimiento del Wii Remote permite al jugador imitar las acciones reales de juego, como mover una espada o una pistola con objetivo, en lugar de simplemente pulsando los botones.

 

6.8.2 Sony, PlayStation Move.

Play Station Move (http://goo.gl/chEvS9)

Play Station Move (http://goo.gl/chEvS9)

PlayStation Move es un sistema de control de videojuegos compatible con los sistemas de PS3 y PS4, el sistema está basado en la tecnología de sensor de movimiento. Este dispositivo fue desarrollado después de ver los buenos resultados obtenidos por la competencia y salió al mercado en el 2010. Actualmente es el sistema menos potente y con la menor estabilidad de captura de movimientos.

Al igual que en el resto de controladores inalámbricos para PlayStation, tanto el mando principal de PlayStation Move como el Navigation Controller usan la conexión inalámbrica Bluetooth 2.0 y una batería de ion de litio, que se carga mediante un puerto USB Mini-B.1 Se pueden usar hasta 4 controladores de PlayStation Move al mismo tiempo, pueden ser cuatro mandos principales o dos mandos principales y dos secundarios. Los tres componentes de PlayStation Move son:

Motion controller:

Es el mando principal de PlayStation Move. Tiene forma alargada y una esfera que se ilumina en diferentes colores, evitando tener el color de la habitación en que se juega. Básicamente consiste en una captura de movimientos con marcadores activos. Este sistema esta combinado con un giroscopio para detectar los giros, ya que sin realizar una triangulación ningún sistema de captura con marcadores puede determinar que se ha producido un giro.

El principal problema de este método de captura de pantalla es la luz y los colores de fondo. El sistema se vuelve inútil teniendo una luz de fondo, perdiendo por completo la posición de los marcadores. Por otro lado tiene una gran precisión detectando giros en mando.

Motion controller (http://goo.gl/UxDXp7)

Motion controller (http://goo.gl/UxDXp7)

PlayStation Eye:

Es el dispositivo mediante el cual se reconocen los controles del PlayStation Move, es  una cámara la cual detecta el color del control y lee los movimientos de éste, los cuales luego son representados en el juego. Esta cámara posee dos posiciones de lente, una permite utilizarla como una cámara web normal y la otra opción es la que activa la captura de movimientos. También posee un micrófono en su parte superior y en todo momento este dispositivo tiene que estar conectado mediante un puerto USB.

PlayStation Eye (http://goo.gl/Jllg8w)

PlayStation Eye (http://goo.gl/Jllg8w)

6.8.3 Microsoft, Kinect.

Kinect para Xbox 360, inicialmente conocido por el nombre en clave Project Natal es un periférico para videojuegos que prescinde de mandos gracias a un sensor de detección de movimientos, creado por Microsoft y está previsto que sea utilizable en ordenadores con el sistema operativo Windows 8. Está basado en una cámara periférica que se conecta a la videoconsola Xbox 360 reconociendo los gestos del jugador, su rostro, voz, así como sus movimientos y los objetos estáticos dentro un campo visual. Kinect fue lanzado en USA a finales de 2010.

Kinect (http://goo.gl/GJptwC)

Kinect (http://goo.gl/GJptwC)

El sensor de Kinect es una barra horizontal conectado a un pivote, diseñado para estar en una posición longitudinal. El dispositivo tiene una cámara RGB, sensor de profundidad y un micrófono multi-array bidireccional que conjuntamente capturan el movimiento de los cuerpos en 3D, además de ofrecer reconocimiento facial y aceptar comandos de voz.La nueva cámara denominada Kinect 2 permite a unos 30 cm capturar movimiento, esto puede utilizarse para la captura facial además de por ejemplo de los movimientos de las manos.

El sensor de Kinect reproduce video a una frecuencia de 30 Hz, en colores RGB 32-bit y resolución VGA de 640×480 pixels, el canal de video monocromo es de 16-bit, resolución QVGA de 320×240 pixels con hasta 65,536 niveles de sensibilidad. El límite del rango visual del sensor de Kinect está entre 1.2 y 3.5 metros de distancia, con un ángulo de vista de 57° horizontalmente y un ángulo de 43° verticalmente, mientras que el pivote puede orientarse hacia arriba o abajo ampliando hasta 27°. El array del micrófono tiene cuatro cápsulas, y opera con cada canal procesando 16-bit de audio con un ratio de frecuencia de 16 kHz.

Funcionamiento Kinect (http://goo.gl/vHeUpG)

Funcionamiento Kinect (http://goo.gl/vHeUpG)

El prototipo de Kinect con cámara y micrófono, creado por la empresa PrimeSense, costó $30,000, mientras cada unidad se comercializa un precio aproximado de $150. La cámara de Kinect funciona con hardware y software de serie para el reconocimiento de imagen. La cámara tiene dos funcionalidades principales, genera un mapa en 3D de la imagen que tiene en su campo visual y reconoce humanos en movimiento entre los objetos de la imagen a partir de diferentes segmentos de las articulaciones del cuerpo y un esquema en escala de grises del rostro.

Antiguos programas de software utilizaban las diferencias en color y textura para distinguir los objetos del fondo. PrimeSense, la compañía que desarrolló Kinect, y la compañía recientemente adquirida por Microsoft, Canesta, utilizan un modelo diferente. La cámara transmite luz invisible, cercana en el espectro a los infrarrojos y puede conocer el tiempo que tarda la luz en volver al sensor tras reflejarse en los objetos.

El sensor actúa como un sonar, la operación no es teóricamente complicada, si se conoce el tiempo de cada salida y llegada de la luz tras reflejarse en un objeto, sabiendo la velocidad absoluta de la luz, se puede tener la distancia a la cual se encuentra ese objeto. En un amplio campo visual con objetos, la cámara Kinect trata de reconocer a qué distancia están los objetos, distinguiendo el movimiento en tiempo real. Kinect puede llegar a distinguir la profundidad de cada objeto con diferencias de 1 centímetro y su altura y anchura con diferencias de 3 milímetros. El hardware de Kinect está compuesto por la cámara y el proyector de luz infrarroja, añadido al firmware y a un procesador que utiliza algoritmos para procesar las imágenes tridimensionales.

El procesador es capaz de interpretar los movimientos que se registran en los objetos capturados por la cámara de Kinect en eventos con significado que aparecen en pantalla. Los movimientos buscados por el algoritmo son contextualizados, si nos encontramos en un juego como Kinect Adventures, donde una balsa desciende por la corriente del río, si este juego requiere movimientos como agacharse o tumbarse, entonces se buscará la identificación de estos movimientos en tiempo real para producir eventos en pantalla. Si el usuario navega por el menú con interfaz gráfica como Netflix entonces se buscarán movimientos con la mano horizontal y vertical que serán registrados en los fenómenos de pantalla.

6.9. Sistemas de captura de movimiento con Kinect.

En la actualidad el sistema de Kinect permite la captura de movimientos para una posterior animación en entornos virtuales. Esto se consigue con software comerciales, como iClone, que permite al usuario poder hacer una captura de movimientos de un cuerpo para la posterior animación de un actor en un entorno virtual. Este software posee un pluing que permite usar la cámara del sistema Kinect, conectada a un ordenador, con el fin de capturar los movimientos. El sistema crea un skeleton parecido al de otros sistemas de captura de movimiento de precios muy superiores.

iClone pluing mocap Kinect (https://goo.gl/j4LD9F)

iClone pluing mocap Kinect (https://goo.gl/j4LD9F)

También es posible desarrollar aplicaciones informáticas para la detección de movimiento y reconocimiento de patrones con Kinect.

6.10 Captura de movimiento con una Web Cam, FaceShift.

El sistema de FaceShift permite la captura de los gestos de la cara para crear una animación a tiempo real de un cabeza virtual, en este caso un personaje de videojuego. El programa inicialmente necesita obtener datos biométricos de la cara, de forma que solicita realizar la medición de 20 poses faciales del actor en los que se muestre: serio, sonriendo, levantando una ceja, etc. En cada una de estas poses el programa obtiene datos, creando a su vez una malla del rostro, lo que permite discretizar a posteriori que gestos realizados. Una vez todos estos datos son procesados el programa puede realizar un seguimiento facial a través de la malla de triángulos calculada y es posible asociar dicha malla a un modelo 3D de forma que se anima una cabeza digital que imita en todo momento los gestos del actor.

Esto realmente es una forma muy simple de capturar movimientos pero proporciona muy buenos resultados. Como todos los sistemas de captura de movimiento con grabación de video si se alteran las condiciones ambientales de iluminación se generan problemas en el funcionamiento. A nivel de investigación este sistema tiene su aplicación médica en entrenamientos y seguimiento de recuperación en pacientes con parálisis facial.

Faces Shift (https://goo.gl/EUFDCP)

FacesShift (https://goo.gl/EUFDCP)