Siri podría aprender a leer los labios mediante detección de movimiento
Fuente de fondo de HAL 9000: Warner Bros.
Los futuros dispositivos Apple podrán utilizar la detección de movimiento para leer los labios y así activar Siri sin necesidad de un micrófono para escuchar constantemente las órdenes.
Si tienes edad suficiente, la idea de que Siri pueda leer los labios de cualquier manera te ha traído a la mente de manera inmediata y preocupante "2001: Una odisea en el espacio" de Arthur C. Clarke y Stanley Kubrick. Con suerte, si Apple está canalizando esa película de 1968, es porque la computadora HAL 9000 tenía excelentes habilidades de reconocimiento de voz.
En comparación, Siri tiene muchas más dificultades para comprender de manera confiable y consistente los comandos hablados, pero para ser justos, tampoco ha intentado matar a la tripulación de una nave espacial. Son cambios y equilibrios.
Sin embargo, es posible que darle a Siri un aspecto adicional, como detectar los movimientos de la boca y la cabeza, pueda mejorar su precisión. Una solicitud de patente recientemente revelada llamada "Detección de palabras clave mediante detección de movimiento" tiene como objetivo hacer eso, pero luego hay algo más.
"[Los datos] se reciben de un sensor de movimiento, por ejemplo, registra el movimiento de un usuario cuando el usuario pronuncia una entrada de voz", dice la solicitud de patente. "Se determina si una parte de los datos de movimiento coincide con los datos de referencia para un conjunto de una o más palabras (por ejemplo, una palabra o frase)".
"Además, los sistemas de control de voz [solo] pueden generar respuestas falsas positivas", mencionó Apple, "si el sensor de audio capta ruido ambiental o el habla de un usuario no deseado".
La solicitud de patente detalla cómo se pueden comparar los movimientos de la boca con datos anteriores mientras Siri o un dispositivo intenta encontrar una coincidencia.
Pero esto no es realmente para mejorar Siri, y no es una señal de que Apple esté planeando algunos dispositivos sin micrófonos. En cambio, Apple propone que dicha detección de movimiento podría significar poder apagar los micrófonos que utiliza un dispositivo para escuchar constantemente "Siri" o "Oye, Siri".
"[Continuamente] detectar y procesar datos de audio gasta energía y capacidad de procesamiento incluso cuando el usuario no está utilizando activamente el control por voz", dice Apple.
"Cuando un usuario habla, su boca, cara, cabeza y cuello se mueven y vibran", continúa. "Los sensores de movimiento como acelerómetros y giroscopios pueden detectar estos movimientos, mientras gastan relativamente poca energía en comparación con sensores de audio como los micrófonos".
Detectar movimiento ahora y compararlo con registros anteriores parece claramente funcionar cuando lo que se dice es "Oye, Siri" o algún otro comando normal. como "Siguiente pista". Cuando el comando hablado es menos común, como "Oye, Siri, abre las puertas del módulo", entonces seguramente la detección de movimiento no funcionará.
Pero siempre que la detección de movimiento sea lo suficientemente rápida, detectar que un usuario ha dicho "Siri" debería significar que el dispositivo pueda encender los micrófonos a tiempo para captar la voz del resto.
Aparte de referirse a acelerómetros y giroscopios, la solicitud de patente de Apple no dedica mucho tiempo a discutir los dispositivos que podrían usarse para implementar esta propuesta.
Sin embargo, se trata de lectura de labios mediante detección de movimiento, en lugar de a través de cámaras y línea de visión. Entonces, especialmente en combinación con un iPhone, esta detección de movimiento teóricamente podría funcionar tanto con AirPods como, por ejemplo, con Apple Vision Pro.
Esta solicitud de patente se atribuye a dos inventores, incluido Madhu Chinthakunta. El trabajo anterior de Chinthakunta para Apple incluye una patente para que Siri automáticamente haga arreglos y llame en su nombre.
William Gallagher tiene 30 años de experiencia entre la BBC y AppleInsider hablando de tecnología Apple. Fuera de AppleInsider, es mejor conocido por escribir dramas de radio de Doctor Who para BBC/Big Finish, y es el De...