Seeing AI, la nueva aplicación de Microsoft que narra la vida a los invidentes

Seeing Ai

Seeing AI, la nueva aplicación de Microsoft que narra la vida a los invidentes

Microsoft vuelve a sorprendernos lanzando Seeing AI una aplicación para smartphones que utiliza la visión por ordenador para describir el mundo para personas con visibilidad reducida o invidentes.

Los usuarios de esta herramienta Seeing AI pueden dirigir la cámara de su teléfono a una persona y obtendrán información de quiénes son y cómo se sienten. También pueden apuntar a un producto y le dirá lo que es. Esta aplicación utiliza la nube y se basa en IA (Inteligencia Artificial) para poder describir personas, textos y objetos.

seeing all

 

Situaciones en las que funciona la aplicación:

  • Reconoce a las personas que han visto antes y adivina la edad y la emoción de los extraños.
  • Identificar los productos del hogar escaneando los códigos de barras.
  • Lee y escanea documentos.
  • Reconoce la moneda estadounidense. Esta última función es un buen ejemplo de lo útil que puede ser ya que todos los billetes tienen el mismo tamaño y color y resultan imposibles de diferenciar para las personas con visibilidad reducida.


La aplicación utiliza redes neuronales para identificar el mundo que le rodea, utilizando la misma tecnología básica que se está desplegando en todo el Valle del Silicio, impulsando automóviles autodirigidos, drones y más. Las funciones más básicas de la aplicación se realizan directamente en el propio dispositivo. Esto significa que se puede acceder más rápidamente y en situaciones en las que no hay una conexión estable a Internet. Sin embargo, ver las características experimentales de AI – como describir una escena completa o reconocer la escritura a mano – requiere una conexión a la nube.

Saqib Shaikh, líder tecnológico de Seeing AI, dijo que utilizó una aplicación común para leer documentos como carteles y menús. Saqib ha señalado que la aplicación no sólo realiza la tarea básica de la tecnología de reconocimiento óptico de caracteres, sino que también dirige al usuario, diciéndoles que muevan la cámara hacia la izquierda o hacia la derecha para centrar el objeto en elobjetivo.

Según palabras de Shaikh la diferencia entre esta y aplicaciones similares es la velocidad de las redes neuronales: «Una de las cosas que queríamos hacer era el reconocimiento facial en el dispositivo, y lo hemos conseguido, así en unos pocos milisegundos se obtiene el resultado.”

Fuente