Una herramienta de Google 'enseña' a las computadoras a ver
Las computadoras solían ser ciegas y ahora pueden ver.
Gracias a los sofisticados algortimos en aumento, las computadoras ahora pueden reconocer e identificar a la Torre Eiffel, la Mona Lisa o una lata de Budweiser.
Pese a los enormes avances tecnológicos en la última década, o más, la búsqueda visual tiene muchos más obstáculos que eliminar.
En este punto, sería más rápido describir los tipos de cosas que un motor de búsqueda de imágenes puede interpretar en vez de las que no puede. Pero el rápido progreso, aunado al creciente número de mentes brillantes que están adoptando este reto, está haciendo que la vista robótica inteligente esté al alcance.
Hartmut Neven, un director de ingeniería que dirige iniciativas de búsquedas visuales en Google, predice que la casi perfección podría llegar en la siguiente década.
“En 10 años, podremos reconocer, en principio, más o menos cualquier objeto en el que estemos interesados”, dijo Neven en una entrevista reciente. “El progreso técnico y científico está acelerando a un ritmo exponencial”.
Neven comenzó su investigación en 1992, y bajo su propia línea de tiempo, está esencialmente a más de medio camino de lograr su objetivo,
Goggles de Google
El producto de su trabajo y del de su equipo de ingenieros está contenido en un servicio llamado Goggles . Existe como una aplicación independiente para los celulares Android y una herramienta de Google Mobile App para iPhone.
Con Goggles, el usuario toma una fotografía, la cual es transmitida a través de las redes celulares a los servidores de Google. Las computadoras de Google dicen entonces al teléfono que han reconocido la fotografía. Este proceso puede requerir solamente un segundo o dos y algunas veces incluso menos.
Los algoritmos de Google, las líneas de código que descomponen los datos a bits reconocibles para las máquinas, son buenos para reconocer ciertas cosas.
Edificios icónicos y obras de arte, productos en estanterías de tiendas, códigos de barra y anuncios de revistas son un ejemplo. El sistema puede reconocer texto en un póster o buscar una página en la web con una escritura similar, o traducir el menú en un restaurante francés.
Microsoft también tiene una aplicación de búsqueda visual para Bing, aunque sus funciones son más limitadas.
Hasta ahora, estos sistemas computacionales son menos hábiles para reconocer humanos. Pero el equipo de Goggles de Google está trabajando en un sistema que pueda identificar rostros en las fotos , siempre y cuando las personas acepten ser incluidas en este base de datos, dijo Neven.
Objetos irreconocibles
Pero los algoritmos de Google no dan resultados para muchas de las cosas comunes. Muebles, ropa, accesorios, dispositivos, comida, animales, autos, árboles y muchos objetos cotidianos son vistos como objetos extraños al sistema.
“Nuestra ambición es nada menos que ser capaces de reconocer cualquier objeto en el planeta. Pero ahora, la visión de la computadora no está en ese estado todavía. Existen muchas cosas que, desafortunadamente, no podemos reconocer propiamente”, dijo Neven.
Los mayores obstáculos están en una categoría: objetos sin una fuerte textura visual y con pocas marcas distintivas. Estos incluyen a muchos productos que son difíciles de identificar sin un empaque colorido como bolsas, zapatos y celulares.
Los desarrolladores de Google están tratando de resolver el problema. Neven está emocionado por el potencial de permitir al sistema identificar cuál es la especie de árbol de la que cayó una hoja, o el modelo del auto estacionado en la calle.
Mientras tanto, Google enlista la aplicación Goggles en la sección de Lab, lo cual significa que el proyecto está todavía en una fase experimental, dijo un vocero de la empresa.
La aplicación Goggles también lee códigos QR, esos cuadrados blanco con negro que se encuentran en anuncios y póster, que cuando son escaneados por un smartphone, dan acceso a videos y otros contenidos interactivos. Hasta que Goggles pueda reconocer todo, los códigos QR sirven a una necesidad interina; tomar una foto de algo y obtener su contraparte digital.
Otros usos para la búsqueda de imágenes
Esta subyacente tecnología de búsqueda de imágenes es importante para muchos de los productos de Google.
Los algoritmos de búsqueda de imagen ayudan a reconocer autos y personas en el servicio de Street View de Google con el fin de difuminar las placas de los coches y las caras. También ayudan a alertar cuando una fotografía revela demasiada piel humana, categorizándola en el filtro 'adulto' de Google Images.
Otros usos relacionados con este tipo de tecnología son aplicaciones más obvias. Face.com puede examinar fotografías en Facebook para identificar personas en ellas que no fueron manualmente etiquetadas. Del mismo modo, la tecnología de Neven en Google puede ser usada para identificar rostros en la colección personal de fotografías del usuario en Picasa.
Pero esta tecnología de reconocimiento facial, que algunas veces piensa que tu hermana es realmente tu abuelo, tiene mucho espacio aún para avanzar.