Veinte científicos de Xerox especializados en visión artificial y procesamiento de imágenes se unieron a finales de junio a sus colegas de Google, Facebook, Microsoft Research, Amazon y a algunas de las principales instituciones académicas del mundo para compartir sus investigaciones. El objetivo de esta comisión es hacer que los ordenadores se comporten cada vez más como si fueran ‘seres humanos’, imitando la forma en la que el cerebro ve y piensa.
La conferencia anual IEEE Computer Vision/Pattern Recognition, que se celebró entre el 23 y 28 de junio en Columbus, Ohio (Estados Unidos), reúne todos los años a importantes científicos de todo el mundo para que trabajen en mejorar la visión artificial, una disciplina que permite que los ordenadores mejoren su funcionamiento, aumentando e incluso superando en algunas ocasiones las capacidades humanas.
“Xerox tiene un amplio conocimiento de los procesos de negocio de muchos sectores y es pionera en enseñar a los ordenadores a extraer análisis de imágenes y vídeos significativos y procesables”, dijo Raja Bala, científico del Centro de Investigación que Xerox tiene en Webster, Nueva York. “Aunque ha habido un progreso significativo en los últimos años, todavía quedan retos científicos que tenemos que resolver”.
Las investigaciones que Xerox presentó en la conferencia de este año incluyen:
Detectar si los conductores utilizan dispositivos móviles cuando están conduciendo por la autopista
Algunas organizaciones gubernamentales estatales y federales prohíben el uso del teléfono móvil mientras se conduce para mejorar la seguridad en las carreteras. Los científicos de Xerox están trabajando en un sistema de cámaras para las autopistas que emplea tecnología de reconocimiento de patrones y detecta si un conductor está usando el teléfono móvil.
Convertir los smartphones en asistentes personales de conducción
Los investigadores de Webster también están trabajando en un proyecto de visión artificial que convertiría los teléfonos móviles en asistentes para la conducción. Al utilizar una tecnología de detección de rasgos faciales, el teléfono identificaría la dirección de la mirada del conductor y detectaría si está distraído o está prestando atención a la carretera.
Hacer imágenes que llamen más la atención
Los investigadores tanto de Xerox en Europa como de la Universidad de Harvard están estudiando qué es lo que más atrae la atención de la gente cuando ven una fotografía por primera vez. De esta forma se podrán desarrollar imágenes que tengan un mayor efecto para predecir dónde mirará la gente cuando visualice una escena, una foto o un juego.
Dar sentido a la información de la visión artificial: las firmas visuales
Imágenes y vídeo suponen el 90 por ciento del tráfico actual de Internet. Por eso es necesario contar con una tecnología que pueda analizar automáticamente una imagen y crear una única firma visual que la distinga de otras. El Centro Europeo de Investigación de Xerox (XRCE) ha inventado una metodología patentada y de primera línea que crea esas firmas de forma extremadamente compacta y sólida, superando los actuales métodos de aprendizaje, para afrontar los desafiantes problemas de clasificación de imágenes que existen actualmente.
Diseñar “preguntas de oro” en tareas complejas de crowdsourcing El crowdsourcing se emplea habitualmente como un foro para encontrar individuos que etiqueten imágenes. Pero tiene sus retos cuando se requieren expertos para temas específicos, ya que rara vez están disponibles en las plataformas de crowdsourcing. Para ayudar a los anotadores no especializados, los Centros de Investigación de Xerox en Europa e India han diseñado un sistema que puede hacer un filtro inicial para proponer un número muy limitado de categorías entre las que elegir. El sistema incluye automáticamente preguntas clave para identificar que los expertos que se seleccionen son fiables y proporcionan una cierta calidad en el trabajo.