Carlos Pfeiffer
La vista es sin duda el más complejo de nuestros sentidos. Nos permite realizar actividades cotidianas, como desplazarnos sin chocar, escoger nuestra ropa, identificar una fruta madura, manipular herramientas, manejar, reconocer a las personas y objetos con los que interactuamos. Éstas son sólo unas cuantas entre una posibilidad inmensa de actividades. Cuando hablamos del sentido de la vista, inmediata-mente pensamos en los ojos, los órganos que nos permiten captar la luz reflejada o producida por los objetos, y convertirla en señales eléctricas que son trasmitidas al cerebro. Sin embargo, es precisamente en el cerebro donde se realizan las operaciones más complejas del sentido de la vista. El cerebro se encarga de interpretar las señales eléctricas producidas en las retinas de los ojos, procesar-las y tomar las decisiones adecuadas para realizar las actividades mencionadas líneas arriba. Nuestro sentido de la vista es estéreo o binocular; esto es, cada ojo percibe las imágenes desde una posición ligeramente diferente. El cerebro utiliza la disparidad entre ambas imágenes para obtener información tridimensional, como relieves, profundidad y distancia relativa a que se encuentran los objetos.
VISIÓN ARTIFICIAL
La disciplina conocida como “Visión Artificial” busca construir sistemas basados en la captación y análisis de la energía luminosa reflejada por los objetos, para obtener información que nos permita realizar actividades similares a las que nos permite el sentido de la vista. Un sistema de visión artificial debe contar con uno o más dispositivos para “adquirir imágenes”, y una computadora u otro dispositivo digital programable, para procesar y analizar la imagen, extraer información útil y tomar decisiones. En la actualidad, los dispositivos para adquirir las imágenes casi siempre consisten en cámaras con elementos ópticos y mecánicos para captar y enfocar la luz que proviene de los objetos, y componentes electrónicos que la traducen a señales eléctricas que son cuantificadas y transformadas en señales digitales. La imagen así formada es representada como un “mapa de pixeles”, una matriz para la cual a cada posición de la imagen corresponde in-formación relativa al color e intensidad de la luz captada. Estas imágenes son procesadas por la computadora, que obtiene la información útil de la imagen para analizarla y tomar decisiones.
SISTEMAS DE VISIÓN BARATOS
En la década más reciente, se ha avanzado mucho en el desarrollo de dispositivos de cámaras digitales cada vez más baratas y con mayor capacidad en cuanto a resolución, rapidez y sensibilidad. Esto ha permitido el abaratamiento de los sistemas de visión para aplicaciones industriales, que se han convertido en un estándar en la industria de la manufactura. Actualmente existen sistemas comercia-les de inspección visual para detectar piezas defectuosas, verificar el ensamblado de un circuito, contar piezas, coordinar la operación de maquinaria, identificar el tipo de pieza para su empaque, entre otras operaciones industria-les de uso común. La mayoría de las aplicaciones industriales actuales utilizan visión monocular (una sola cámara), la cual no permite la construcción de modelos tridimensionales. Sin embargo, la aplicación de sistemas de visión tridimensionales con múltiples cámaras y luz estructurada, está creciendo rápidamente. Los sistemas de visión artificial también se han convertido en elementos comunes en aplicaciones domésticas, desde aplicaciones sencillas como los lectores de códigos de barra en los supermercados, hasta aplicaciones más sofisticadas, como las recientes cámaras “inteligentes”. Éstas detectan automáticamente los rostros al tomar foto-grafías de personas; adecuan los parámetros de la cámara para una toma perfecta, y son capaces incluso de detectar si las personas están sonriendo o no.
PROCESAMIENTO DE LA IMAGEN ¿Cómo ha podido hacerse todo esto? La clave está en el procesamiento de la imagen para extraer características, y en la combinación de métodos matemáticos y heurísticos utilizados para analizarlas. Esto nos permite encontrar información diversa, como, por ejemplo, cuántos objetos hay, la posición, orientación y tamaño relativo de cada uno de ellos; distancias, características de forma, color, componentes, textura y otras más que pueden ser utilizadas para identificar y clasificar los objetos, mediante una base de datos recopilada previamente con información relevante de los tipos de objetos involucrados. El gran éxito de los sistemas de visión en aplicaciones industriales se debe a la utilización de “ambientes controlados”: la posición de la cámara es fija, o puede cambiarse sólo a un conjunto de posiciones preestablecidas; las variaciones de la iluminación son controladas para facilitar la adquisición de la imagen; se procura un alto contraste entre los colores de los objetos de interés y el fondo; los objetos son localizados en un área específica, y el sistema tiene información con las características de todas las clases de objetos por inspeccionar.
ROBOTS DEL FUTURO
La siguiente generación de Sistemas de Visión Artificial busca dotar del sentido de la vista a los robots del futuro, para que puedan desempeñar actividades similares a las que desarrollamos los humanos, como las mencionadas al principio de este artículo. La característica principal de estas aplicaciones es que el ambiente o entorno no está controlado. Por ejemplo, para una actividad tan cotidiana como manejar un automóvil, las condiciones de iluminación y la posición de las cámaras varían fuertemente. Puede haber embotellamientos, cruce de peatones, señalamientos de tráfico en diferentes posiciones, y en ocasiones parcialmente obstruidos; objetos desconocidos, desviaciones, etcétera. La investigación en esta disciplina incluye temas de Inteligencia Artificial, para poder analizar y tomar decisiones con la información obtenida en un entorno cambiante. Éste es uno de los campos más fascinantes de la Visión Artificial, pero se requieren muchos años más de investigación para lograr un sistema de visión con capacidad apenas remotamente parecida a la de un ser humano.