Reconocimiento de imágenes: software y ejemplos

19 Febrero 2019

Equipo de Expertos en Ciencia y Tecnología

Enseñar a un ordenador cómo "ver" no es una tarea fácil. Para que un equipo informático pueda realmente ver el mundo como lo hacen las personas o los animales, necesita la ayuda de un software de reconocimiento de imágenes.

Cómo funciona el software de reconocimiento de imágenes

La visión por ordenador es lo que potencia la capacidad de un escáner de código de barras para "ver" un montón de franjas en una UPC. También es la forma en que la aplicación de identidad de Apple puede saber si la cara que está mirando la cámara del dispositivo es la de su propietario o no. Básicamente, cada vez que una máquina procesa información visual sin procesar, como un archivo JPEG o una fuente de alimentación de la cámara, utiliza la visión artificial para comprender lo que está viendo.

Un programa de reconocimiento de imágenes actúa como la parte del cerebro humano que procesa la información que reciben los ojos, no como los ojos en sí.

Uno de los usos más interesantes de la visión de computadora, desde el punto de vista de la inteligencia artificial, es el reconocimiento de imágenes, que le da al equipo informático la capacidad de interpretar lo que la visión del ordenador registra, pudiendo clasificarlo. Es la esencia del reconocimiento de imágenes.

Ejemplos de reconocimiento de imágenes

Existen muchos sectores que se benefician de esta visión por ordenador. Algunos ejemplos de reconocimiento de imágenes son:

La aplicación de Ebay que permite buscar artículos usando la cámara.
Una red neuronal que convierte fotos en tonos negros en imágenes brillantes.
La inteligencia artificial de Facebook, que interpreta las fotografías que suben los usuarios para adecuar la publicidad dirigida a cada cuenta.

Las posibilidades de esta tecnología son muy amplias. De hecho, el proceso de entrenamiento de una red neuronal para realizar el reconocimiento de imágenes es bastante complejo, tanto en el cerebro humano como en las computadoras. La inteligencia artificial, en este punto, se podría comparar a un niño pequeño.

Por eso, aunque la visión por ordenador permite, por ejemplo, a un robot, adquirir el sentido de la vista, no le garantiza la comprensión del universo físico de lo que rodea al objeto que se visualiza. Para eso, la inteligencia artificial necesita una capacitación, o entrenamiento, al igual que los niños. Si le muestra a un niño un número o una letra las veces suficientes, aprenderá a reconocer ese número o esa letra.

Sorprendentemente, muchos niños pequeños pueden reconocer inmediatamente las letras y los números al revés una vez que los han aprendido al revés. Nuestras redes neuronales biológicas son muy buenas para interpretar la información visual, incluso si la imagen que estamos procesando no se ve exactamente como esperamos. Una cualidad cuya aplicación a la tecnología se está trabajando, aunque resulta extremadamente compleja.

La precisión en el reconocimiento de imágenes

Es bastante sencillo conseguir que un ordenador reconozca una imagen específica, como un código de barras, por ejemplo, pero cuesta mucho más lograr que ese mismo dispositivo pueda reconocer cosas en estados que no esperan.

La forma en que funciona el reconocimiento de imágenes, por lo general, implica la creación de una red neuronal que procesa los píxeles individuales de una imagen. Los investigadores alimentan estas redes con tantas imágenes como pueden, para "enseñarles" cómo reconocer imágenes similares.

Cualquier sistema de inteligencia artificial que procesa información visual generalmente se basa en la visión por ordenador, y aquellos capaces de identificar objetos específicos o categorizar imágenes según su contenido están realizando el reconocimiento de imágenes.

Este avance resulta increíblemente importante para los robots que necesitan reconocer y categorizar con rapidez y precisión diferentes objetos en su entorno. Un buen ejemplo de lo que es posible con esta tecnología son los vehículos sin conductor, que utilizan la visión por ordenador y el reconocimiento de imágenes para identificar a los peatones, señales de tráfico y otros vehículos.