Deep Learning, en el punto de mira de la visión artificial
¿Qué es Machine Learning? ¿Cómo funciona el Deep Learning en visión artificial?
Cuando hablamos de Inteligencia Artificial, Machine Learning o Deep Learning creemos que son conceptos futuristas que están por venir, nada más lejos. Desde los años 50 se trabaja en modelos matemáticos asociados a estas tecnologías, pero es ahora, gracias al Big Data, la digitalización, el abaratamiento de los dispositivos de almacenamiento, las mejoras de hardware que permiten procesos en paralelo a mucha velocidad y a modelos matemáticos en redes neuronales (backpropagation,…) que se ha creado el cóctel perfecto que hace posible sacarlas del laboratorio, para convertirlas en una realidad que ya está aquí. El Big Data proporciona el poder de recopilar datos masivamente, relacionarlos entre ellos, gestionarlos, procesarlos y analizarlos con el fin de sacar conclusiones. Ahora es, cuando existen tecnologías capaces de procesar innumerables cantidades de datos para convertirlas en información, que faciliten la toma de decisiones de forma rápida.
Queremos máquinas sin necesidad de preprogramarles reglas para las infinitas variables que pueden aparecer en el mundo real, pretendemos que aprendan a través de la experiencia. El Machine Learning se ocupa de esto, de dotar a las máquinas de capacidad de aprendizaje. Dentro del Machine learning, y centrándonos en las redes neuronales aparece el concepto de Deep Learning. Las redes neuronales artificiales aprenden de forma jerarquizada, por niveles de capas. Cuantas más capas tengamos, más complejos resultan los algoritmos de procesamiento. Este incremento en el número de capas y su complejidad, es lo que hace que estos algoritmos sean conocidos como algoritmos de Deep learning. Para ver la diferencia entre un sistema de visión tradicional versus un sistema basado en Machine Learning y Deep Learning, pondremos como ejemplo la lectura de caracteres en visión artificial, lo que denominamos OCR. El software de visión tradicional requiere una serie de bibliotecas de patrones y plantillas que contienen todos los posibles caracteres para reconocer de una foto, una A como una letra. Pero los algoritmos se vuelven poco manejables cuando crecen las bibliotecas de excepciones y defectos.
El sistema de visión con Deep Learning es capaz de leer una A aunque la etiqueta esté doblada, medio borrada o con ruido y solo pueda verse un 30%. Aun así, será capaz de conceptualizar y generalizar la apariencia de los caracteres basado en sus características distintivas, incluso cuando éstas varían sutilmente o a veces se desvíen. Reconocerá correctamente la letra o el número, gracias a las capas de algoritmos integrados en su red neuronal que le permite sacar sus propias conclusiones.
Actualmente ya convivimos con la tecnología Deep Learning, por ejemplo en el reconocimiento de voz, facial y de texto de nuestros móviles y otros dispositivos, incluso tenemos vehículos que circulan solos sin necesidad de la mano humana.
El futuro está aquí y esta tecnología ya está migrando hacia procesos de fabricación avanzada y visión artificial. Disponer de un software de análisis de imagen basado en Deep Learning nos ofrece soluciones a retos de visión complejos, que anteriormente no podía realizarse con visión tradicional o que requerían una cantidad de recursos y dispositivos que no hacían viable la solución.
Ahora es posible distinguir defectos impredecibles al mismo tiempo que tolerar variaciones naturales en patrones complejos. Además, estos pueden adaptarse rápidamente a nuevos ejemplos sin necesidad de reprogramar sus algoritmos principales.
VisionPro ViDi es el primer software de análisis de imágenes industrial basado en Deep Learning y es ideal para:
-
- Detección de defectos complejos
- Clasificación de textura y materiales
- Verificación de montajes y localización de piezas deformadas
- Lectura de caracteres, incluida la impresión distorsionada
Por ejemplo, Cognex ViDi simplifica la inspección automática de complejos patrones de tejido, incluidos el cruzado, el tejido, el trenzado, el acabado e impreso. Como no requiere un tedioso desarrollo de software, el algoritmo de software se entrena con un conjunto de buenas muestras ya conocidas, para crear sus modelos de referencia. La inspección identifica e informa las áreas defectuosas en la tela, mientras que tolera variaciones grandes pero irrelevantes en su apariencia.
¿Cómo funciona Cognex ViDi?
Existen sistemas de visión basados en Deep Learning que trabajan con miles de imágenes de procesamiento, lo que implica la necesidad de un procesador muy potente. El Software de ViDi se entrena con un número inferior de imágenes, adaptándose a la potencia de procesador habitual de los PCs que se utilizan en el entorno industrial, ya que solo requiere una GPU.
En el periodo de entrenamiento supervisado cargamos un grupo de imágenes etiquetadas (buenas y malas) de una manera similar a como formaríamos a un inspector humano, enseñándole al sistema para reconocer defectos explícitos.
Para defectos que se presentan en múltiples formas, el sistema se entrena a sí mismo en modo no supervisado. Aprende la apariencia normal de un objeto, incluidas sus variaciones considerables pero que decidimos como buenas. El software crea su modelo de referencia basándose en estas imágenes representativas.
Se trata de un proceso iterativo de mejora constante, durante el cual los parámetros pueden ajustarse y el resultado se valida hasta que el modelo funcione como se desee. Durante el tiempo de ejecución, ViDi extrae datos de un nuevo conjunto de imágenes y sus redes neurológicas localizan las piezas, extraen anomalías y las clasifica.
Otro aspecto importante, es que podemos hacer que el sistema vaya aprendiendo a medida que vamos trabajando con él. De una forma muy sencilla, es posible añadir nuevas imágenes que modifican el modelo entrenado haciendo posible la adaptación a nuevos cambios o nuevas características que no existían previamente.
ViDi funciona con imágenes de alta resolución, incluidas térmicas y a color, para reconocer prácticamente cualquier anomalía. También realiza recuentos complejos y descifra caracteres deformados y difíciles de leer. Cognex ViDi permite a empresas de muchos sectores crear sistemas de inspección innovadores que sobrepasen los límites de la visión artificial. ViDi está disponible con el software de visión artificial VisionPro y Cognex Designer, lo que ofrece a sus clientes una capacidad única para mezclar y combinar herramientas en una aplicación.
Las herramientas para localización, caracterización, clasificación y lectura de caracteres, trabajan de forma independiente o se pueden combinar con otras herramientas de visión de Cognex para abordar retos complejos de visión .
4 HERRAMIENTAS, 4 SOLUCIONES
1. ViDi Blue-Locate | Localiza características
ViDi Blue-Locate encuentra características y objetos complejos aprendiendo a partir de imágenes con anotaciones. Los algoritmos de autoaprendizaje pueden localizar piezas, contar frascos médicos de vidrio translúcido en una bandeja y realizar controles de verificación de montaje en kits y paquetes.
2. ViDi Red-Analyze | Detecta anomalías y defectos estéticos
Segmenta los defectos u otras regiones de interés con tan solo aprender las variaciones en la apariencia de la zona de interés. ViDi Red-Analyze puede identificar rayones en superficies complejas, conjuntos incompletos o incorrectos, e incluso problemas de tejido en textiles simplemente mediante el aprendizaje de la apariencia normal de un objeto, incluidas sus variaciones significativas pero tolerables. Esta herramienta es capaz de detectar defectos que con visión convencional serían muy difíciles de detectar y complejos de programar.
3.ViDi Green-Classify | Clasifica objetos o escenas
ViDi Green-Classify separa diferentes clases de una colección de imágenes etiquetadas. Al prepararse para tolerancias aceptables, puede identificar productos en función de sus empaques, clasificar la calidad de la costura de soldadura y separar las anomalías aceptables o inaceptables.
4.ViDi Blue-Read | Lee texto y caracteres
ViDi Blue-Read descifra códigos deformados, torcidos y/o mal grabados mediante el uso de reconocimiento óptico de caracteres. El sistema utiliza redes neuronales para la identificación de los caracteres, permitiendo un incremento sustancial en el porcentaje de acierto respecto al OCR convencional. La biblioteca de fuentes entrenada previamente, puede identificar la mayoría de los textos sin programación o identificar fuentes adicionales para una implementación rápida y fácil. Esta sólida herramienta puede entrenarse para adaptarse a los requisitos específicos de aplicación «OCR». No se requiere experiencia en visión.
¿Cuándo usar visión artificial tradicional o Deep Learning?
La elección entre la visión artificial tradicional y el Deep Learning depende del tipo de aplicación, de la cantidad de datos que se estén procesando y de las capacidades de procesamiento. De hecho, el Deep Learning no es la solución adecuada para todas las aplicaciones. Las tecnologías de programación tradicionales basadas en reglas son mejores para calibrar y medir, así como para realizar una alineación precisa. En algunos casos, puede que la visión tradicional sea la mejor opción para medir con precisión una región de interés, y el Deep Learning para inspeccionar esa región. El resultado de una inspección basada en el Deep Learning puede pasarse a la visión tradicional para tomar medidas precisas del tamaño y la forma del defecto.
En la siguiente imagen se identifica las aplicaciones más adecuadas para la visión artificial tradicional y para los enfoques basados en el Deep Learning, incluidas las apropiadas para ambas.
Consulta más información interesante sobre componentes de visión artificial, ópticas para visión artificial
o sistemas de iluminación en visión artificial
¿Tiene alguna aplicación compleja que no puede solucionar con visión artificial tradicional y cree que en el Deep Learning podría estar la clave para resolverlo?
En Bcnvision estamos preparados para combatir los retos más complejos de visión artificial. Le asesoramos y acompañamos en todo el proceso hasta encontrar el sistema de visión que más se adapte a sus necesidades y requerimientos. Ponemos a su disposición el avance tecnológico que ofrece el Deep Learning de mano de Cognex ViDi.
¿Quiere realizar una prueba?
Consúltenos en https://bit.ly/2tafW82 www.bcnvision.es