Lectura OCR basada en Deep Learning
¿Tienes problemas para leer códigos con OCR de manera fiable utilizando métodos tradicionales de visión artificial??
¿La superficie por la que debes de leer es complicada, paquetes blandos, metales grabados, botellas transparentes que tienen muchos brillos o incluso la etiqueta está rota o mal colocada?
A continuación, te explicamos todo lo que debes saber sobre la lectura OCR, qué es, los tipos de marcajes y materiales y la nueva tecnología de lectura OCR basada en Deep Learning o aprendizaje profundo dará solución a todas estas problemáticas.
OCR, Optical Character Recognition o ROC, Reconocimiento óptico de caracteres, se basa en un software capaz de reconocer caracteres alfanuméricos a través de una imagen extraída. Este tipo de aplicaciones se utiliza en muchos sectores, como en cosmética, alimentación y bebidas, farmacéutica y automoción, entre otros.
Existen diferentes tipos de impresión de los códigos.
- Thermal Inkjet (TIJ): Es fácil de usar y mantener, imprime de forma clara y es ideal para aplicaciones basadas en papel.
- Thermal Transfer Overprinter (TTO): Ideal para imprimir en plástico antes de llenar y para agregar impresión en color en fundas de plástico.
- Continuous Inkject: Están especializados en tintas para una larga duración, se integran muy bien en líneas de maquinaria y es buena para la mayoría de los envases de papel y plástico flexibles.
- Laser marking systems: La reacción química en algunos tipos de film crea una impresión nítida. Ideal para papel y algunos plásticos.
También existen diferentes materiales donde imprimir:
Los algoritmos de visión artificial actuales pueden distinguir piezas incluso por las diferencias más sutiles. Aun así, existen limitaciones. El reconocimiento óptico de caracteres (OCR) funciona bien con visión artificial tradicional basada en reglas, siempre que tenga una serie de condiciones como que la fuente sea legible, que el fondo tenga contraste, que no haya exceso de brillos, etc.
La lectura OCR basada en Deep learning es una tecnología innovadora que puede leer códigos alfanuméricos deformados, torcidos, sesgados o mal grabados, incluso en las condiciones más difíciles, como podría ser una etiqueta rota, mal colocada o con arrugas.
La herramienta de lectura OCR basada en Deep Learning o aprendizaje profundo aprovecha una biblioteca de fuentes preentrenadas para las inspecciones, solo es necesario definir la región de interés, establecer el tamaño de los caracteres y etiquetar los caracteres en el conjunto de imágenes.
La lectura OCR basada en Deep Learning es capaz de leer códigos que las herramientas tradicionales de OCR no pueden decodificar.
Su fácil interface elimina la necesidad de programaciones complejas, en tan solo unos pasos y sin experiencia en visión, se puede configurar esta potente herramienta para que lea caracteres específicos. Además, la función de depuración visual identifica los fallos de lectura, que pueden corregirse con facilidad.
¿Qué tipo de aplicaciones de lectura OCR hay? y ¿Cuándo usar la lectura OCR Deep Learning?
¿Cómo funciona la herramienta OCR Deep Learning?
Esta herramienta de lectura OCR basada en Deep Learning se basa en el ejemplo, es decir aprende a base de ejemplos.
1º debemos de recopilar las imágenes de los caracteres.
2º etiquetar las características de las imágenes.
3º entrenar el modelo con la herramienta de lectura.
4º validar el rendimiento y las imágenes no entrenadas.
La herramienta de lectura OCR entrena los caracteres etiquetados y los aprende para poder identificar, aunque exista un alto grado de variabilidad en el texto.
Ahora veremos con más ejemplos algunos de las lecturas OCR más complicadas en botellas:
Cuando las botellas van rotando sobre la cinta, es posible que causen variaciones en la impresión, los códigos acaban sesgados, torcidos o con brillos.
Las marcas del agua, las burbujas o defectos en la botella generan ruidos en el fondo, dificultando la lectura.
Y en ocasiones la impresión del código puede ser poco precisa, tienen rebabas, manchas o los caracteres estás muy juntos.
Ejemplos en botellas de plástico.
Ejemplos en etiquetas de botella.
Ejemplos de metal grabado.
Por ejemplo, en la industria del automóvil la identificación de vehículos es muy importante para llevar una exitosa trazabilidad, con lo que la descodificación de estos códigos con número y letras marcados directamente en el metal o etiquetas es muy importante. En ocasiones es difícil localizar y reconocer los caracteres por la luz especular, los colores de la pintura, el brillo que el propio sistema de visión genera, etc., representan un gran desafío para la lectura OCR, pero con la lectura OCR basada en Deep Learning ahora ya es posible.
Lo mismo ocurre con los códigos pequeños, deformados y mal grabados en chips o componentes electrónicos.
En otro sector como es el de alimentación y bebidas, las latas de conserva causan una gran variación de iluminación y reflejos por la textura brillante del aluminio. Además, la forma curva de muchas de ellas y la falta de precisión en la impresión del código, hace que haya rebabas, manchas y que algunos caracteres estén muy cerca de otros, creando unas condiciones de alta dificultad para su lectura.
Los envases blandos también son un gran reto para la lectura OCR. La superficie es totalmente irregular y genera brillos con lo que nos encontramos con una gran variabilidad de inconvenientes a la hora de leer códigos alfanuméricos. Hay reflejos, brillos, y debido a la irregularidad en la superficie se generan en el marcaje movimientos, caracteres muy pegados o sesgados y la iluminación siempre es muy irregular por los propios reflejos que genera la superficie.
Con la lectura OCR basada en Deep Learning podrás leer cualquier carácter alfanumérico, aun cuando los códigos estén muy deformados, torcidos, sesgados o mal grabados, debido a la impresión o marcaje del propio código o a las condiciones de difícil lectura que pueda generar una superficie complicada.
No dejes para mañana lo que YA puedes leer hoy.
¿Quieres saber más sobre Deep Learning? Haz click aquí.