본문으로 이동


적용사례

 자료 다운받기

진짜가 나타났다.
세상 모든 문자 판독, NAVI AI OCR이 시작합니다.

"사람은 읽을 수 있는데...
비싼 돈을 지불한 상용 문자판독(OCR) 프로그램은 그렇지 못해 많이 답답하셨죠?"

기존 문자판독 알고리즘으로는 아무리 개선을 하더라도 한계가 있습니다.

혹시 기존 문자판독 알고리즘의 원리를 알고 계신가요?

기존 문자판독은 위와 같은 과정을 거칩니다.

이미지 획득 후 문자 판독을 위해서 문자를 학습시키는 과정이 필요한데
대부분의 경우 패턴 매칭을 이용하여 문자를 학습 시킵니다.

?문자 학습을 위해서는 기존 이미지에서 Segmentation이라는 과정을 통해
배경과 문자를 분리하는 선행단계가 필요합니다.

물론 문자 판독 시에도 Segmentation 과정을 통해서 문자와 배경을 분리하는
이미지 전처리 과정을 거쳐야 판독이 가능합니다.

기존 방식에서는 Segmentation 과정에서 좋은 결과 이미지를 얻기 위해
조명 조건을 조정한다든지 알고리즘의 개선을 통해서 문자 판독의 판독률을 높였습니다.

하지만 기존 방식으로 판독이 불가능한 경우가 몇 가지 있습니다.
바로 복잡한 배경이나 양각/음각 문자, Dot 문자 등입니다.
양각/음각 문자 및 Dot 문자의 경우 조명 조건 혹은 판독 대상의 상태에 따라
간혹 문자 판독이 가능한 경우도 있긴 합니다.

- 기존 OCR의 한계 1. 타이어 옆면 양각/음각 문자

위 타이어 이미지 속의 양각/음각 문자를 판독하기 위해 segmentation 과정을 거쳐 보겠습니다.

첫 번째 과정에서는 주변의 잡음이 심해 배경과 문자가 제대로 분리되지 못했습니다.

값을 조정한 두 번째 이미지에서는 문자와 배경이 분리는 되었지만
몇몇 문자들이 완성된 형태를 이루지 못해 완벽한 문자 판독 결과를 가져오기 어렵습니다.

- 기존 OCR의 한계 2. 배경에 음영이 있는 곡면 금속 위 음각 문자

위 이미지처럼 배경에 그라데이션효과 처럼 음영이 존재하는 경우는
어떻게 문자와 배경을 분리할 수 있을까요?

밝은 면에 있는 문자를 분리 되었지만
어두운 면에 있는 문자들은 배경과 같이 없어진 것을 확인할 수 있습니다.

어두운 면에 있는 이미지를 확인하기 위해 값을 조정하면
문자는 확인할 수 있지만 잡음이 많이 생깁니다.
문자 형태의 불확실성 및 배경의 잡음으로 인해 문자 학습이 어렵습니다.

- 기존 OCR의 한계 3. 거친 배경 위의 Dot 문자

위 이미지 속의 Dot 문자는 여러 스크래치가 있는 거친 표면 위에 존재합니다.

문자를 확인하기 위해 값을 높여주면 배경은 깔끔해 지지만
문자를 명확하게 판독하긴 힘들어 보입니다.

Dot 문자의 경우 각각의 점들을 키우고 서로 연결해 주어
하나의 문자 형태를 만드는 과정이 추가적으로 필요한데
위 이미지에서는 몇몇 점들이 사라져 올바른 문자 형태가 될 수 없는 부분들이 확인 됩니다.

문자 부분을 확인하기 위해 값을 조절하면
다시 배경 부분에서 잡음이 생겨 문자 판독에 어려움이 생갑니다.

위와 같은 잡음은 앞 전에 설명 드린 점들의 크기를 키우는 과정에서
점과 함께확장되어 문자와 문자 사이를 연결하여 버립니다.

위 사례들에서도 쉽게 볼 수 있듯이
기존 OCR 알고리즘은 까다로운 조명 조건을 맞추더라도
Segmentation 과정에서 문자와 배경을 완벽하게 분리시키지 못하면
완벽한 판독이 어렵다는 것을 알 수 있습니다.

NAVI AI OCR, 어떻게 모든 문자를 다 판독할 수 있나요?

위 자료에서 알 수 있듯이 NAVI AI OCR에서는 Segmentation 과정이 필요 없습니다.
어떻게 Segmentation 과정 없이 문자 학습이 가능할까요?

NAVI AI OCR은 사람이 학습하는 방식을 모방한 딥러닝을 통해 문자 학습을 합니다.
패턴매칭 기반의 이전 방식에서는 사람이 Segmentation 후 학습을 직접 시켜 주었지만,
딥러닝 기반의 방식은 일정 영역에 존재하는 문자가 무엇인지 알려주기만 하면
이미지 전체(문자 및 배경 포함)를 학습하여 문자의 Feature를 직접 뽑아냅니다.

사람과 NAVI AI OCR은 위 7개의 다양한 배경 위에 존재하는 문자를
같은 방법으로 인지하고 0인 것을 알아 차립니다.

기존 OCR의 경우 배경과 문자를 분리시켜 주는 과정에서
문자 형태의 불확실성 혹은 배경의 잡음으로 인해 학습 조차도 어려울 수 있지만,
사람이 문자를 학습하는 방식과 똑같은 방법으로 문자를 학습하는 NAVI AI OCR은
이미지 전체를 학습 숫자 0에 대한 공통적인 Feature를 뽑아내 ?
어떤 배경에서도 문자를 정상으로 판독하며
형태가 조금 뒤틀려도 정상적으로 판독하는 강인한 성능을 보여줍니다.

이런 학습 방식의 차이 때문에 기존에 난제로 여겨졌던
복잡한 배경 위의 문자라든지 양각/음각 문자, Dot 문자들도 쉽게 판독이 가능 합니다.

"고객사의 시료 보호를 위해 문자 판독 동영상은
2017년 Automation World에서 시연하였던
NAVI AI OCR 데모 동영상으로 대체하겠습니다."

위 이미지들은 동영상 속에서 NAVI AI OCR로 판독했던 것들을 추려놓은 것입니다.
복잡한 배경이 위의 양각문자로 새겨진 신용카드부터 Dot 문자, 금속 위의 양각문자까지
지금껏 난제로만 여겨졌던 부분들을 빠른 속도로 판독하는 것을 확인할 수 있습니다.

<NAVI AI OCR 데모 영상>

아래 동영상은 너무 빠른 판독 속도로 인해서
제대로 판독이 되고 있는지 확인하고 싶으신 고객님들을 위해
5배 정도 느린 속도로 재생한 영상입니다.

NAVI AI를 이용한 비전 검토 과정은 매우 간단합니다.
시료 이미지만 전달해 주시면 검토 결과 확인이 가능합니다.

복잡한 배경 위에 문자를 판독해야 하나요?
음각/양각 문자 판독이 필요하신가요?
Dot 문자 판독이 되지 않아 애를 먹었습니까?
고민하지 마시고 이제 라온피플에게 문의해 주시기 바랍니다.

NAVI AI가 만들어 내는 물품 분류의 새로운 패러다임.
지금 전화주세요!


List

라온피플(주)
주소 : (우)13511 경기도 성남시 분당구 판교로 723, 분당테크노파크 B동 402-3
대표전화 : 1899-3058 , 팩스 : 031-707-7052, 전자우편 : sales@laonpeople.com, 웹사이트 : http://www.laonpeople.com Copyright © Laon People. All Rights Reserved.