차량 정보의 수동 데이터 입력은 자동차 및 물류 산업이 매일 경험하기 때문에 시간이 많이 걸리고 오류가 발생하기 쉽습니다. Etecture 팀은 MOSOLF와 함께 토토사이트에 포함 된 데이터를 자동화하고 프로세스를 단순화하고 속도를 높이는 도구를 개발했습니다.
클라이언트 정보
MOSOLF 그룹은 유럽의 토토사이트차 산업의 주요 시스템 서비스 제공 업체 중 하나입니다. MOSOLF 그룹의 서비스는 토토사이트차 물류를위한 완전한 부가가치 체인을 포함합니다. 컨베이어 벨트 끝에서 재활용에 이르기까지.
도전
자동차 및 물류 산업의 수동 데이터 수집은 일상적인 작업이며, 토토사이트 문서에서 많은 정보를 얻을 수 있습니다. 그러나 실제로이 정보는 독일 ID 카드와 같은 다른 공식 문서와 같이 기계로 읽을 수있는 영역이 포함되어 있지 않기 때문에 수동으로 입력됩니다.우리의 도전은 광학 문자 인식 (토토사이트) 기술을 통해 프로세스를 가속화하고 오류의 위험을 줄이는 것이 었습니다.
게다가, 도전은 2005 년 10 월 이후 독일 토토사이트 형식 (외관 및 구성)이 변하지 않았으며 다른 연방 영토에서 문서의 외관이 종종 글꼴 유형과 크기가 다양하다는 것이었다. 또한, 공식 문서의 반사 방지 기능은 또한 홍채 흐름과 양쪽에 통합 된 마이크로 스크립트를 갖춘 "Multicolor Guilloche Security Underprint (2 단계로 처리)와 같은 특정 과제를 제기합니다..
또한 Dark Green 그리드 라인은 휴먼 리더가 개별 필드를 연관시키는 데 도움이되는 반면, 기계 텍스트 인식을 더욱 어렵게 만듭니다. 특히, 소위 인쇄 오프셋 또는 라인 너머로 튀어 나오는 텍스트는 토토사이트 인식에 상당한 어려움을 초래합니다.
독일 토토사이트 문서의 예
솔루션
ETECTION 팀은 텍스트 인식을위한 템플릿 매칭 알고리즘을 기반으로 한 토토사이트 인증서를위한 맞춤형 OCR 시스템을 개발했습니다. 이를 달성하기 위해 토토사이트 인증서에 나타날 수있는 각 문자의 프로토 타입을 만들었습니다.
그러나 실제로 토토사이트 인증서 모양의 변형으로 인해 템플릿 일치 알고리즘으로 텍스트 인식 한도에 도달했습니다. 결과적으로, 우리는 다른 글꼴 스타일에 대한 도전이 아닌 신경망을 사용해야했습니다.
먼저 토토사이트 증명서가 이미지에서 인식되고 위치합니다. 그런 다음 개별 텍스트 필드를 잘라내어 관련 텍스트와 함께 작은 이미지 섹션을 만들 수 있습니다.
또한 각 필드에 허용 된 문자를 선택하기위한 규칙을 정의했습니다. 예를 들어, 날짜는 숫자와 점 만 포함 할 수 있지만 글자는 없습니다.
다른 필드의 경우 필드에 입력 할 수있는 가능한 값 목록이 있습니다. 예를 들어, 토토사이트 클래스 및 건축 유형은 자동차와 트레일러를 분류하기 위해 디렉토리에 지정됩니다.
Etecture 팀이 개발 한 MOSOLF를위한 토토사이트 솔루션
인식 된 텍스트는 해당 필드 컷 옆에 명확하게 표시되므로 입력 이미지와 쉽게 비교하고 오류를 수정할 수 있습니다. 섀시 번호에 대한 확인 숫자 유효성 검사는 색상으로 강조 표시됩니다.
사용자는 기계 텍스트 인식의 결과를 확인할 수있을뿐만 아니라 필요한 경우 필요한 수정을 할 수도 있습니다. 마지막으로 사용자는 데이터를 CSV 또는 JSON 형식으로 다운로드 할 수 있습니다.
기술
개발 팀은 Python (Tensorflow 및 OpenCV 사용)에서 텍스트 인식 알고리즘을 구현했습니다. 그들은 필요한 인터페이스를 제공하는 플라스크 웹 서버로 포장했습니다.
다음은 무엇입니까?
이 접근법은 토토사이트 증명서에 적합 할뿐만 아니라 구조가 고정 된 반복 패턴을 따르는 한 다른 문서와 함께 사용할 수 있습니다. 가능한 응용 프로그램은 신원 문서, 배송 메모, 선하 증권, 송장 등이 될 수 있습니다.
제시된 알고리즘은 인위적으로 생성 된 데이터를 사용하여 사전 지식과 훈련을 통합하여 강점을 보여줍니다. 이를 통해 TesserAct 또는 Google Mobile Vision과 같은 일반적인 도구와 비교하여 실험과 테스트 실험에서 훨씬 더 나은 결과를 얻을 수있었습니다.
소개