카메라로 영수증을 인식할 경우 자동으로 영수증 내용이 입력되는 어플리케이션이 있습니다. 이처럼 OCR (Optical Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술로, 컴퓨터 비전 분야에서 현재 널리 쓰이는 대표적인 기술 중 하나입니다.
OCR은 글자 검출 (text detection), 글자 인식 (text recognition), 정렬기 (Serializer) 등의 모듈로 이루어져 있습니다. 본 대회는 아래와 같은 특징과 제약 사항이 있습니다.
- 본 대회에서는 다국어 (중국어, 일본어, 태국어, 베트남어)로 작성된 영수증 이미지에 대한 OCR task를 수행합니다.
- 본 대회에서는 글자 검출만을 수행합니다. 즉, 이미지에서 어떤 위치에 글자가 있는지를 예측하는 모델을 제작합니다.
- 본 대회는 제출된 예측 (prediction) 파일로 평가합니다.
- 대회 기간과 task 난이도를 고려하여 코드 작성에 제약사항이 있습니다. 상세 내용은 Data > Baseline Code (베이스라인 코드)에 기술되어 있습니다.
- 모델의 입출력 형식은 다음과 같습니다.
- 입력 : 8글자가 포함된 JPG 이미지 (학습 총 400장, 테스트 총 120장)
- 출력 : bbox 좌표가 포함된 UFO Format (상세 제출 형식은 Overview > Metric 탭 및 강의 6강 참조)
- 전체 이미지
- 520 images
- train
- 언어당 100장 총 400images
- test
- 언어당 30장 총 120images
- Public 60장, Private 60장
- 이미지 크기
- 다양한 사이즈와 비율로 구성
김건수 | 박진영 | 방민혁 | 오홍석 | 이소영 | 이예진 |
T7103 | T7156 | T7158 | T7208 | T7222 | T7225 |
Public Leader Board
Private Leader Board
Feature
: 새로운 기능 추가Fix
: 버그 수정Docs
: 문서 수정Style
: 코드 포맷팅 → Code ConventionRefactor
: 코드 리팩토링Test
: 테스트 코드Comment
: 주석 추가 및 수정
커밋할 때 헤더에 위 내용을 작성하고 전반적인 내용을 간단하게 작성합니다.
git commit -m "[#issue] Feature : message content"
커밋할 때 상세 내용을 작성해야 한다면 아래와 같이 진행합니다.
git commit
어떠한 에디터로 진입하게 된 후 아래와 같이 작성합니다.
[header]: 전반적인 내용
. (한 줄 비워야 함)
상세 내용
브랜치를 새롭게 만들 때, 브랜치 이름은 항상 위 Commit Convention
의 Header와 함께 작성되어야 합니다.
Feature/~~~
Refactor/~~~