Skip to content

Latest commit

 

History

History
120 lines (86 loc) · 5.12 KB

README.md

File metadata and controls

120 lines (86 loc) · 5.12 KB

📋 Project Overview

project_image

카메라로 영수증을 인식할 경우 자동으로 영수증 내용이 입력되는 어플리케이션이 있습니다. 이처럼 OCR (Optical Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술로, 컴퓨터 비전 분야에서 현재 널리 쓰이는 대표적인 기술 중 하나입니다.

OCR은 글자 검출 (text detection), 글자 인식 (text recognition), 정렬기 (Serializer) 등의 모듈로 이루어져 있습니다. 본 대회는 아래와 같은 특징과 제약 사항이 있습니다.

  • 본 대회에서는 다국어 (중국어, 일본어, 태국어, 베트남어)로 작성된 영수증 이미지에 대한 OCR task를 수행합니다.
  • 본 대회에서는 글자 검출만을 수행합니다. 즉, 이미지에서 어떤 위치에 글자가 있는지를 예측하는 모델을 제작합니다.
  • 본 대회는 제출된 예측 (prediction) 파일로 평가합니다.
  • 대회 기간과 task 난이도를 고려하여 코드 작성에 제약사항이 있습니다. 상세 내용은 Data > Baseline Code (베이스라인 코드)에 기술되어 있습니다.
  • 모델의 입출력 형식은 다음과 같습니다.
    • 입력 : 8글자가 포함된 JPG 이미지 (학습 총 400장, 테스트 총 120장)
    • 출력 : bbox 좌표가 포함된 UFO Format (상세 제출 형식은 Overview > Metric 탭 및 강의 6강 참조)

🗃️ Dataset

  • 전체 이미지
    • 520 images
    • train
      • 언어당 100장 총 400images
    • test
      • 언어당 30장 총 120images
      • Public 60장, Private 60장
  • 이미지 크기
    • 다양한 사이즈와 비율로 구성

😄 Team Member

김건수 박진영 방민혁 오홍석 이소영 이예진
T7103 T7156 T7158 T7208 T7222 T7225

🏆 Project Result

Public Leader Board

Public Leader Board


Private Leader Board

Private Leader Board


🔗 Reference


Commit Convention

  1. Feature : 새로운 기능 추가
  2. Fix : 버그 수정
  3. Docs : 문서 수정
  4. Style : 코드 포맷팅 → Code Convention
  5. Refactor : 코드 리팩토링
  6. Test : 테스트 코드
  7. Comment : 주석 추가 및 수정

커밋할 때 헤더에 위 내용을 작성하고 전반적인 내용을 간단하게 작성합니다.

예시

  • git commit -m "[#issue] Feature : message content"

커밋할 때 상세 내용을 작성해야 한다면 아래와 같이 진행합니다.

예시

git commit
어떠한 에디터로 진입하게 된 후 아래와 같이 작성합니다.
[header]: 전반적인 내용
. (한 줄 비워야 함)
상세 내용


Branch Naming Convention

브랜치를 새롭게 만들 때, 브랜치 이름은 항상 위 Commit Convention의 Header와 함께 작성되어야 합니다.

예시

  • Feature/~~~
  • Refactor/~~~