OCRを使用して画像から文書のレイアウトを認識し、編集可能な形式に変換するWebアプリケーション。
- 画像アップロード
- OCRによるテキスト認識
- レイアウト解析と表示
- テキストとレイアウトの編集
- 結果の保存と管理
- Python 3.8以上
- Tesseract OCR
- Flask
- その他の依存パッケージ(requirements.txtを参照)
- リポジトリのクローン:
git clone https://github.com/mrexcellency/scan2text.git
cd scan2text
- 仮想環境の作成と有効化:
python -m venv venv
source venv/bin/activate # Linux/Mac
venv\Scripts\activate # Windows
- 依存パッケージのインストール:
pip install -r requirements.txt
- Tesseract OCRのインストール:
- Windows: https://github.com/UB-Mannheim/tesseract/wiki
- Linux:
sudo apt-get install tesseract-ocr
- Mac:
brew install tesseract
- データベースの初期化:
python init_db.py
- アプリケーションの起動:
python app.py
- ブラウザで以下のURLにアクセス:
http://localhost:8000
- テスト実行:
python -m unittest -v test_app.py
- デバッグモードでの実行:
export FLASK_ENV=development # Linux/Mac
set FLASK_ENV=development # Windows
python app.py
MIT License - 詳細はLICENSEファイルを参照してください。