Данных репозиторий содержит алгоритм по выделению скидок из телефонных разговоров, разработанный командой Cyberian Tigers в рамках участия в хакатоне "Лидеры цифровой трансформации". В основе разработанного алгоритма лежит модель RuBERT (Russian Bert), дообученная на предоставленных организаторами данных (3399 транскрибированных разговоров). Ввиду ограничений платформы GitHub, было принято решение разместить веса модели в облачном хранилище Google Drive. Для запуска и корректной работы алгоритма необходимо выполнить следующие шаги:
- Клонировать данный репозиторий, введя git clone https://github.com/Ilia-Trof88/LCT_Discount_Extraciton/tree/main
- Дополнительно загрузить на устройство веса модели по ссылке : https://drive.google.com/drive/folders/1arB53Mnl_ygRaFoDPlc4rApKVhP2xwgE Необходимо загрузить директорию под названием 'LCT_Model_Directory' в котроой находятся веса модели.
- Загрузить необходимые зависимости, находящиеся в файле requirements.txt;
- Затем в файле main.py изменить переменную 'model_name' на абсолютный путь до загруженной директории (LCT_Model_Directory)
- Запустить файл main.py в любой среде выполнения (желательно, Pycharm)
- Перейти по локальному адресу, например: (будет выведен в терминале)
- В появившемся окне по ввести текст, из которого требуется извлечь процент предложенной скидки P.S. Возможен конфликт при установке библиотеки Pytorch. Если будет ругаться на отсутсвие модуля Numpy, важно вручную (через pip) установить torch версии 2.2.2.