Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Hw 3 #7

Open
wants to merge 3 commits into
base: main
Choose a base branch
from
Open

Hw 3 #7

wants to merge 3 commits into from

Conversation

kwillon
Copy link
Owner

@kwillon kwillon commented Dec 26, 2023

Построенная сложна модель - рандомный лес, были найдены гиперпараметры с помощью GridSearch и Optune, было сравнение предсказания до и после использования гиперпараметров. Были использованы визуализации из optuna и shap. Были интерпретированы результаты проделанной работы.

@kwillon kwillon requested a review from pacifikus December 26, 2023 22:56
Copy link
Collaborator

@pacifikus pacifikus left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Добрый день!

Спасибо за работу! Оставлю несколкьо комментариев:

  • В гит стоит пушить ноутбуки без ошибок:
    image
  • В части задания с подбором гиперпараметров предполагалось, что будет выбрана более сложная модель - ансамбль типа случайного леса или бустинга
  • Не совсем понятно. какое отношение модель, обученная на искусственном датасете имеет к текущей работе:
    image
    И дальше подбор гиперпараметров происходит для какое-то посторонней выборки. Видимо эта часть просто скопирована из ноутбука с занятия. И параметры модели, обученной на другой выборке почти наверное не являются оптимальными для вашей задачи
  • Так как у нас всего две подходящие модели, а именно RandomForest и CategoricalDistribution. - CategoricalDistribution - это не модель, а класс optuna для реализации выбора значения из списка во время подбора гиперпараметров...
  • Как можно заметить значения RMSE до и после GridSearch почти одинаковые - у вас задача бинарной классификации, и до этого вы смотрели на accuracy/precision/recall, как вдруг снова возникла метрика регрессии - непонятно. RMSE в принципе не дает корректных интерпретируемых результатов подсчета в задачах классификации.
  • как мы помним максимальная глубина нашего леса может быть только 8... - немного не уловила, почему она может быть только 8?
  • Ну и в целом, если бы подбор гиперпараметров был произведен на нужной выборке, optuna бы дала вам лучший набор гиперпараметров, нет нужды после нее снова подбирать что-то полным перебором

Резюмируя, хочется рекомендовать чуть более внимательно проверить, на каких данных, в каком порядке и зачем у вас происходят те или иные операции

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants