Периодически, чтобы протестировать новые модели, методы или просто не потерять навыки, зависаю на Kaggle и Zindi. Отличные платформы, где можно брать датасеты из соревнований и сразу тестировать свои идеи.
Если ты давно в ML, у тебя уже наверняка есть свой AutoML – готовый пайплайн с подбором гиперпараметров, валидацией и прочими стандартными шагами. Ну или как минимум для табличных данных можно использовать уже готовые AutoML-решения.
Но вот что делать, когда модели уперлись в потолок по метрикам? Здесь очень сильно помогает Feature Engineering. Если ты хорошо понимаешь область, можешь генерировать новые фичи на основе своих знаний. А можно пойти еще дальше и использовать разные техники для автоматического создания фичей – это работает примерно так же, как аугментация в CV/NLP.
Раньше нормальных ресурсов по Feature Engineering было сложно найти, но недавно наткнулся на отличный гид по этой теме:
📌 https://feaz-book.com
Там собрали, кажется, вообще всё, что нужно. Советую заглянуть, если хочешь прокачать свои модели! 🚀
Если ты давно в ML, у тебя уже наверняка есть свой AutoML – готовый пайплайн с подбором гиперпараметров, валидацией и прочими стандартными шагами. Ну или как минимум для табличных данных можно использовать уже готовые AutoML-решения.
Но вот что делать, когда модели уперлись в потолок по метрикам? Здесь очень сильно помогает Feature Engineering. Если ты хорошо понимаешь область, можешь генерировать новые фичи на основе своих знаний. А можно пойти еще дальше и использовать разные техники для автоматического создания фичей – это работает примерно так же, как аугментация в CV/NLP.
Раньше нормальных ресурсов по Feature Engineering было сложно найти, но недавно наткнулся на отличный гид по этой теме:
📌 https://feaz-book.com
Там собрали, кажется, вообще всё, что нужно. Советую заглянуть, если хочешь прокачать свои модели! 🚀