Репост из: AGI
Пару слов как найти нишу для ML стартапа.
Понятно что самая большая проблема это собрать размеченные данные, потому что алгоритмы все бесплатные. Любой последний алгоритм от deepmind или openAI лежит уже на гитхабе.
А вот сбор и разметка данных это обычно очень дорого.
Поэтому если ищите новую нишу, то советую найти такую проблему где можно собрать self-supervised датасет. То есть такой датасет который не нужно самому вручную размечать.
Простой пример это "видеть сквозь стены":
Through-Wall Human Pose Estimation Using Radio Signals
http://openaccess.thecvf.com/content_cvpr_2018/CameraReady/2406.pdf
Вы можете обучить нейронку видеть сквозь стены через радио сигнал. Все что нужно сделать это поставить радио датчик за стеной и камеру с предобученными алгоритмом pose-esimation перед стеной. И все) Данные сами размечаются)
А вы в это время получаете миллионые контракты с тоталитарными гос-вами😂
Примеры таких self-supervised задач есть много. Именно такие задачи могут дать огромное преимущество новому стартапу. А те стартапы где все сразу уперается в дорогую разметку огромных датасетов оставьте крупным компаниям, у них там преимущество.
https://www.youtube.com/watch?v=HgDdaMy8KNE
Понятно что самая большая проблема это собрать размеченные данные, потому что алгоритмы все бесплатные. Любой последний алгоритм от deepmind или openAI лежит уже на гитхабе.
А вот сбор и разметка данных это обычно очень дорого.
Поэтому если ищите новую нишу, то советую найти такую проблему где можно собрать self-supervised датасет. То есть такой датасет который не нужно самому вручную размечать.
Простой пример это "видеть сквозь стены":
Through-Wall Human Pose Estimation Using Radio Signals
http://openaccess.thecvf.com/content_cvpr_2018/CameraReady/2406.pdf
Вы можете обучить нейронку видеть сквозь стены через радио сигнал. Все что нужно сделать это поставить радио датчик за стеной и камеру с предобученными алгоритмом pose-esimation перед стеной. И все) Данные сами размечаются)
А вы в это время получаете миллионые контракты с тоталитарными гос-вами😂
Примеры таких self-supervised задач есть много. Именно такие задачи могут дать огромное преимущество новому стартапу. А те стартапы где все сразу уперается в дорогую разметку огромных датасетов оставьте крупным компаниям, у них там преимущество.
https://www.youtube.com/watch?v=HgDdaMy8KNE