🔥 DeepSeek: Отделяем хайп от правды
Я взял статью
аналитика Бена Томпсона, добавил информацию от YouTube блогера
Jeff Su и разобрал 6
главных мифов вокруг DeepDeek на данный момент.
🚀 Кратко и по существу, поехали.
✅
Миф: DeepSeek построили модель за $5,6 млн.
Реальность: Это только финальный этап тренировки. Важно понимать, что:
• У DeepSeek было
50 000 видеокарт Nvidia Hopper (H800), их стоимость ≈ $1 млрд.
• Полная разработка стоила в десятки раз больше, чем заявленные $5,6 млн.
✅
Миф: DeepSeek обогнали OpenAI.
Реальность: Их reasoning модель R1 действительно равняется OpenAI o1 по производительности, но:
• OpenAI уже выпустили OpenAI o3, который мощнее обоих.
• DeepSeek делает ставку на эффективность, а не на абсолютную мощность.
• Это как китайский телефон за $300, который на 90% похож на флагман, но все равно не идентичен Samsung или iPhone.
✅
Миф: DeepSeek нарушили закон, чтобы создать свою модель.
Реальность: Они легально использовали H800, потому что:
• США запретили продажу мощных H100 китайским компаниям.
• Но
урезанные H800 (на 30-40% слабее) были разрешены.
• DeepSeek оптимизировали архитектуру, чтобы компенсировать нехватку вычислительных мощностей.
📊 Факты:
• H100: 700 ГБ/с пропускной способности памяти (запрещен в Китае).
• H800: 400 ГБ/с (разрешен, но медленнее).
•
Разница в мощности между H100 и H800 примерно в 1,75 раза.✅
Миф: DeepSeek создали модель с нуля.
Реальность: Скорее всего, они использовали
метод дистилляции:
• Это значит, что DeepSeek обучался на выходных данных ChatGPT.
• Это
не незаконно (простите за такое выражение), но да, это нарушает правила OpenAI.
• Microsoft и OpenAI
уже начали расследование по этому поводу.
• Забавно, но Microsoft параллельно добавил DeepSeek R1 в свои облачные сервисы. Ибо выгодно.
🔥 Безопасно ли пользоваться DeepSeek?
📌 Есть 3 способа, если беспокоит конфиденциальность:
1️⃣ Использовать Perplexity,
Venice.AI (данные хранятся в США).
2️⃣ Запускать модели локально через Ollama или LM Studio.
3️⃣ Избегать официальных веб- и мобильных приложений DeepSeek (данные отправляются в Китай).
📊 Дополнительные данные:
• Perplexity AI уже интегрировал DeepSeek, но оставил серверы в США.
• Venice AI также использует DeepSeek без отправки данных в Китай.
• Ollama и LM Studio позволяют запускать модели на собственном ПК, но требуют мощного железа.
⚡ Как DeepSeek повлияет на рынок?📌 Nvidia и американские компании не проиграют, а наоборот выиграют:
• Согласно
парадоксу Джевонса, когда технология становится дешевле, спрос на нее растет.
• DeepSeek делает AI доступнее, а это увеличивает спрос на графические процессоры Nvidia.
• Meta (Facebook) использует AI в рекламе → снижение затрат → рост прибыли.
• Amazon AWS сможет сдавать в аренду мощные open-source модели, у них как раз своя модель не получалась.
📊 Факты:
• В 2023 году Nvidia заработала $22,5 млрд на AI-чипах.
• Чем дешевле AI, тем больше его внедряют, а это ведет к росту потребности в GPU.
• Meta тратит миллиарды на AI, а теперь сможет делать это дешевле.
🤔 Стоит ли переходить на DeepSeek?
⚡ Оцените свои потребности перед сменой платформы:
• Если вы разработчик и хотите снизить расходы — да.
• Если вы уже платите за ChatGPT и вам важна приватность — нет.
• Если просто гонитесь за хайпом — подумайте дважды.
💬 Что думаете? Будете пробовать DeepSeek или останетесь на OpenAI?