DeepSeek ведет новый парадигму AI: от вычислительной мощностью к революции алгоритмов
На днях DeepSeek выпустил обновление последней версии V3 — DeepSeek-V3-0324 на платформе Hugging Face. Эта модель с 6850 миллиардами параметров значительно улучшила свои возможности в кодировании, дизайне пользовательского интерфейса и способности к выводу.
На только что завершившейся конференции GTC 2025 генеральный директор NVIDIA Хуан Ренсюнь высоко оценил DeepSeek. Он подчеркнул, что рынок ранее ошибочно полагал, что эффективная модель DeepSeek снизит спрос на чипы; будущее вычислительных потребностей будет только расти, а не уменьшаться.
DeepSeek как представитель алгоритмического прорыва, связь между ним и поставками чипов вызвала размышления о роли вычислительной мощности и алгоритмов в развитии отрасли.
Вычислительная мощность и эволюция алгоритмов
В области ИИ увеличение вычислительной мощности предоставляет основу для работы более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные модели; в то время как оптимизация алгоритмов позволяет более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.
Взаимосвязь вычислительной мощности и алгоритма вновь формирует ландшафт AI-индустрии:
Дифференциация технологических маршрутов: некоторые компании стремятся создать сверхбольшие вычислительные мощности, в то время как другие сосредоточены на оптимизации алгоритмов, формируя различные технологические школы.
Реконструкция цепочки поставок: производители чипов становятся лидерами в области вычислительной мощности ИИ через экосистему, в то время как облачные сервисы снижают порог развертывания с помощью гибких вычислительных услуг.
Корректировка распределения ресурсов: предприятия ищут баланс между инвестициями в аппаратную инфраструктуру и разработкой эффективных алгоритмов.
Появление открытого сообщества: открытые модели позволяют делиться результатами инноваций алгоритмов и оптимизации вычислительной мощности, ускоряя итерации и распространение технологий.
Технологические инновации DeepSeek
Успех DeepSeek неразрывно связан с его техническими инновациями. Вот простое объяснение его основных инновационных моментов:
Оптимизация архитектуры модели
DeepSeek использует комбинацию архитектур Transformer + MOE (Смешанная группа экспертов) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура напоминает суперкоманду, где Transformer отвечает за выполнение обычных задач, а MOE выступает в роли группы экспертов, каждый из которых обладает своей областью специализации. Когда возникает конкретная проблема, её решает наиболее квалифицированный эксперт, что значительно повышает эффективность и точность модели. Механизм MLA позволяет модели более гибко обращать внимание на различные важные детали при обработке информации, что дополнительно улучшает её производительность.
Инновации в методах обучения
DeepSeek предложила рамки гибридного обучения с использованием FP8. Эта рамка похожа на интеллектуальный распределитель ресурсов, который может динамически выбирать подходящую вычислительную мощность в зависимости от потребностей на разных этапах обучения. Когда требуется высокая точность вычислений, она использует более высокую точность для обеспечения точности модели; когда можно принять более низкую точность, она снижает точность, тем самым экономя вычислительные ресурсы, увеличивая скорость обучения и уменьшая использование памяти.
Повышение эффективности вывода
На этапе вывода DeepSeek внедрил технологию многотокенного прогнозирования (Multi-token Prediction, MTP). Традиционный метод вывода осуществляется поэтапно, при этом на каждом этапе предсказывается только один токен. Однако технология MTP позволяет предсказывать сразу несколько токенов, что значительно ускоряет процесс вывода и снижает его стоимость.
Прорыв в алгоритмах强化学习
Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с учетом вознаграждений и штрафов) оптимизирует процесс обучения модели. Укрепляющее обучение похоже на то, что модели предоставляется тренер, который направляет ее на изучение лучших действий через вознаграждения и штрафы. Традиционные алгоритмы усиленного обучения могут потреблять значительные вычислительные ресурсы в этом процессе, тогда как новый алгоритм DeepSeek более эффективен: он позволяет сократить ненужные вычисления, одновременно обеспечивая повышение производительности модели, тем самым достигая баланса между производительностью и стоимостью.
Эти инновации не являются изолированными техническими точками, а образуют完整ную техническую систему, которая снижает потребность в вычислительной мощности на всем этапе — от обучения до вывода. Обычные потребительские графические карты теперь могут запускать мощные модели ИИ, что значительно снижает порог входа для применения ИИ, позволяя большему количеству разработчиков и компаний участвовать в инновациях в области ИИ.
Влияние на производителей чипов
Многие считают, что DeepSeek обошел программный уровень производителей GPU, тем самым избавившись от зависимости от них. На самом деле, DeepSeek напрямую оптимизирует алгоритмы через уровень PTX (Parallel Thread Execution) производителей GPU. PTX является промежуточным языком, находящимся между высокоуровневым кодом GPU и фактическими инструкциями GPU, и, управляя этим уровнем, DeepSeek может достичь более тонкой настройки производительности.
Влияние на производителей чипов двустороннее: с одной стороны, DeepSeek на самом деле более глубоко связано с аппаратным обеспечением и экосистемой, а снижение порога входа для AI-приложений может расширить общий рынок; с другой стороны, оптимизация алгоритма DeepSeek может изменить структуру спроса на высококачественные чипы, некоторые AI-модели, которые ранее могли работать только на высококачественных GPU, теперь могут эффективно работать на среднеуровневых и даже потребительских видеокартах.
Значение для китайской AI-индустрии
Оптимизация алгоритма DeepSeek предоставляет технологический прорыв для китайской AI-индустрии. В условиях ограниченности высококачественных чипов, подход "программное обеспечение вместо аппаратного обеспечения" уменьшает зависимость от высококачественных импортируемых чипов.
На верхнем уровне эффективные алгоритмы снижают давление на требования к вычислительной мощности, позволяя поставщикам вычислительных услуг продлить срок службы оборудования за счет оптимизации программного обеспечения и повысить доходность инвестиций. На нижнем уровне оптимизированные открытые модели снижают барьеры для разработки AI-приложений. Множество малых и средних предприятий могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не имея в распоряжении больших ресурсов вычислительной мощности, что приведет к появлению большего количества AI-решений в вертикальных областях.
Глубокое влияние Web3+AI
Децентрализованная AI инфраструктура
Оптимизация алгоритма DeepSeek предоставляет новую динамику для инфраструктуры Web3 AI, инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают децентрализованный AI-инференс возможным. Архитектура MoE естественно подходит для распределенного развертывания, разные узлы могут хранить разные сети экспертов, без необходимости хранения полной модели на одном узле, что значительно снижает требования к хранению и вычислениям на одном узле, тем самым повышая гибкость и эффективность модели.
FP8 тренировочная рамка еще больше снизила потребность в высокопроизводительных вычислительных ресурсах, что позволяет большему количеству вычислительных ресурсов присоединяться к сети узлов. Это не только снижает барьеры для участия в децентрализованных вычислениях AI, но и повышает вычислительную мощность и эффективность всей сети.
Многоагентная система
Оптимизация интеллектуальных торговых стратегий: с помощью совместной работы агента анализа данных рынка в реальном времени, агента прогнозирования краткосрочных ценовых колебаний, агента выполнения сделок на блокчейне и агента мониторинга результатов сделок, помогаем пользователям получать большую прибыль.
Автоматическое выполнение смарт-контрактов: агент мониторинга смарт-контрактов, агент выполнения смарт-контрактов, агент контроля результатов выполнения и т.д. работают совместно, реализуя более сложную автоматизацию бизнес-логики.
Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для ставки или предоставления ликвидности в зависимости от их риск-профиля, инвестиционных целей и финансового состояния.
DeepSeek именно в условиях ограниченной вычислительной мощности через алгоритмические инновации находит прорывы и открывает дифференцированные пути развития для китайской AI-промышленности. Снижение порога применения, продвижение интеграции Web3 и AI, уменьшение зависимости от высококачественных чипов, содействие финансовым инновациям — эти воздействия формируют новую цифровую экономику. В будущем развитие AI уже не будет просто соревнованием вычислительной мощности, а станет соревнованием по совместной оптимизации вычислительной мощности и алгоритмов. На этой новой трассе такие инноваторы, как DeepSeek, переопределяют правила игры с помощью китайской мудрости.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
9
Поделиться
комментарий
0/400
ValidatorViking
· 11ч назад
Протокол battle-tested, алгоритм deepseek может быть многообещающим... но давайте сначала посмотрим на эти метрики времени работы
Посмотреть ОригиналОтветить0
MoonMathMagic
· 20ч назад
Вот такие правила игры.
Посмотреть ОригиналОтветить0
MetaverseLandlord
· 22ч назад
Чипы рост!
Посмотреть ОригиналОтветить0
GateUser-e51e87c7
· 22ч назад
Инвестиции стоит доверять только Лао Хуану!
Посмотреть ОригиналОтветить0
GetRichLeek
· 22ч назад
Просто спрашиваю, кто еще не верит в большой памп на чипы?
Посмотреть ОригиналОтветить0
OldLeekConfession
· 22ч назад
Вычислительная мощность, это же деньги~
Посмотреть ОригиналОтветить0
ChainComedian
· 22ч назад
Поторопитесь с обновлением отрасли!
Посмотреть ОригиналОтветить0
MetaReckt
· 22ч назад
Не мелите чепуху, главное, чтобы деньги пришли.
Посмотреть ОригиналОтветить0
SighingCashier
· 22ч назад
Хочешь еще спекулировать на чипах? Слишком много думаешь.
DeepSeek ведет алгоритмическую революцию, открывая новую парадигму развития ИИ.
DeepSeek ведет новый парадигму AI: от вычислительной мощностью к революции алгоритмов
На днях DeepSeek выпустил обновление последней версии V3 — DeepSeek-V3-0324 на платформе Hugging Face. Эта модель с 6850 миллиардами параметров значительно улучшила свои возможности в кодировании, дизайне пользовательского интерфейса и способности к выводу.
На только что завершившейся конференции GTC 2025 генеральный директор NVIDIA Хуан Ренсюнь высоко оценил DeepSeek. Он подчеркнул, что рынок ранее ошибочно полагал, что эффективная модель DeepSeek снизит спрос на чипы; будущее вычислительных потребностей будет только расти, а не уменьшаться.
DeepSeek как представитель алгоритмического прорыва, связь между ним и поставками чипов вызвала размышления о роли вычислительной мощности и алгоритмов в развитии отрасли.
Вычислительная мощность и эволюция алгоритмов
В области ИИ увеличение вычислительной мощности предоставляет основу для работы более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные модели; в то время как оптимизация алгоритмов позволяет более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.
Взаимосвязь вычислительной мощности и алгоритма вновь формирует ландшафт AI-индустрии:
Технологические инновации DeepSeek
Успех DeepSeek неразрывно связан с его техническими инновациями. Вот простое объяснение его основных инновационных моментов:
Оптимизация архитектуры модели
DeepSeek использует комбинацию архитектур Transformer + MOE (Смешанная группа экспертов) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура напоминает суперкоманду, где Transformer отвечает за выполнение обычных задач, а MOE выступает в роли группы экспертов, каждый из которых обладает своей областью специализации. Когда возникает конкретная проблема, её решает наиболее квалифицированный эксперт, что значительно повышает эффективность и точность модели. Механизм MLA позволяет модели более гибко обращать внимание на различные важные детали при обработке информации, что дополнительно улучшает её производительность.
Инновации в методах обучения
DeepSeek предложила рамки гибридного обучения с использованием FP8. Эта рамка похожа на интеллектуальный распределитель ресурсов, который может динамически выбирать подходящую вычислительную мощность в зависимости от потребностей на разных этапах обучения. Когда требуется высокая точность вычислений, она использует более высокую точность для обеспечения точности модели; когда можно принять более низкую точность, она снижает точность, тем самым экономя вычислительные ресурсы, увеличивая скорость обучения и уменьшая использование памяти.
Повышение эффективности вывода
На этапе вывода DeepSeek внедрил технологию многотокенного прогнозирования (Multi-token Prediction, MTP). Традиционный метод вывода осуществляется поэтапно, при этом на каждом этапе предсказывается только один токен. Однако технология MTP позволяет предсказывать сразу несколько токенов, что значительно ускоряет процесс вывода и снижает его стоимость.
Прорыв в алгоритмах强化学习
Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с учетом вознаграждений и штрафов) оптимизирует процесс обучения модели. Укрепляющее обучение похоже на то, что модели предоставляется тренер, который направляет ее на изучение лучших действий через вознаграждения и штрафы. Традиционные алгоритмы усиленного обучения могут потреблять значительные вычислительные ресурсы в этом процессе, тогда как новый алгоритм DeepSeek более эффективен: он позволяет сократить ненужные вычисления, одновременно обеспечивая повышение производительности модели, тем самым достигая баланса между производительностью и стоимостью.
Эти инновации не являются изолированными техническими точками, а образуют完整ную техническую систему, которая снижает потребность в вычислительной мощности на всем этапе — от обучения до вывода. Обычные потребительские графические карты теперь могут запускать мощные модели ИИ, что значительно снижает порог входа для применения ИИ, позволяя большему количеству разработчиков и компаний участвовать в инновациях в области ИИ.
Влияние на производителей чипов
Многие считают, что DeepSeek обошел программный уровень производителей GPU, тем самым избавившись от зависимости от них. На самом деле, DeepSeek напрямую оптимизирует алгоритмы через уровень PTX (Parallel Thread Execution) производителей GPU. PTX является промежуточным языком, находящимся между высокоуровневым кодом GPU и фактическими инструкциями GPU, и, управляя этим уровнем, DeepSeek может достичь более тонкой настройки производительности.
Влияние на производителей чипов двустороннее: с одной стороны, DeepSeek на самом деле более глубоко связано с аппаратным обеспечением и экосистемой, а снижение порога входа для AI-приложений может расширить общий рынок; с другой стороны, оптимизация алгоритма DeepSeek может изменить структуру спроса на высококачественные чипы, некоторые AI-модели, которые ранее могли работать только на высококачественных GPU, теперь могут эффективно работать на среднеуровневых и даже потребительских видеокартах.
Значение для китайской AI-индустрии
Оптимизация алгоритма DeepSeek предоставляет технологический прорыв для китайской AI-индустрии. В условиях ограниченности высококачественных чипов, подход "программное обеспечение вместо аппаратного обеспечения" уменьшает зависимость от высококачественных импортируемых чипов.
На верхнем уровне эффективные алгоритмы снижают давление на требования к вычислительной мощности, позволяя поставщикам вычислительных услуг продлить срок службы оборудования за счет оптимизации программного обеспечения и повысить доходность инвестиций. На нижнем уровне оптимизированные открытые модели снижают барьеры для разработки AI-приложений. Множество малых и средних предприятий могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не имея в распоряжении больших ресурсов вычислительной мощности, что приведет к появлению большего количества AI-решений в вертикальных областях.
Глубокое влияние Web3+AI
Децентрализованная AI инфраструктура
Оптимизация алгоритма DeepSeek предоставляет новую динамику для инфраструктуры Web3 AI, инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают децентрализованный AI-инференс возможным. Архитектура MoE естественно подходит для распределенного развертывания, разные узлы могут хранить разные сети экспертов, без необходимости хранения полной модели на одном узле, что значительно снижает требования к хранению и вычислениям на одном узле, тем самым повышая гибкость и эффективность модели.
FP8 тренировочная рамка еще больше снизила потребность в высокопроизводительных вычислительных ресурсах, что позволяет большему количеству вычислительных ресурсов присоединяться к сети узлов. Это не только снижает барьеры для участия в децентрализованных вычислениях AI, но и повышает вычислительную мощность и эффективность всей сети.
Многоагентная система
Оптимизация интеллектуальных торговых стратегий: с помощью совместной работы агента анализа данных рынка в реальном времени, агента прогнозирования краткосрочных ценовых колебаний, агента выполнения сделок на блокчейне и агента мониторинга результатов сделок, помогаем пользователям получать большую прибыль.
Автоматическое выполнение смарт-контрактов: агент мониторинга смарт-контрактов, агент выполнения смарт-контрактов, агент контроля результатов выполнения и т.д. работают совместно, реализуя более сложную автоматизацию бизнес-логики.
Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для ставки или предоставления ликвидности в зависимости от их риск-профиля, инвестиционных целей и финансового состояния.
DeepSeek именно в условиях ограниченной вычислительной мощности через алгоритмические инновации находит прорывы и открывает дифференцированные пути развития для китайской AI-промышленности. Снижение порога применения, продвижение интеграции Web3 и AI, уменьшение зависимости от высококачественных чипов, содействие финансовым инновациям — эти воздействия формируют новую цифровую экономику. В будущем развитие AI уже не будет просто соревнованием вычислительной мощности, а станет соревнованием по совместной оптимизации вычислительной мощности и алгоритмов. На этой новой трассе такие инноваторы, как DeepSeek, переопределяют правила игры с помощью китайской мудрости.