Графические процессоры — основа современной инфраструктуры ИИ. По данным исследователей, на них приходится свыше 80% мировой выручки от продаж чипов для ИИ. Лидером здесь долгие годы была NVIDIA, которая в 2024 году представила новейшую архитектуру Blackwell.
Что сейчас происходит на мировом рынке GPU:
Содержание:
Основные сложности рынка GPU сегодня
Риск монополии и зависимости:
Несмотря на конкуренцию, экосистема NVIDIA (CUDA, библиотеки) создает эффект «лоскутного одеяла», который крайне сложно воспроизвести. Это создает риски зависимости для всей индустрии микроэлектроники от одного вендора.
Высокие барьеры входа:
Новым игрокам практически невозможно конкурировать в создании полноценных экосистем, что ограничивает инновации и может привести к стагнации цен.
Критически важна высокая пропускная способность памяти (что решает HBM). Однако сама архитектура GPU не решает эту проблему кардинально — без HBM их эффективность резко падает.
Не всегда оптимальны:
Для некоторых специфических задач ИИ (например, когда требуются сложные условные переходы) архитектура GPU может подходить лучше, но вынужденно используется GPU.
Технологические тренды: упаковка и память
Плюсы:
Инновации в упаковке: переход к чиплетам и 2.5D/3D-пакетированию — это гениальный обходной маневр. Он позволяет наращивать производительность и выход годных кристаллов без перехода на сверхдорогие техпроцессы, снижая стоимость владения.
Стандартизация HBM: память HBM3e/HBM4 становится отраслевым стандартом для высокопроизводительных вычислений. Это доказывает ее критическую важность и стимулирует инвестиции в её развитие со стороны нескольких производителей, укрепляя цепочку поставок.
Диверсификация поставщиков: появление китайских производителей HBM и альтернативных фабрик по упаковке (ASE, Amkor) — это положительный тренд, который может снизить риски концентрации производства в будущем.
Минусы:
Чрезвычайная сложность и стоимость: передовые методы упаковки (CoWoS) так же сложны и дороги, как и создание самих чипов. Мощностей TSMC на всех не хватает, что создает новый дефицит и задержки.
Проблемы совместимости и пропускной способности: архитектура чиплетов может создавать задержки при обмене данными между кристаллами («проблема сшивания»), что нивелирует часть их преимуществ.
Дороговизна HBM: высокая стоимость памяти HBM — ключевой фактор, делающий ускорители ИИ такими дорогими. Это основной драйвер роста цен на серверные решения.
Технология: в чём секрет скорости?
Мощность GPU кроется в архитектуре массового параллелизма.
Современные GPU для ЦОДов оснащаются ещё и специализированными тензорными ядрами, заточенными именно под эти задачи.
Важным трендом стала работа с низкой точностью (FP8, FP4). Для вывода ИИ-моделей не всегда нужна высокая точность вычислений, и низкоточные форматы позволяют радикально увеличить скорость и эффективность. NVIDIA и AMD уже вовсю используют эти технологии в своих новых чипах.
Перспектива:
Архитектура GPU будет и дальше эволюционировать в сторону ещё большей специализации под задачи ИИ. Мы увидим больше специализированных блоков, как тензорные ядра, и более агрессивное использование низкоточных вычислений для ещё большей эффективности.
Перспективы и угрозы: что ждет рынок GPU?
Плюсы (и возможности):
Рост специализированных решений: пока GPU доминируют, это открывает возможности для компаний, разрабатывающих более специализированные и эффективные для конкретных задач ASIC и NPU, особенно для этапа вывода моделий.
Развитие программных экосистем: успех AMD будет напрямую зависеть от развития её открытой платформы ROCm. Усиление конкуренции на уровне ПО будет на руку всему рынку, снижая зависимость от проприетарных решений.
Появление новых архитектур: трудности масштабирования GPU открывают дорогу для совершенно новых физических принципов вычислений (оптические компьютеры, квантовые и т.д.), где стартапы могут совершить прорыв.
Вызовы сегодня. Стена, в которую упирается закон Мура
Компании меняют стратегию: вместо того чтобы делать чипы меньше, они делают их большими.
Ключевые подходы:
- Чиплеты и 3D-упаковка: соединение нескольких меньших кристаллов в один большой чип (подход AMD).
- Сшивание кристаллов: создание гигантских чипов, как у NVIDIA Blackwell или Cerebras.
- Передовая пайка (2.5D/3D упаковка): технологии вроде CoWoS от TSMC, которые позволяют плотно упаковывать чипы и память.
Ещё один критически важный элемент — память HBM. Высокоскоростная память необходима для питания огромных моделей ИИ. За рынок HBM борются корейские гиганты (Samsung, SK Hynix), но и китайские компании (Huawei, CXMT) активно развивают своё производство.
Перспектива:
В ближайшие годы именно инновации в области упаковки чипов (пакетные решения), а не только масштабирование транзисторов, будут определять лидеров. Это также может открыть возможности для новых игроков в области упаковки чипов. Борьба за доступ к мощностям передовой пайки и памяти HBM станет таким же важным фронтом конкуренции, как и разработка самих GPU.
Будущее за гетерогенными вычислениями
Несмотря на доминирование GPU, будущее ИИ-чипов не будет монолитным. Гиперскейлеры (Google, Amazon) уже разрабатывают собственные ASIC (как TPU у Google), которые могут быть более эффективны для конкретных задач.
Новые комментарии: