OpenAI выводит GPT-5.3-Codex-Spark на чипах Cerebras Systems — первое промышленное развертывание вне стека Nvidia

OpenAI объявила о запуске GPT-5.3-Codex-Spark — первой модели компании, работающей в продакшене на оборудовании Cerebras Systems. Это первый случай, когда сервисы разработчика ChatGPT развернуты вне традиционной аппаратной платформы Nvidia.

Новая модель представляет собой облегчённую и энергоэффективную версию Codex. Она ориентирована на интерактивные задачи программирования. Точечное редактирование кода, запуск выборочных тестов и работу в режиме частых прерываний. Сейчас GPT-5.3-Codex-Spark доступна в формате research preview для подписчиков ChatGPT Pro.

Оптимизация под низкую задержку

По данным OpenAI, модель настроена для сценариев с высокой интерактивностью. В частности, она по умолчанию минимизирует объём изменений в коде и не запускает тесты без явной команды пользователя.

Ключевой акцент сделан на пропускной способности и времени отклика. В оптимальной конфигурации система способна обрабатывать свыше 1 000 токенов в секунду. Такой показатель особенно важен для IDE-сценариев, где задержка напрямую влияет на пользовательский опыт.

Архитектура wafer-scale вместо GPU-кластеров

Аппаратной основой проекта стал процессор третьего поколения Wafer Scale Engine от Cerebras. В отличие от традиционных GPU-кластеров, построенных из множества отдельных чипов с высокоскоростными соединениями, Cerebras использует единый кристалл на всю кремниевую пластину.

Подобная архитектура включает сотни тысяч вычислительных ядер и крупные объёмы встроенной памяти. За счёт минимизации межчиповых коммуникаций снижается задержка — критичный фактор для инференса в реальном времени.

Расширение экосистемы без отказа от Nvidia

Ранее OpenAI сообщила о планах по поэтапному вводу в эксплуатацию до 750 мегаватт вычислительных мощностей на базе Cerebras к 2028 году. Речь идёт прежде всего об инфраструктуре инференса с низкой задержкой, а не о замене существующей обучающей базы.

В начале месяца глава компании Sam Altman публично заявил, что OpenAI ценит сотрудничество с Nvidia и рассчитывает оставаться крупным клиентом производителя. Компания по-прежнему называет Nvidia фундаментом своей обучающей и инференс-инфраструктуры.

Диверсификация поставщиков ускорителей

Одновременно OpenAI активно расширяет круг партнёров. Компания заключила соглашение о развертывании до 6 гигаватт мощностей на базе решений AMD в течение нескольких лет. Кроме того, подписано партнёрство с Broadcom по разработке специализированных ИИ-ускорителей и сетевых компонентов.

Таким образом, запуск GPT-5.3-Codex-Spark на платформе Cerebras не означает отказа от Nvidia, а демонстрирует стратегию технологической диверсификации. OpenAI формирует многоуровневую инфраструктуру: Nvidia остаётся ядром для обучения и масштабного инференса, тогда как Cerebras и другие партнёры закрывают нишу сверхнизкой задержки и специализированных задач.

Подписывайтесь на наш телеграмм канал и читайте новости в удобном формат — https://t.me/occlub_ru.

OpenAI выводит GPT-5.3-Codex-Spark на чипах Cerebras Systems — первое промышленное развертывание вне стека Nvidia

Оптимизация под низкую задержку

Архитектура wafer-scale вместо GPU-кластеров

Расширение экосистемы без отказа от Nvidia

Диверсификация поставщиков ускорителей

Слух: AMD, NVIDIA и OpenAI заинтересовались техпроцессами Intel 18A-P и 14A

В Китае построят первый полностью роботизированный отель

Valve сделала Steam Machine еще более эксклюзивной

GMKtec EVO-X1 Pro: компактный монстр с OCuLink для eGPU

Первый сторонний ПК со SteamOS

Материнские платы не дорожают, в отличие от остальных комплектующих

Индустрия игр: протесты против увольнений и дефицит предзаказов

Gigabyte представила игровой ноутбук произведённый в Индии

OpenAI выводит GPT-5.3-Codex-Spark на чипах Cerebras Systems — первое промышленное развертывание вне стека Nvidia

Оптимизация под низкую задержку

Архитектура wafer-scale вместо GPU-кластеров

Расширение экосистемы без отказа от Nvidia

Диверсификация поставщиков ускорителей

ЧИТАТЬ БОЛЬШЕ НОВОСТЕЙ