OpenAI объявила о запуске GPT-5.3-Codex-Spark — первой модели компании, работающей в продакшене на оборудовании Cerebras Systems. Это первый случай, когда сервисы разработчика ChatGPT развернуты вне традиционной аппаратной платформы Nvidia.
Новая модель представляет собой облегчённую и энергоэффективную версию Codex. Она ориентирована на интерактивные задачи программирования. Точечное редактирование кода, запуск выборочных тестов и работу в режиме частых прерываний. Сейчас GPT-5.3-Codex-Spark доступна в формате research preview для подписчиков ChatGPT Pro.
Оптимизация под низкую задержку
По данным OpenAI, модель настроена для сценариев с высокой интерактивностью. В частности, она по умолчанию минимизирует объём изменений в коде и не запускает тесты без явной команды пользователя.
Ключевой акцент сделан на пропускной способности и времени отклика. В оптимальной конфигурации система способна обрабатывать свыше 1 000 токенов в секунду. Такой показатель особенно важен для IDE-сценариев, где задержка напрямую влияет на пользовательский опыт.
Архитектура wafer-scale вместо GPU-кластеров
Аппаратной основой проекта стал процессор третьего поколения Wafer Scale Engine от Cerebras. В отличие от традиционных GPU-кластеров, построенных из множества отдельных чипов с высокоскоростными соединениями, Cerebras использует единый кристалл на всю кремниевую пластину.
Подобная архитектура включает сотни тысяч вычислительных ядер и крупные объёмы встроенной памяти. За счёт минимизации межчиповых коммуникаций снижается задержка — критичный фактор для инференса в реальном времени.
Расширение экосистемы без отказа от Nvidia
Ранее OpenAI сообщила о планах по поэтапному вводу в эксплуатацию до 750 мегаватт вычислительных мощностей на базе Cerebras к 2028 году. Речь идёт прежде всего об инфраструктуре инференса с низкой задержкой, а не о замене существующей обучающей базы.
В начале месяца глава компании Sam Altman публично заявил, что OpenAI ценит сотрудничество с Nvidia и рассчитывает оставаться крупным клиентом производителя. Компания по-прежнему называет Nvidia фундаментом своей обучающей и инференс-инфраструктуры.
Диверсификация поставщиков ускорителей
Одновременно OpenAI активно расширяет круг партнёров. Компания заключила соглашение о развертывании до 6 гигаватт мощностей на базе решений AMD в течение нескольких лет. Кроме того, подписано партнёрство с Broadcom по разработке специализированных ИИ-ускорителей и сетевых компонентов.
Таким образом, запуск GPT-5.3-Codex-Spark на платформе Cerebras не означает отказа от Nvidia, а демонстрирует стратегию технологической диверсификации. OpenAI формирует многоуровневую инфраструктуру: Nvidia остаётся ядром для обучения и масштабного инференса, тогда как Cerebras и другие партнёры закрывают нишу сверхнизкой задержки и специализированных задач.
Подписывайтесь на наш телеграмм канал и читайте новости в удобном формат — https://t.me/occlub_ru.


