ИИ
Nemotron 3: движок Nvidia с открытым исходным кодом для следующего поколения искусственного интеллекта

Nemotron 3: движок Nvidia с открытым исходным кодом для следующего поколения искусственного интеллекта

Преимущества Nvidia в области искусственного интеллекта выходят за рамки графических процессоров. С помощью Nemotron 3 компания объединяет открытые модели со своим программным обеспечением, превращая вычислительные ресурсы в готовый к развертыванию интеллектуальный код.

Для большинства людей, и это вполне понятно, Nvidia по-прежнему ассоциируется с графическими процессорами и чипами для искусственного интеллекта. Продукция компании доминирует в обсуждениях и заголовках новостей, касающихся центров обработки данных с использованием ИИ.

Но настоящая «защита» Nvidia, и я использую это слово не случайно, заключается в сочетании её кремниевых решений с постоянно расширяющимся программным стеком. Иными словами, Nvidia создала комплексную платформу искусственного интеллекта, которая включает в себя:

  • CUDA — базовая платформа компании для программирования графических процессоров.
  • cuDNN — специализированные библиотеки для глубокого обучения с ускорением на графических процессорах.
  • NeMo — высокоуровневая платформа для обучения и развертывания больших языковых и мультимодальных моделей.

Теперь семейство открытых моделей Nemotron преобразует вычислительные ресурсы в полезный интеллект. Это очень важно. Nemotron 3 — это новейшее воплощение этой стратегии, и для долгосрочных перспектив Nvidia в области ИИ это так же важно, как и любой запуск новой видеокарты.

Почему Nemotron важен для стека технологий Nvidia

Nvidia любит напоминать рынку, что передовые модели не существуют только за счет аппаратного обеспечения. В своем недавнем блоге, посвященном GPT-5.2 от OpenAI, компания подчеркнула, что ведущие модели зависят от «ускорителей мирового класса, передовых сетевых технологий и полностью оптимизированного программного стека».

Возможно, Nvidia GB200 и Blackwell и привлекают внимание на рекламных снимках, но именно программное обеспечение позволяет десяткам тысяч графических процессоров работать как единый, целостный суперкомпьютер с искусственным интеллектом.

Nemotron находится именно на этом уровне, между инфраструктурой и приложениями. Изначально он задумывался как способ заложить основы экосистемы открытого исходного кода с помощью надежных и достаточно эффективных моделей.

В ходе телефонной конференции с отраслевыми аналитиками вице-президент Nvidia по программному обеспечению для генеративного искусственного интеллекта для корпоративного сектора Кари Бриски очень просто сформулировала мотивацию.

Открытые модели ускоряют инновации, поскольку позволяют «исследователям во всем мире опираться на общие знания» и дают возможность любому, а не только крупным технологическим компаниям, дорабатывать системы для своих собственных областей.

В 2025 году Nvidia стала крупнейшим поставщиком открытых моделей и наборов данных на платформе Hugging Face, представив около 650 моделей и 250 наборов данных. Этот момент важен, поскольку показывает, что Nvidia не просто продает графические процессоры: она активно наполняет открытую экосистему высококачественными строительными блоками, что привлекает исследователей, стартапы и предприятия в свою программную орбиту и делает платформу Nvidia местом по умолчанию для выполнения новых задач в области искусственного интеллекта.

В этом смысле Nemotron превращается в бренд, который организует эти разработки в дорожную карту, а не в набор случайных элементов. Анонс Nemotron 3 устанавливает точку, где эта дорожная карта становится гораздо более амбициозной. Бриски описал его как «самое эффективное семейство открытых моделей с высочайшей точностью для создания приложений искусственного интеллекта».

Главным анонсом стала Nemotron 3 Nano, модель, объединяющая экспертов с примерно 30 миллиардами параметров, при этом на каждый токен приходится всего около 3–4 миллиардов активных параметров. Такая архитектура обеспечивает ей вычислительную мощность «миниатюрной» модели, позволяя при этом конкурировать по качеству рассуждений с гораздо более крупными и мощными системами.

В основе Nemotron 3 лежат три идеи, ставшие центральными для современных моделей рассуждений.

Первая архитектура — гибридная архитектура Mamba-Transformer, которая сочетает в себе слои внимания с моделированием последовательности в пространстве состояний для сокращения объема памяти и вычислительных ресурсов, особенно при работе с длинным контекстом.

Второй вариант — это схема, в которой используется смешанный набор параметров от разных специалистов, и для каждого токена активируется лишь небольшое подмножество параметров.

Третий компонент — это контекстное окно, охватывающее приблизительно миллион токенов, что позволяет модели работать с целыми кодовыми базами, длинными техническими спецификациями и многодневными разговорами за один проход.

Что означает Nemotron для центров обработки данных

Поскольку новый закон масштабирования больше не сводится к принципу «больше графических процессоров, больше предварительного обучения», Бриски отмечает, что теперь существует три рычага: «предварительное обучение, постобучение и то, что мы называем долгосрочным обдумыванием».

Длительное обдумывание подразумевает вычисления во время тестирования и самоанализ, часто с участием нескольких агентов.

Это приводит к резкому увеличению использования токенов и, как следствие, стоимости вывода результатов.

Главное преимущество Nemotron 3 заключается в том, что он обеспечивает более глубокое обоснование с гораздо лучшим соотношением количества токенов к точности, чем предыдущие открытые модели.

Но это еще не все. Nvidia выпускает Nemotron 3 вместе с теми же самыми «тренажерами», данными и библиотеками для обучения с подкреплением (RL), которые она использовала внутри компании.

Бриски подчеркнул, что «Nvidia первой выпустила открытые передовые среды обучения с подкреплением наряду со своими открытыми моделями, библиотеками и данными».

Десять начальных разделов, посвященных спортзалу, охватывают такие темы, как соревновательное программирование, математика и практическое планирование.

Они позволяют предприятиям воспроизводить собственный цикл обучения Nvidia — моделировать действия агентов в реалистичных условиях, оценивать их поведение и передавать эти данные обратно в модель.

Для команд, которые в противном случае потратили бы месяцы на создание собственной инфраструктуры для обучения с подкреплением, это существенное ускорение процесса.

Что касается обработки данных, Nemotron 3 основан на том, что Nvidia называет переходом от «больших данных» к «умным и улучшенным данным».

Компания выпускает новые предварительно обученные модели, которые были синтетически очищены и переписаны, представляя собой более 10 триллионов токенов текста более высокого качества, а также набор инструкций из 18 миллионов примеров, созданный на основе моделей с разрешительной лицензией.

Компания Nvidia утверждает, что на создание и обработку этих данных было потрачено более миллиона часов работы (в формате H100).

По словам Бриски, в результате показатель независимого «индекса интеллекта» увеличился на 40% при переходе от Nemotron Nano 2 к Nemotron 3, особенно заметно улучшились показатели выполнения инструкций и краткости изложения.

Nemotron также поставляется в комплекте с тем, что Nvidia называет «чертежами». Это эталонные наборы агентов для глубокого обучения ассистентов исследователей, поиска и суммирования видео, а также высокооптимизированные конвейеры генерации дополненной информации для корпоративного поиска (RAG), которые показывают, как модели, эмбеддинги, многомодальный ввод и компоненты поиска взаимодействуют друг с другом.

Для директора по информационным технологиям это важнее, чем просто сравнительный анализ. Это превращает Nemotron из исследовательского инструмента в шаблон, который можно развернуть на собственных данных, в собственных кластерах или в вашем любимом облаке.

Всё это идеально соответствует концепции Nvidia, ориентированной на комплексное решение. Компания уже обеспечивает работу большей части передовых систем обучения моделей, от GPT-5.2 от OpenAI до генераторов видео, таких как Runway Gen-4.5, на платформах от Hopper до GB200 и Blackwell.

Ее графические процессоры лидируют во всех категориях MLPerf Training, и системы Blackwell теперь доступны в качестве стандартных опций на AWS, Google Cloud, Azure, Oracle и других платформах.

Nemotron 3 предоставляет эту инфраструктуру с помощью «собственной модели» и набора инструментов, которые тщательно оптимизированы для процессоров, сетевых возможностей и компиляторов Nvidia.

Конкурентные последствия

Итак, обеспечивает ли Nemotron 3 стабильное лидерство Nvidia над AMD и остальными игроками рынка?

Это, безусловно, укрепляет позиции компании. Что касается аппаратного обеспечения, то за последние несколько лет AMD стала крупным игроком на рынке микросхем для ИИ. Ее ускорители серий Instinct MI300 и более новые MI350, поддерживаемые открытым программным стеком ROCm, теперь запускают LLM-системы, такие как Llama-3, у ведущих облачных провайдеров и, для некоторых рабочих нагрузок, обеспечивают конкурентоспособную или даже лучшую экономику вывода.

Кроме того, AMD также выпускает полнофункциональные стоечные системы Helios и MI450, чтобы составить конкуренцию стоечным решениям Nvidia.

Отличительной особенностью Nemotron 3 от Nvidia является глубина и открытость экосистемы, объединяющей модель и инструменты, которая работает на её чипах.

Конечно, у AMD есть ROCm, мощная работа над компиляторами и растущая поддержка моделей. Тем не менее, она пока не предлагает эквивалентного интегрированного пакета открытых моделей, RL-тренажёров, тщательно отобранных данных и планов развертывания под единым брендом.

Для предприятий, стремящихся создавать «системы моделей» и агентные рабочие процессы, подобный догматичный, но открытый инструментарий представляет собой чрезвычайно привлекательную возможность.

Это сокращает время получения выгоды и незаметно привязывает вас к методу работы Nvidia.

Однако Nemotron 3 — это не непреодолимая преграда. Используемые им архитектуры — гибридные слои Mamba-Transformer, сочетание экспертов, длинный контекст и рассуждения, основанные на обучении с подкреплением, — всё лучше понимаются в более широком исследовательском сообществе.

Конечно, ничто не мешает AMD или другим компаниям обучать аналогичные открытые модели и настраивать их для своих собственных ускорителей. Более того, поскольку Nemotron использует открытые веса, теоретически он может работать на оборудовании, отличном от Nvidia, таком как ROCm и другие зрелые стеки, даже если при этом теряется часть сквозной оптимизации Nvidia.

Что сигнализирует Nemotron о стратегии Nvidia в области искусственного интеллекта?

Таким образом, Nemotron 3 следует рассматривать не как нокаутирующий удар, а как очередной виток развития Nvidia. Он повышает ценность графических процессоров компании, предоставляя разработчикам эффективные и прозрачные модели, разработанные для агентного ИИ.

Она делает свою программную платформу более привлекательной, объединяя библиотеки, среды обучения с подкреплением и данные, необходимые для специализации этих моделей.

Кроме того, это еще больше сближает Nvidia с сообществом разработчиков открытого программного обеспечения в области искусственного интеллекта, которое в настоящее время является движущей силой многих инноваций в инструментах и ​​агентах.

Но будет ли этого достаточно, чтобы Nvidia оставалась впереди в условиях стремительного роста рынка центров обработки данных для ИИ? В ближайшей перспективе, я считаю, ответ — да.

Nemotron 3 поднимает планку того, что значит «открытый» и «готовый к использованию в корпоративной среде» в мире моделей, и делает это таким образом, который соответствует сильным сторонам Nvidia.

В долгосрочной перспективе его реальное влияние может быть скорее культурным, чем техническим.

Следуя дорожной карте Nemotron, публикуя собственные алгоритмы обучения в открытом доступе и рассматривая модели как библиотеки, которые вы можете версионировать и распространять, Nvidia пытается определить, как следует создавать серьезное программное обеспечение для искусственного интеллекта.

Для клиентов, решающих, куда вложить свои многомиллиардные инвестиции в инфраструктуру ИИ, эта история так же важна, как и чистый показатель TOPS.

Похожие записи

«Более интеллектуальный ИИ для всех» от Lenovo объединяет ИИ от карманных устройств до облака

«Более интеллектуальный ИИ для всех» от Lenovo объединяет ИИ от карманных устройств до облака

На прошлой неделе я побывал в штаб-квартире Lenovo, чтобы ознакомиться с обновленной информацией о продуктах, услугах и достижениях компании в области искусственного интеллекта. Контраст между Dell и Lenovo…

Искусственный интеллект прочитал мое гневное, угрожающее электронное письмо. Его ответ изменил ситуацию

Искусственный интеллект прочитал мое гневное, угрожающее электронное письмо. Его ответ изменил ситуацию

Недавний опыт коренным образом изменил мое отношение к искусственному интеллекту (ИИ), превратив его из любопытного явления в незаменимый профессиональный инструмент. Как и многие деловые споры, всё началось с…

Империя наносит ответный удар: как сделка AMD с OpenAI меняет ход войны искусственного интеллекта

Империя наносит ответный удар: как сделка AMD с OpenAI меняет ход войны искусственного интеллекта

В мире искусственного интеллекта (ИИ), где ставки высоки, а темпы его развития стремительно растут, одна компания стала бесспорным королем и единственным поставщиком вычислительных ресурсов в цифровой золотой лихорадке:…

Эволюция Red Hat: как дочерняя компания превратилась в лидера в области искусственного интеллекта

Эволюция Red Hat: как дочерняя компания превратилась в лидера в области искусственного интеллекта

Недавний успех Red Hat подчеркивает, как инновации с открытым исходным кодом в сочетании с дисциплинированным исполнением могут изменить подход предприятий к внедрению и масштабированию ИИ. Компания, наиболее известная…

Новый Голливуд: за кулисами грядущих перемен в кино и на телевидении от GenAI

Новый Голливуд: за кулисами грядущих перемен в кино и на телевидении от GenAI

После того, как меня пригласили использовать Sora от OpenAI и я провел две недели, экспериментируя с ней, я убежден, что мы стоим на пороге настолько глубоких перемен, что…

Способы сэкономить на Рождестве после карантина, использующие возможности искусственного интеллекта

Способы сэкономить на Рождестве после карантина, использующие возможности искусственного интеллекта

Если в этом году вы чувствуете себя менее «хо-хо-хо» и более «фу-фу-фу», вы не одиноки. Денег мало, неопределенности много, и для многих из нас идея пышного Рождества кажется…