
NVIDIA, 장기 에이전트용 오픈 모델 Nemotron 3 Ultra 공개
#NVIDIA가 6월 4일 Nemotron 3 Ultra를 오픈 웨이트로 공개했습니다. 550B 파라미터(활성 55B)에 맘바-트랜스포머 전문가 혼합(Mamba-Transformer MoE) 구조와 100만 토큰 컨텍스트를 갖춘, 단발 대화가 아니라 장기 실행 에이전트(long-running agent)를 겨냥한 모델입니다. 동급 오픈 모델 대비 최대 5배 처리량(300+ 토큰/초)과 약 30% 낮은 작업 비용을 내세웠고, 가중치·데이터셋·학습 레시피를 OpenMDW-1.1 라이선스로 함께 배포합니다.
💡API 토큰 비용 없이 내 인프라에서 돌릴 수 있는, 현재 미국 연구소 발 가장 강력한 오픈 웨이트 모델입니다. 에이전트 루프처럼 컨텍스트를 계속 되먹이는 워크로드의 비용 구조를 직접 바꿔볼 수 있습니다.
NVIDIA open-sources Nemotron 3 Ultra — a 550B Mamba-Transformer MoE built for lo →#agent#open-weights#nvidia#nemotron#moe









