아마존웹서비스(AWS)가 미국 정부 기관 및 규제 산업 고객을 위한 전용 클라우드 환경인 'AWS GovCloud(US)'에서 오픈AI(OpenAI)의 오픈 웨이트 모델인 GPT OSS와 엔비디아(NVIDIA)의 네모트론(Nemotron) 모델을 아마존 베드록(Amazon Bedrock)을 통해 제공한다고 AWS 머신러닝 블로그를 통해 밝혔다. 이번 지원은 연방 정부의 엄격한 보안 인증인 FedRAMP High와 국방부(DoD)의 클라우드 컴퓨팅 보안 요구 사항 가이드(SRG)인 IL-4 및 IL-5 승인을 획득하며 이루어졌다. AWS GovCloud(US)는 미국 내에 물리적으로 위치하며 미국 시민에 의해 독점적으로 관리되는 리전으로, ITAR 및 CJIS 등 까다로운 규정 준수 프레임워크를 충족하도록 설계된 격리된 환경이다. 이번에 도입된 모델들은 아마존 베드록의 차세대 분산 추론 엔진인 맨틀(Mantle)을 통해 구동된다. 맨틀은 제로 운영자 액세스와 자동화된 용량 관리를 지원하며 오픈AI API 사양과 호환성을 갖춰 정부 기관의 기술 도입 장벽을 낮췄다. 특히 오픈AI의 GPT OSS 모델은 120B 및 20B 크기로 제공되며, 엔비디아의 네모트론 3 모델 제품군은 나노(Nano), 슈퍼(Super), 울트라(Ultra) 등 다양한 규모로 구성되어 에이전트 AI 애플리케이션에 최적화된 성능을 제공한다. 오픈 웨이트 모델이 가진 투명성은 정부 기관이 자체적인 위험 평가를 수행하고 제로 트러스트 원칙을 구현하는 데 기여할 것으로 보인다. 성능 측면에서 이번 모델들은 기존 상용 모델과 대등한 수준을 보여준다. 오픈AI의 gpt-oss-120b 모델은 핵심 추론 벤치마크에서 오픈AI o4-mini와 거의 동등한 성능을 기록했으며, 20b 모델은 o3-mini와 유사한 결과를 내면서도 16GB 메모리 환경의 엣지 디바이스에서 실행이 가능하다. 또한 엔비디아의 네모트론 3 나노 모델은 이전 세대인 네모트론 2 나노 대비 4배 높은 처리량을 제공하며 멀티 에이전트 시스템에서 초당 더 많은 토큰을 생성할 수 있도록 개선되었다. 이러한 기술적 진보는 정보 분석, 임무 계획, 보안 로그 분석 등 민감한 데이터를 다루는 정부 업무의 효율성을 높이는 핵심 동력이 될 전망이다. 미국 정부 기관은 그동안 민감한 데이터 처리와 엄격한 규정 준수 요구 사항으로 인해 상업용 클라우드 서비스 활용에 제약이 많았다. 이번 조치는 정부 기관이 데이터를 규제 경계 밖으로 이동시키지 않고도 최신 생성형 AI 기술을 활용할 수 있는 전환점이 될 것으로 평가된다. 특히 오픈 웨이트 모델의 도입은 폐쇄적인 환경에서도 AI 모델의 내부 구조를 파악하고 커스터마이징할 수 있는 유연성을 제공하여, 보안이 최우선인 국방 및 정보 커뮤니티의 AI 도입 속도를 가속화할 것으로 기대된다.