AWS 세이지메이커 비동기 추론, 인라인 페이로드 지원으로 AI 운영 효율 높인다
아마존웹서비스(AWS)가 자사의 기계 학습 모델 관리 서비스인 아마존 세이지메이커(Amazon SageMaker)의 비동기 추론 기능에 인라인 요청 페이로드 지원을 추가했다. 기존에는 비동기 추론을 위해 입력 데이터를 아마존 S3에 먼저 업로드한 뒤 해당 객체의 URI를 InvokeEndpointAsync API에 전달하는 2단계 과정을 거쳐야 했다. 이번 업데이트로 고객은 최대 128,000바이트(약 128KB)의 페이로드를 API 요청 본문에 직접 담아 전송할 수 있게 됐다. 이는 네트워크 왕복 횟수를 줄이고 클라이언트 측 코드를 간소화하여 비동기 추론 워크로드의 운영 복잡성을 낮추는 결과로 이어진다.
비동기 추론 방식은 대규모 페이로드 처리에 최적화된 옵션이다. 이전 방식인 S3 업로드를 활용하면 최대 1GB 크기의 데이터까지 처리할 수 있었으나, 이번 인라인 페이로드 방식은 128KB 이하의 소규모 데이터 처리에 특화되어 있다. 실시간 추론이 밀리초 단위의 지연 시간을 요구하는 것과 달리, 비동기 추론은 수 초에서 수 분의 지연 시간을 허용하는 워크로드에 적합하다. 특히 요청이 없을 때 인스턴스 수를 0으로 자동 확장하는 기능을 통해 비용 효율성을 극대화할 수 있다는 점이 강점이다.
한국 시장은 높은 AI 수용도를 바탕으로 생성형 AI와 에이전틱 AI 도입을 빠르게 확대하고 있다. 네이버, 카카오, 삼성, SK, LG, KT, LG유플러스, 현대차, KB금융, 신한금융, 하나금융 등 국내 주요 기업들은 자체 AI 모델 훈련과 글로벌 시장 진출을 위해 AWS의 인프라를 적극 활용 중이다. 특히 우아한형제들과 같은 플랫폼 기업들은 서비스 운영 효율을 위해 세이지메이커의 다양한 추론 옵션을 검토하고 있다. 국내 기업들은 이번 인라인 페이로드 지원을 통해 소규모 데이터를 활용한 AI 모델 배포 시 불필요한 데이터 이동 과정을 생략함으로써 운영 비용을 절감하고 개발 속도를 높일 수 있을 것으로 보인다.
AWS는 한국을 핵심 AI 전략 시장으로 규정하고 국내 기업의 산업별 AI 전환(AX) 역량 강화를 지원하고 있다. 개인정보보호위원회와 과기정통부 등 정부 당국이 마련한 AI 기본법과 관련 규제 가이드라인을 준수하면서도, 국내 기업들이 글로벌 수준의 AI 서비스를 안정적으로 운영할 수 있도록 기술적 토대를 제공하는 것이 핵심이다. 향후 국내 시장에서는 데이터 처리 효율성을 극대화한 기업들이 AI 에이전트 중심의 기술 생태계에서 가장 빠르게 경쟁 우위를 점할 것으로 예상된다.
한국 시장에 주는 의미
한국 기업들은 높은 AI 수용도를 보이며 생성형 AI 및 에이전틱 AI 도입을 확대하고 있다. AWS는 한국을 핵심 AI 전략 시장으로 보고 있으며, 국내 기업의 AI 모델 훈련 및 글로벌 시장 진출을 지원하고 있다. 이번 SageMaker 비동기 추론의 인라인 페이로드 지원은 특히 소규모 페이로드를 사용하는 한국 기업들이 AI 모델을 더 쉽고 효율적으로 배포하고 운영할 수 있도록 하여, AI 도입 가속화 및 비용 절감에 기여할 것으로 예상된다.
이 이슈의 흐름
Amazon SageMaker는 기계 학습 모델을 구축, 훈련 및 배포하기 위한 AWS의 완전 관리형 서비스이다. 2021년 8월, AWS는 대규모 페이로드와 긴 처리 시간을 가진 워크로드를 위해 비동기 추론 기능을 도입했다. 이 기능은 요청을 큐에 넣고 비동기적으로 처리하며, 유휴 시 인스턴스 수를 0으로 자동 확장하여 비용 효율성을 높였다. 초기에는 모든 비동기 추론 요청에 S3 업로드가 필수적이었으나, 이번 인라인 페이로드 지원을 통해 소규모 데이터에 대한 추론 워크플로우가 더욱 간소화되었다. 이는 AI 모델 배포 및 운영의 편의성을 지속적으로 개선하려는 AWS의 노력의 일환이다.
- AWS 세이지메이커, 컨테이너 캐싱으로 AI 추론 확장 속도 2배 높인다 AWS ML Blog · 06/17
- AWS 세이지메이커, 생성형 AI 추론 모니터링 및 디버깅 기능 강화 AWS ML Blog · 06/21
- AWS, 에이전트 AI 안전성 높이는 InvokeGuardrailChecks API 출시 AWS ML Blog · 06/17
- AWS, Bedrock AgentCore 업데이트로 AI 에이전트 실무 활용도 높인다 AWS ML Blog · 06/21
- AWS, 자율 에이전트 탑재한 Amazon Quick 공개…업무 자동화 가속 AWS ML Blog · 06/21