퍼플렉시티, '하이브리드 에이전트 추론' 도입… 로컬·클라우드 결합으로 데이터 보안과 효율성 잡는다
검색 엔진 기반의 AI 서비스 기업 퍼플렉시티(Perplexity)가 자사의 자동화 도구인 '퍼플렉시티 컴퓨터(Perplexity Computer)'에 하이브리드 에이전트 추론(Hybrid Agentic Inference) 기술을 새롭게 적용한다. 이번 업데이트는 사용자의 기기 내에서 작동하는 로컬 모델과 외부 서버의 클라우드 모델을 유기적으로 결합해, 작업의 성격에 따라 연산 자원을 최적화하는 데 초점을 맞췄다.
하이브리드 에이전트 추론의 핵심은 데이터 처리의 효율성과 보안성 강화다. 기존의 AI 에이전트가 모든 명령을 클라우드로 전송해 처리하던 방식에서 벗어나, 민감한 개인정보나 단순 반복 작업은 기기 내부(On-device)에서 즉각 처리한다. 반면, 복잡한 논리적 추론이나 방대한 외부 데이터 검색이 필요한 작업은 클라우드 모델로 넘기는 방식을 채택했다. 이를 통해 사용자는 데이터 유출 우려를 줄이는 동시에, 클라우드 API 호출 횟수를 최적화하여 토큰 비용을 절감할 수 있게 된다.
이번 기술 도입은 최근 AI 업계의 화두인 '온디바이스 AI(On-device AI)'와 '클라우드 AI'의 공존 전략을 구체화한 사례로 평가된다. 그동안 기업들은 클라우드 기반의 거대언어모델(LLM)이 가진 높은 성능과 로컬 모델이 가진 빠른 응답 속도 사이에서 고민해 왔다. 퍼플렉시티의 이번 시도는 두 환경을 하이브리드 형태로 묶어, 사용자가 체감하는 지연 시간(Latency)을 최소화하고 서비스의 안정성을 높이려는 의도로 풀이된다.
특히 퍼플렉시티 컴퓨터와 같은 에이전트 기반 서비스에서 이러한 하이브리드 구조는 필수적인 요소로 자리 잡을 전망이다. 에이전트는 사용자의 PC 환경을 직접 제어하고 웹 브라우저를 조작하는 등 높은 권한을 요구하기 때문에, 보안 정책이 무엇보다 중요하다. 로컬 모델이 중간에서 필터링 역할을 수행함으로써, 외부로 전송되는 데이터의 범위를 최소화하는 보안 아키텍처가 가능해지기 때문이다.
업계 전문가들은 이번 업데이트가 단순한 기능 추가를 넘어, AI 에이전트의 실용성을 한 단계 끌어올릴 것으로 보고 있다. 과거의 AI 서비스가 단순히 질문에 답하는 수준이었다면, 이제는 사용자의 컴퓨터 환경에서 직접 작업을 수행하는 '실행형 AI'로 진화하고 있다. 퍼플렉시티는 이번 하이브리드 추론 기술을 통해 기업용 솔루션 시장에서도 경쟁력을 확보할 것으로 보인다. 데이터 프라이버시를 중시하는 기업 고객들에게 로컬 환경에서의 데이터 처리는 도입의 결정적인 요인이 될 수 있기 때문이다.
다만, 로컬 모델의 성능 한계와 클라우드 모델 간의 매끄러운 전환(Switching) 기술은 향후 해결해야 할 과제다. 기기 사양에 따라 AI의 성능 편차가 발생할 수 있다는 점은 대중화 과정에서 고려해야 할 변수다. 퍼플렉시티가 향후 어떤 모델 조합을 통해 하이브리드 추론의 완성도를 높여갈지, 그리고 이것이 기존의 클라우드 전용 AI 서비스들과의 점유율 경쟁에서 어떤 변수로 작용할지 귀추가 주목된다.
※ 이 바이라인은 AIDEN이 운영하는 가상의 편집 페르소나이며, 실존 인물이 아닙니다. 소개
한국 시장에 주는 의미
국내 기업들은 데이터 주권과 보안 규제로 인해 클라우드 기반 AI 도입을 주저하는 경향이 강한데, 퍼플렉시티의 하이브리드 방식은 이러한 도입 장벽을 낮추는 실질적인 대안이 될 수 있다. 특히 사내망 내에서 민감 정보를 처리하고 복잡한 연산만 클라우드로 넘기는 아키텍처는 국내 금융·공공 분야의 온디바이스 AI 도입 전략에 중요한 기술적 이정표가 될 것이다.
이 이슈의 흐름
AI 에이전트 시장은 단순 질의응답을 넘어 사용자의 PC 환경을 직접 제어하는 실행형 AI로 진화하고 있으며, 이에 따라 보안과 효율성을 동시에 잡기 위한 온디바이스와 클라우드 결합이 핵심 경쟁력으로 부상했다. 퍼플렉시티의 이번 업데이트는 클라우드 의존도를 낮추고 로컬 연산을 강화함으로써 에이전트의 실용성을 극대화하려는 시도다. 이는 AWS가 아마존 베드록을 통해 산업 현장에 특화된 모델을 배포하며 기업용 MLOps 효율화를 꾀하는 흐름과 맞물려, AI 서비스가 범용 모델에서 특정 작업 환경에 최적화된 하이브리드 구조로 재편되고 있음을 보여준다.
- 아마존 세이지메이커, LLM 추론 관측성 강화… GPU 활용도부터 품질까지 통합 모니터링 AWS ML Blog · 05/30
- 퍼플렉시티, 애플 헬스 연동… 수면·심박변이도 등 개인 건강 데이터 분석 지원 X/Twitter · 06/03
- 구글 딥마인드, 과학 연구 가속화하는 멀티 에이전트 시스템 '코-사이언티스트' 공개 X/Twitter · 06/03
- Verizon Connect, AWS 기반 에이전트 AI로 10만 사용자 데이터 분석 자동화 AWS ML Blog · 05/31
- 엔비디아, 마이클 델과 손잡고 차세대 AI 인프라 공개 예고… 컴퓨팅 시장 파장 예고 X/Twitter · 05/31