검색 엔진 기반의 AI 서비스 기업 퍼플렉시티(Perplexity)가 자사의 자동화 도구인 '퍼플렉시티 컴퓨터(Perplexity Computer)'에 하이브리드 에이전트 추론(Hybrid Agentic Inference) 기술을 새롭게 적용한다. 이번 업데이트는 사용자의 기기 내에서 작동하는 로컬 모델과 외부 서버의 클라우드 모델을 유기적으로 결합해, 작업의 성격에 따라 연산 자원을 최적화하는 데 초점을 맞췄다. 하이브리드 에이전트 추론의 핵심은 데이터 처리의 효율성과 보안성 강화다. 기존의 AI 에이전트가 모든 명령을 클라우드로 전송해 처리하던 방식에서 벗어나, 민감한 개인정보나 단순 반복 작업은 기기 내부(On-device)에서 즉각 처리한다. 반면, 복잡한 논리적 추론이나 방대한 외부 데이터 검색이 필요한 작업은 클라우드 모델로 넘기는 방식을 채택했다. 이를 통해 사용자는 데이터 유출 우려를 줄이는 동시에, 클라우드 API 호출 횟수를 최적화하여 토큰 비용을 절감할 수 있게 된다. 이번 기술 도입은 최근 AI 업계의 화두인 '온디바이스 AI(On-device AI)'와 '클라우드 AI'의 공존 전략을 구체화한 사례로 평가된다. 그동안 기업들은 클라우드 기반의 거대언어모델(LLM)이 가진 높은 성능과 로컬 모델이 가진 빠른 응답 속도 사이에서 고민해 왔다. 퍼플렉시티의 이번 시도는 두 환경을 하이브리드 형태로 묶어, 사용자가 체감하는 지연 시간(Latency)을 최소화하고 서비스의 안정성을 높이려는 의도로 풀이된다. 특히 퍼플렉시티 컴퓨터와 같은 에이전트 기반 서비스에서 이러한 하이브리드 구조는 필수적인 요소로 자리 잡을 전망이다. 에이전트는 사용자의 PC 환경을 직접 제어하고 웹 브라우저를 조작하는 등 높은 권한을 요구하기 때문에, 보안 정책이 무엇보다 중요하다. 로컬 모델이 중간에서 필터링 역할을 수행함으로써, 외부로 전송되는 데이터의 범위를 최소화하는 보안 아키텍처가 가능해지기 때문이다. 업계 전문가들은 이번 업데이트가 단순한 기능 추가를 넘어, AI 에이전트의 실용성을 한 단계 끌어올릴 것으로 보고 있다. 과거의 AI 서비스가 단순히 질문에 답하는 수준이었다면, 이제는 사용자의 컴퓨터 환경에서 직접 작업을 수행하는 '실행형 AI'로 진화하고 있다. 퍼플렉시티는 이번 하이브리드 추론 기술을 통해 기업용 솔루션 시장에서도 경쟁력을 확보할 것으로 보인다. 데이터 프라이버시를 중시하는 기업 고객들에게 로컬 환경에서의 데이터 처리는 도입의 결정적인 요인이 될 수 있기 때문이다. 다만, 로컬 모델의 성능 한계와 클라우드 모델 간의 매끄러운 전환(Switching) 기술은 향후 해결해야 할 과제다. 기기 사양에 따라 AI의 성능 편차가 발생할 수 있다는 점은 대중화 과정에서 고려해야 할 변수다. 퍼플렉시티가 향후 어떤 모델 조합을 통해 하이브리드 추론의 완성도를 높여갈지, 그리고 이것이 기존의 클라우드 전용 AI 서비스들과의 점유율 경쟁에서 어떤 변수로 작용할지 귀추가 주목된다.