구글이 젬마(Gemma) 4 라인업의 새로운 모델인 'Gemma 4 12B'를 공식 발표했다. 이번 모델은 120억 개의 파라미터를 보유하면서도 16GB의 시스템 RAM 또는 VRAM 환경에서 구동되도록 최적화된 것이 핵심이다. 지난 4월 공개된 26B Mixture of Experts(MoE) 모델과 31B Dense 모델이 고성능 컴퓨팅 자원을 요구했던 것과 달리, 이번 12B 모델은 일반 소비자용 노트북에서도 로컬 AI 환경을 구축할 수 있는 효율성을 확보했다. 아파치 2.0(Apache 2.0) 라이선스를 채택해 상업적 활용의 문턱을 낮춘 점도 주목할 부분이다. 글로벌 시장에서는 메타(Meta)의 라마(Llama) 시리즈가 오픈 모델 생태계를 주도하고 있으나, 구글은 젬마를 통해 온디바이스 AI(On-device AI) 시장의 파편화된 수요를 공략하고 있다. 특히 12B라는 파라미터 규모는 복잡한 추론 작업과 로컬 실행 속도 사이에서 최적의 균형점을 찾으려는 시도로 풀이된다. 이는 고가의 AI 가속기 없이도 기업 내부망에서 보안을 유지하며 AI를 활용하려는 기업들의 요구와 맞닿아 있다. 한국 시장에서는 이러한 경량화 모델의 등장이 기업들의 온디바이스 AI 도입 속도를 앞당길 전망이다. 삼성전자는 갤럭시 북 시리즈와 연동된 AI 기능을 강화하고 있으며, LG전자의 그램(gram) 역시 로컬 AI 구동을 위한 하드웨어 최적화에 집중하고 있다. 네이버(NAVER)의 하이퍼클로바X(HyperCLOVA X)나 카카오의 코GPT(KoGPT)와 같은 거대 모델을 클라우드에서 운영하는 방식과 달리, 금융권인 KB금융, 신한금융, 하나금융 등은 고객 데이터 유출 방지를 위해 사내망 내 로컬 모델 도입을 검토 중이다. 또한 현대차는 차량용 인포테인먼트 시스템에, 우아한형제들은 배달 로봇 및 사내 업무 자동화 도구에 이러한 12B급 모델을 이식하여 클라우드 비용을 절감하려는 움직임을 보이고 있다. KT와 LG유플러스 역시 통신 인프라와 결합된 엣지 컴퓨팅 환경에서 젬마 4와 같은 오픈 모델을 활용한 특화 서비스 개발에 나설 것으로 보인다. 이러한 기술적 변화는 정부의 정책 방향과도 밀접하게 연결된다. 개인정보보호위원회와 과학기술정보통신부가 추진 중인 'AI 기본법' 및 관련 가이드라인은 데이터의 외부 유출을 최소화하는 온디바이스 AI 기술을 권장하는 추세다. 특히 금융위원회의 망 분리 규제 완화 흐름에 따라, 금융권이 로컬 환경에서 안전하게 AI를 구동할 수 있는 12B급 모델은 실질적인 대안이 될 수 있다. 향후 한국 시장에서는 단순히 모델의 성능을 겨루는 단계를 넘어, 16GB RAM 환경에서 얼마나 효율적으로 한국어 데이터를 처리하고 도메인 특화 성능을 낼 수 있는지가 도입의 핵심 지표가 될 것이다. 가장 빠르게 움직일 곳은 보안이 최우선인 금융권과 사내 데이터 보안을 중시하는 대기업 IT 부서가 될 것으로 예상된다.