앤스로픽(Anthropic)이 최근 공개한 최신 인공지능 모델 'Claude Fable 5'가 생물학 관련 기초 질문에 대해 답변을 거부하는 사례가 확인됐다. 해당 모델은 사용자가 생물학적 지식을 묻는 질문을 입력할 경우, 직접적인 답변을 제공하는 대신 이전 버전인 'Claude Opus 4.8'로 연결하는 우회 설계를 적용했다. 이는 생성형 AI의 오남용을 방지하기 위한 앤스로픽의 고도화된 안전 정책이 반영된 결과로 풀이된다. 이번 조치는 AI 모델이 생물학적 위험 물질 제조나 유해 정보 생성에 악용될 가능성을 원천 차단하려는 의도로 분석된다. 앤스로픽은 그간 '헌법적 AI(Constitutional AI)' 개념을 도입해 모델의 윤리적 가이드라인을 설정해 왔으며, 이번 Fable 5 모델에서는 특정 민감 분야에 대한 추론(inference) 과정을 더욱 엄격하게 통제하고 있다. 특히 생물학 분야는 잠재적 위험도가 높다고 판단하여, 모델의 답변 생성 권한을 제한하고 검증된 이전 모델로 처리를 이관하는 방식을 택한 것이다. 이러한 설계는 AI 업계의 안전성 강화 흐름을 상징적으로 보여준다. 과거 모델들이 질문의 의도와 상관없이 방대한 데이터를 기반으로 답변을 생성했다면, 이제는 특정 도메인에서 모델의 답변 능력을 의도적으로 제한하는 '안전 우선(Safety-first)' 설계가 표준으로 자리 잡고 있다. 이는 단순히 답변을 거부하는 것을 넘어, 모델의 지식 범위를 제어함으로써 발생 가능한 사고를 예방하려는 전략적 선택이다. 다만, 이러한 방식은 사용자 경험 측면에서 논란의 여지가 있다. 사용자가 단순한 학술적 질문을 던졌음에도 불구하고 모델이 답변을 거부하고 다른 모델로 연결하는 과정은 작업의 흐름을 끊고 효율성을 저하시킬 수 있기 때문이다. 또한, 어떤 기준에서 '생물학적 위험'을 판단하고 답변을 차단하는지에 대한 투명성 확보가 향후 과제로 남는다. 앤스로픽이 설정한 차단 기준이 지나치게 보수적일 경우, 일반적인 연구나 학습 목적의 사용자들까지 불편을 겪을 가능성이 크다. 결과적으로 앤스로픽의 이번 행보는 AI 모델의 성능 경쟁에서 안전성 관리 경쟁으로 시장의 무게중심이 이동하고 있음을 시사한다. Claude Fable 5와 Claude Opus 4.8을 연동하는 하이브리드 방식은 향후 다른 AI 기업들이 위험 관리 모델을 구축할 때 참고할 만한 사례가 될 것으로 보인다. 기술적 고도화와 안전성 확보라는 두 마리 토끼를 잡기 위한 앤스로픽의 실험이 실제 사용자 환경에서 어떤 평가를 받을지 주목된다.