Mantis Biotech is making ‘digital twins’ of humans to help solve medicine’s data availability problem
## 맨티스 바이오테크, '디지털 트윈'으로 의료 데이터 부족 문제 해결 나선다
**[뉴욕]** 뉴욕 기반의 맨티스 바이오테크(Mantis Biotech)가 의료 분야의 고질적인 데이터 부족 문제를 해결하기 위해 인간의 '디지털 트윈(digital twin)'을 개발하고 있다고 밝혔다. 이 회사의 플랫폼은 다양한 데이터를 통합하여 물리 기반의 예측 모델을 생성, 희귀 질환 등 데이터 확보가 어려운 영역에서 대규모 언어 모델(LLM)의 활용도를 높일 것으로 기대된다.
방대한 데이터셋으로 훈련된 대규모 언어 모델(LLM)은 유전체 연구 가속화, 임상 문서 간소화, 실시간 진단 개선 등 생물의학 연구에 혁신을 가져올 잠재력을 가지고 있다. 그러나 의료 분야에서 활용되는 정형화된 데이터를 넘어 희귀 질환이나 특이한 조건과 같은 '엣지 케이스(edge cases)'에서는 신뢰할 수 있는 대표 데이터가 부족하여 병목 현상을 겪어왔다. 맨티스 바이오테크는 이러한 데이터 가용성 격차를 메우기 위한 솔루션을 개발 중이며, 이들의 플랫폼은 이질적인 데이터 소스를 통합하여 인체 해부학, 생리학, 행동을 예측하는 물리 기반의 '디지털 트윈'을 구축하는 합성 데이터셋을 만든다.
이 디지털 트윈은 데이터 집계 및 분석에 활용될 수 있다. 새로운 의료 시술 연구 및 테스트, 수술 로봇 훈련, 의료 문제 또는 행동 패턴 시뮬레이션 및 예측 등에 사용될 수 있다. 예를 들어, 맨티스의 창립자이자 CEO인 조지아 위첼(Georgia Witchel)은 최근 인터뷰에서 스포츠팀이 특정 NFL 선수의 최근 성과, 훈련량, 식단, 활동 기간 등을 기반으로 아킬레스건 부상 가능성을 예측할 수 있다고 설명했다.
디지털 트윈을 구축하기 위해 맨티스 플랫폼은 교과서, 모션 캡처 카메라, 생체 인식 센서, 훈련 기록, 의료 영상 등 다양한 소스에서 데이터를 수집한다. 이후 LLM 기반 시스템을 사용하여 다양한 데이터 스트림을 라우팅, 검증, 합성하고, 이 모든 정보를 물리 엔진(physics engine)을 통해 실행하여 고충실도(high-fidelity) 데이터셋 렌더링을 생성한다. 이는 예측 모델 훈련에 사용된다. 위첼 CEO는 물리 엔진 계층이 생성된 합성 데이터를 현실적으로 모델링하고 해부학적 물리를 기반으로 함으로써 가용 정보를 향상시키는 핵심적인 역할을 한다고 강조했다. 그녀는 "손가락이 없는 사람의 손 자세 추정을 요청받는다면, 해당 데이터셋이 공개적으로 없기 때문에 매우 어려울 것이다. 우리는 물리 모델에서 손가락 X를 제거하고 모델을 재생성함으로써 해당 데이터셋을 매우 쉽게 생성할 수 있다"고 덧붙였다.
맨티스 플랫폼이 데이터 소스의 격차를 메우는 만큼, 위첼 CEO는 이 기술이 의료 절차나 환자 정보 접근이 어렵거나, 비정형적이거나, 여러 소스에 분산되어 있는 생물의학 산업 전반에 걸쳐 광범위하게 사용될 잠재력이 있다고 본다. 특히 환자 데이터를 공공 데이터셋에 포함하거나 AI 모델 훈련에 사용하는 것에 대한 윤리적, 규제적 제약이 있는 희귀 질환이나 엣지 케이스에서 데이터 확보의 어려움을 해소하는 데 기여할 것으로 기대된다.
원문: https://techcrunch.com/2026/03/30/mantis-biotech-is-making-digital-twins-of-humans-to-help-solve-medicines-data-availability-problem/
한국 시장에 주는 의미
국내 의료 AI 시장은 개인정보보호법과 민감 의료 데이터 활용 규제로 인해 모델 학습용 데이터 확보에 큰 제약을 겪고 있다. 맨티스 바이오테크의 물리 엔진 기반 합성 데이터 생성 방식은 이러한 규제 장벽을 우회할 수 있는 대안으로, 국내 의료 AI 스타트업들이 희귀 질환이나 특수 수술 케이스 등 데이터 부족 문제를 해결하는 기술적 돌파구가 될 수 있다. 향후 국내 기업들은 단순 LLM 도입을 넘어, 물리적 정합성을 보장하는 디지털 트윈 기술을 결합해 의료 현장의 신뢰성을 확보하는 방향으로 경쟁력을 강화해야 할 것이다.
이 이슈의 흐름
최근 AI 업계는 단순 텍스트 생성을 넘어 실시간 데이터 연동과 물리적 환경 시뮬레이션 등 실질적인 문제 해결을 위한 에이전트 및 모델 고도화에 집중하고 있다. 퍼플렉시티가 데이터 웨어하우스와 연동해 분석 정확도를 높이고, 오픈AI가 보안 및 코딩 효율성을 강조하는 등 AI의 활용 범위가 산업 현장의 구체적인 워크플로로 침투하는 추세다. 맨티스 바이오테크의 디지털 트윈 기술 역시 이러한 흐름의 연장선에서, 데이터가 부족한 의료 분야의 병목 현상을 물리 엔진과 LLM의 결합으로 해결하려는 시도로 해석된다.
- AWS, EC2 캐퍼시티 블록으로 단기 GPU 용량 확보 방안 제시 AWS ML Blog · 05/17
- 데이터 브로커 500곳 자동 옵트아웃 도구 공개… 개인정보 보호 오픈소스 프로젝트 Hacker News · 05/20
- 구글·퓨처하우스 AI, 약물 재배치 연구 가속화… 과학적 가설 검증의 새 지평 열어 Ars Technica · 05/20
- 샌드박스AQ, 신약 개발 AI 모델 클로드(Claude)에 통합… 접근성 대폭 개선 TechCrunch · 05/20
- 파이브서티에이트 과거 기사 한눈에… 벤 웰시, 인터넷 아카이브 기반 인덱스 구축 Hacker News · 05/20