휴머노이드 로봇 훈련, 재택 긱 워커가 핵심 데이터 공급
휴머노이드 로봇 개발 경쟁이 가속화되면서, 로봇 학습에 필수적인 실제 세계 데이터 수집 방식이 새로운 산업 트렌드로 부상하고 있습니다. 특히 전 세계 긱 워커들이 가정에서 일상 활동을 촬영하며 이 데이터 공급의 핵심 주체로 자리매김하고 있습니다.
미국 팔로알토에 본사를 둔 마이크로1(Micro1)과 같은 데이터 수집 전문 기업들은 테슬라, 피규어 AI(Figure AI), 애질리티 로보틱스(Agility Robotics) 등 휴머노이드 로봇 개발사들에 데이터를 판매하고 있습니다. 이들은 인도, 나이지리아, 아르헨티나 등 50개국 이상에서 수천 명의 계약직 근로자를 고용해 로봇 훈련용 영상을 확보하고 있습니다. 이들 긱 워커는 아이폰을 머리에 부착하고 빨래 개기, 설거지, 요리 등 다양한 가사 활동을 직접 촬영합니다.
나이지리아의 한 의대생인 제우스(Zeus)는 이 일을 통해 시간당 15달러를 벌고 있으며, 이는 현지 경제 상황을 고려할 때 상당한 수입입니다. 이처럼 긱 워커들의 활동은 현지 경제 활성화에 기여하지만, 동시에 사생활 침해 및 정보 동의와 관련된 윤리적 문제도 제기되고 있습니다. 반복적인 단순 작업으로 인해 지루함을 느끼는 경우도 많습니다.
휴머노이드 로봇은 물리적 객체를 조작하는 능력이 특히 개발하기 어렵습니다. 그러나 챗GPT와 같은 대규모 언어 모델(LLM)의 성공은 로봇 분야에도 데이터 기반 학습 패러다임 전환을 가져왔습니다. 연구자들은 방대한 텍스트 데이터로 언어 모델이 학습했듯이, 로봇도 대규모 움직임 데이터를 통해 실제 세계와 상호작용하는 법을 배울 수 있다고 보고 있습니다. 가상 시뮬레이션은 로봇의 곡예 동작 훈련에는 유용하지만, 물리적 상호작용의 정확한 모델링에는 한계가 있어 실제 세계 데이터의 중요성이 더욱 커지고 있습니다.
이러한 데이터 확보의 중요성 때문에 투자자들의 관심도 뜨겁습니다. 2025년에 휴머노이드 로봇 분야에 60억 달러 이상이 투자되었으며, 재택 데이터 기록은 전 세계적으로 급성장하는 긱 경제의 한 축이 되었습니다. 스케일 AI(Scale AI), 엔코드(Encord) 같은 데이터 기업들도 자체적인 데이터 기록 인력을 모집하고 있으며, 도어대시(DoorDash)는 배달 기사들에게 가사 활동 촬영 대가를 지불하기도 합니다. 중국에서는 수십 개의 국영 로봇 훈련 센터에서 근로자들이 가상현실 헤드셋과 외골격 장치를 착용하고 로봇에게 전자레인지 열기나 테이블 닦기 등을 가르치고 있습니다. 마이크로1의 CEO는 로봇 기업들이 실제 세계 데이터 구매에 연간 1억 달러 이상을 지출하고 있다고 추정하며, 이 시장의 빠른 성장을 강조했습니다.
한국 시장에 주는 의미
국내 로봇 기업들은 자체적인 데이터 수집 인프라를 구축하는 대신, 글로벌 긱 워커 플랫폼을 활용한 데이터 확보 전략을 검토해야 하는 시점에 직면했다. 특히 한국의 높은 인건비와 데이터 개인정보보호 규제를 고려할 때, 해외 저임금 노동력을 활용한 데이터 수집 모델은 비용 효율성 측면에서 매력적이나, 데이터 주권과 윤리적 리스크를 관리할 수 있는 국내형 데이터 거버넌스 체계 마련이 필수적이다.
이 이슈의 흐름
휴머노이드 로봇 학습은 가상 시뮬레이션의 한계를 극복하기 위해 실제 인간의 동작을 모방하는 데이터 중심 학습으로 빠르게 이동하고 있다. 이는 LLM이 텍스트 데이터로 지능을 구현했듯, 로봇은 물리적 상호작용 데이터를 통해 지능을 습득해야 한다는 기술적 합의에 기반한다. 현재 테슬라와 피규어 AI 등 선도 기업들은 데이터 수집 전문 기업을 통해 전 세계 긱 워커를 동원하며 데이터 확보 경쟁을 벌이고 있으며, 이는 로봇 산업이 단순 하드웨어 제조를 넘어 대규모 데이터 처리 역량을 갖춘 'AI 팩토리'로 진화하고 있음을 시사한다.
- 샘 올트먼, 와이콤비네이터 스타트업에 200만 달러 규모 API 크레딧 지원 X/Twitter · 05/20
- AI 자동화 시대의 역설, 개발자 본연의 사고력 회복을 위한 '도그마 25' 선언 Hacker News · 05/20
- 오픈AI, 기업용 API 장기 약정 도입… 토큰 할인 및 컴퓨팅 자원 우선 확보 X/Twitter · 05/20
- 랭체인 공동 창립자 해리슨 체이스, 랭스미스 엔진 구축 노하우 공개 X/Twitter · 05/20
- AI 칩 생산 집중 여파… 메인보드 판매량 25% 이상 급감 Hacker News · 05/17