구글 딥마인드, 멀티모달 모델 '제미나이 옴니' 공개… 영상·음성 실시간 이해
구글 딥마인드 CEO 데미스 하사비스가 멀티모달 모델 '제미나이 옴니(Gemini Omni)'를 공개했다. 사진, 영상, 음성을 실시간으로 이해하고 새로운 장면을 생성할 수 있는 ...
구글 딥마인드 CEO 데미스 하사비스가 멀티모달 모델 '제미나이 옴니(Gemini Omni)'를 공개했다. 사진, 영상, 음성을 실시간으로 이해하고 새로운 장면을 생성할 수 있는 ...
구글 딥마인드 CEO 데미스 허사비스가 제미나이 3.5 플래시(Gemini 3.5 Flash)를 공개했다. 이전 버전인 3.1 프로보다 코딩 및 에이전트 작업 성능이 뛰어나며, 속...
LLM의 부정확성 및 정책 불일치 문제를 해결하기 위해 Reinforcement Fine-Tuning (RFT)이 모델 alignment의 핵심 방법으로 사용된다. RFT는 aut...
AI 모델 GPT-5에서 나타나는 '고블린 출력(goblin outputs)' 현상과 '개성 기반의 특이 행동(personality-driven quirks)'에 대한 연구 결과가...
중국 AI 기업 DeepSeek이 더 긴 프롬프트를 효율적으로 처리하며 선두 폐쇄형 모델과 성능이 동등한 플래그십 모델 V4를 공개했으며, 이는 Huawei Ascend 칩에 최적...
로봇 스타트업 Physical Intelligence는 학습되지 않은 작업을 스스로 파악할 수 있는 새로운 로봇 두뇌 모델 π0.7을 공개했습니다. 이는 범용 로봇 두뇌라는 오랜...
메타는 마우스 움직임과 버튼 클릭을 데이터로 변환하는 새로운 내부 도구를 개발했다. 이 데이터는 AI 모델 훈련에 활용될 예정이다.
OpenAI의 최신 이미지 생성 모델인 ChatGPT Images 2.0은 텍스트 생성에 놀라운 능력을 보여줍니다. 이는 지난 몇 년간 AI 역량이 얼마나 발전했는지 잘 보여줍니다...
중국 AI 기업 DeepSeek이 더 긴 프롬프트를 효율적으로 처리하는 새로운 플래그십 모델 V4를 공개했다. V4는 오픈 소스 모델이며, 주요 벤치마크에서 선도적인 클로즈드 소스...
중국 AI 기업 DeepSeek이 차세대 AI 모델 V4의 프리뷰를 공개하며, 이 오픈소스 모델이 Anthropic, Google, OpenAI 등 미국 경쟁사의 선도적인 클로즈드...
OpenAI가 GPT-5.5를 출시했습니다. 이 최신 모델은 광범위한 분야에 걸쳐 향상된 기능을 제공합니다.
앤트로픽의 AI 모델 클로드 미토스가 소수의 권한 없는 사용자들에게 유출되었다. 앤트로픽은 미토스가 사이버 보안 능력이 뛰어나 공개하기 위험하다고 주장해왔기에, AI 안전을 강조해...