구글 I/O 2025의 핵심은 단연 Gemini AI 모델의 발전과 전방위적인 통합이었습니다. 구글은 Gemini를 단순한 AI 모델을 넘어, 자사 생태계 전반을 관통하는 지능형 엔진으로 자리매김시키고 있습니다.
Gemini 2.5 모델 시리즈 (Pro, Flash) 및 기타 특화 모델
- Gemini 2.5 Pro: 향상된 추론 능력, 멀티모달 기능 강화, 코딩 능력 및 효율성 증대에 초점을 맞추었습니다. 특히 Deep Think 기능을 탑재하여 복잡한 문제 해결을 위한 향상된 추론 모드를 제공합니다.
- Gemini 2.5 Flash: 속도와 효율성에 최적화되었습니다.
- Gemini Nano: 온디바이스 AI를 담당하며, 이제 멀티모달 기능을 지원하여 Chrome 및 Android에서 개인 정보 보호 강화, 지연 시간 감소, 비용 절감 효과를 제공합니다.
- Gemini Live: 이전에 Project Astra의 일부였던 대화형 AI로, 카메라 및 화면 공유 기능을 갖추고 이제 모든 Android 및 iOS 사용자에게 무료로 제공되어 멀티모달 상호작용을 촉진합니다.
- 특정 분야 특화 모델: MedGemma (멀티모달 의료 텍스트 및 이미지 이해), SignGemma (수어 번역), PaliGemma (이미지 캡션 및 시각적 질의응답), Gemini Diffusion (빠른 텍스트-이미지 생성).
- 개방형 모델: 접근성 높은 최신 개방형 모델인 Gemma 3n Preview도 소개되었습니다.

개발자 도구 및 플랫폼 측면
- Google AI Studio와 Vertex AI: 개발자들이 Gemini API를 사용하여 Imagen, Veo와 같은 생성형 미디어 모델을 포함한 Gemini 2.5 모델에 접근하고 AI 애플리케이션을 구축할 수 있는 주요 플랫폼입니다. Vertex AI는 Gemini 2.5 Flash 및 Pro를 위한 새로운 기능(예: 사고 요약)을 제공합니다.
- Gemini Code Assist: 개인 및 GitHub용으로 이제 정식 출시되어 Gemini 2.5로 구동되며, 1백만 토큰 컨텍스트 창을 지원합니다.
- Jules: 비동기식 자율 코딩 에이전트로, 이제 공개 베타 버전으로 제공되어 버그 백로그 처리 및 새로운 기능 구축과 같은 작업을 수행할 수 있습니다.
- Firebase Studio: 풀스택 AI 앱 개발을 위한 새로운 클라우드 기반 AI 작업 공간으로, Figma 디자인을 앱으로 전환하는 기능을 포함합니다.
- Stitch: 자연어나 이미지를 사용하여 UI 디자인과 프론트엔드 코드를 생성하는 AI 기반 도구입니다.
- Native Audio Output & Live API: Gemini 2.5 Flash 모델용으로, 능동적인 비디오/오디오 및 감성적인 대화를 가능하게 합니다.
이러한 발표들은 Gemini가 구글의 기초 AI로서 모든 제품군에 스며들고 있음을 분명히 보여줍니다. 다양한 모델과 개발자 도구의 출시는 개발자 역량 강화와 AI 도입 가속화를 통해 구글 중심의 AI 개발 환경을 조성하려는 전략을 시사합니다. 이는 구글이 AI 시대를 선도하려는 강력한 의지를 보여주는 동시에, AI 기술의 민주화를 통해 더욱 광범위한 혁신을 촉진하려는 전략으로 해석됩니다.
표 1: I/O 2025 주요 Gemini 모델 및 개발자 도구 개요
모델/도구 명칭 | 주요 기능 | 대상 애플리케이션/사용자 | 가용성/출처 |
---|---|---|---|
Gemini 2.5 Pro | Deep Think (향상된 추론), 멀티모달, 코딩, 1백만 토큰 컨텍스트 창 | 복잡한 문제 해결, 고급 AI 애플리케이션 개발자 | Vertex AI, Google AI Studio |
Gemini 2.5 Flash | 속도 및 효율성 최적화, 멀티모달, 코딩 | 빠른 응답이 필요한 작업, 대규모 애플리케이션 | Vertex AI, Google AI Studio |
Gemini Nano | 온디바이스 AI, 멀티모달, 개인 정보 보호 강화, 저지연, 저비용 | 모바일 및 Chrome 내장 AI 기능 (요약, 번역 등) | Chrome 138부터 |
MedGemma | 멀티모달 의료 텍스트 및 이미지 이해 | 의료 AI 애플리케이션 개발자 | |
SignGemma | 수어-텍스트 번역 | 청각 장애인 사용자를 위한 앱 및 통합 기능 개발자 | 예정 |
PaliGemma | 이미지 캡션, 시각적 질의응답 (VQA) | 시각 정보 이해 애플리케이션 개발자 | |
Gemini Diffusion | 빠른 텍스트-이미지 생성 | 이미지 생성 애플리케이션 개발자 | 연구 모델 |
Gemma 3n Preview | 접근성 높은 개방형 AI 모델, 유연성, 개인 정보 보호, 모바일 멀티모달 기능 확장 | 개방형 모델 기반 AI 개발자 | 프리뷰 |
Google AI Studio | Gemini API 활용 프로토타이핑, Gemini 2.5 및 생성형 미디어 모델 접근 | AI 애플리케이션 개발자 | |
Vertex AI | Gemini 2.5 모델 배포 및 관리, 사고 요약 기능 | 엔터프라이즈 AI 애플리케이션 개발자 | |
Gemini Code Assist | AI 코딩 도우미 (개인 및 GitHub용), Gemini 2.5 기반, 1백만 토큰 컨텍스트 창 | 소프트웨어 개발자 | 정식 출시 |
Jules | 비동기식 자율 코딩 에이전트 (버그 수정, 기능 구축) | 소프트웨어 개발자 | 공개 베타 |
Firebase Studio | 클라우드 기반 AI 작업 공간, Figma 디자인-앱 전환, 풀스택 AI 앱 개발 | 모바일 및 웹 AI 애플리케이션 개발자 | |
Stitch | 자연어/이미지 기반 UI 디자인 및 프론트엔드 코드 생성 | UI/UX 디자이너, 프론트엔드 개발자 | |
Native Audio Output & Live API | Gemini 2.5 Flash 모델용, 능동적 비디오/오디오 감지, 감성적 대화 출력 | 대화형 AI 경험 개발자 | 프리뷰 |
Gemini 2.5: Our most intelligent models are getting even better