3. Google I/O 2025 Gemini를 비롯한 AI 관련 주요 내용과 시사점

구글 I/O 2025의 핵심은 단연 Gemini AI 모델의 발전과 전방위적인 통합이었습니다. 구글은 Gemini를 단순한 AI 모델을 넘어, 자사 생태계 전반을 관통하는 지능형 엔진으로 자리매김시키고 있습니다.

Gemini 2.5 모델 시리즈 (Pro, Flash) 및 기타 특화 모델

  • Gemini 2.5 Pro: 향상된 추론 능력, 멀티모달 기능 강화, 코딩 능력 및 효율성 증대에 초점을 맞추었습니다. 특히 Deep Think 기능을 탑재하여 복잡한 문제 해결을 위한 향상된 추론 모드를 제공합니다.
  • Gemini 2.5 Flash: 속도와 효율성에 최적화되었습니다.
  • Gemini Nano: 온디바이스 AI를 담당하며, 이제 멀티모달 기능을 지원하여 Chrome 및 Android에서 개인 정보 보호 강화, 지연 시간 감소, 비용 절감 효과를 제공합니다.
  • Gemini Live: 이전에 Project Astra의 일부였던 대화형 AI로, 카메라 및 화면 공유 기능을 갖추고 이제 모든 Android 및 iOS 사용자에게 무료로 제공되어 멀티모달 상호작용을 촉진합니다.
  • 특정 분야 특화 모델: MedGemma (멀티모달 의료 텍스트 및 이미지 이해), SignGemma (수어 번역), PaliGemma (이미지 캡션 및 시각적 질의응답), Gemini Diffusion (빠른 텍스트-이미지 생성).
  • 개방형 모델: 접근성 높은 최신 개방형 모델인 Gemma 3n Preview도 소개되었습니다.
deep think chart.width 1000.format webp

개발자 도구 및 플랫폼 측면

  • Google AI Studio와 Vertex AI: 개발자들이 Gemini API를 사용하여 Imagen, Veo와 같은 생성형 미디어 모델을 포함한 Gemini 2.5 모델에 접근하고 AI 애플리케이션을 구축할 수 있는 주요 플랫폼입니다. Vertex AI는 Gemini 2.5 Flash 및 Pro를 위한 새로운 기능(예: 사고 요약)을 제공합니다.
  • Gemini Code Assist: 개인 및 GitHub용으로 이제 정식 출시되어 Gemini 2.5로 구동되며, 1백만 토큰 컨텍스트 창을 지원합니다.
  • Jules: 비동기식 자율 코딩 에이전트로, 이제 공개 베타 버전으로 제공되어 버그 백로그 처리 및 새로운 기능 구축과 같은 작업을 수행할 수 있습니다.
  • Firebase Studio: 풀스택 AI 앱 개발을 위한 새로운 클라우드 기반 AI 작업 공간으로, Figma 디자인을 앱으로 전환하는 기능을 포함합니다.
  • Stitch: 자연어나 이미지를 사용하여 UI 디자인과 프론트엔드 코드를 생성하는 AI 기반 도구입니다.
  • Native Audio Output & Live API: Gemini 2.5 Flash 모델용으로, 능동적인 비디오/오디오 및 감성적인 대화를 가능하게 합니다.
Native Audio Outputs

이러한 발표들은 Gemini가 구글의 기초 AI로서 모든 제품군에 스며들고 있음을 분명히 보여줍니다. 다양한 모델과 개발자 도구의 출시는 개발자 역량 강화와 AI 도입 가속화를 통해 구글 중심의 AI 개발 환경을 조성하려는 전략을 시사합니다. 이는 구글이 AI 시대를 선도하려는 강력한 의지를 보여주는 동시에, AI 기술의 민주화를 통해 더욱 광범위한 혁신을 촉진하려는 전략으로 해석됩니다.


표 1: I/O 2025 주요 Gemini 모델 및 개발자 도구 개요

모델/도구 명칭주요 기능대상 애플리케이션/사용자가용성/출처
Gemini 2.5 ProDeep Think (향상된 추론), 멀티모달, 코딩, 1백만 토큰 컨텍스트 창복잡한 문제 해결, 고급 AI 애플리케이션 개발자Vertex AI, Google AI Studio
Gemini 2.5 Flash속도 및 효율성 최적화, 멀티모달, 코딩빠른 응답이 필요한 작업, 대규모 애플리케이션Vertex AI, Google AI Studio
Gemini Nano온디바이스 AI, 멀티모달, 개인 정보 보호 강화, 저지연, 저비용모바일 및 Chrome 내장 AI 기능 (요약, 번역 등)Chrome 138부터
MedGemma멀티모달 의료 텍스트 및 이미지 이해의료 AI 애플리케이션 개발자
SignGemma수어-텍스트 번역청각 장애인 사용자를 위한 앱 및 통합 기능 개발자예정
PaliGemma이미지 캡션, 시각적 질의응답 (VQA)시각 정보 이해 애플리케이션 개발자
Gemini Diffusion빠른 텍스트-이미지 생성이미지 생성 애플리케이션 개발자연구 모델
Gemma 3n Preview접근성 높은 개방형 AI 모델, 유연성, 개인 정보 보호, 모바일 멀티모달 기능 확장개방형 모델 기반 AI 개발자프리뷰
Google AI StudioGemini API 활용 프로토타이핑, Gemini 2.5 및 생성형 미디어 모델 접근AI 애플리케이션 개발자
Vertex AIGemini 2.5 모델 배포 및 관리, 사고 요약 기능엔터프라이즈 AI 애플리케이션 개발자
Gemini Code AssistAI 코딩 도우미 (개인 및 GitHub용), Gemini 2.5 기반, 1백만 토큰 컨텍스트 창소프트웨어 개발자정식 출시
Jules비동기식 자율 코딩 에이전트 (버그 수정, 기능 구축)소프트웨어 개발자공개 베타
Firebase Studio클라우드 기반 AI 작업 공간, Figma 디자인-앱 전환, 풀스택 AI 앱 개발모바일 및 웹 AI 애플리케이션 개발자
Stitch자연어/이미지 기반 UI 디자인 및 프론트엔드 코드 생성UI/UX 디자이너, 프론트엔드 개발자
Native Audio Output & Live APIGemini 2.5 Flash 모델용, 능동적 비디오/오디오 감지, 감성적 대화 출력대화형 AI 경험 개발자프리뷰

Gemini 2.5: Our most intelligent models are getting even better