Google AI Studio - Starter Apps 사용기
Google AI Studio가 업데이트되면서 다양한 미니 앱들을 가지고 노는 공간이 추가되었습니다. 좌측 사이드바의 "Starter Apps"를 클릭하시면 되는데, 여기서 10+가지 흥미로운 데모를 코드도 수정해가며 실행해볼 수 있어요. 내장된 Gemini API Key를 사용하기 때문에 공짜입니다.

귀여운 기능도 기능이지만, 생성형 AI를 사용하여 간단한 앱을 만들고자 하는 분들이 참고할 만한 너무나 훌륭한 샘플 코드와 프롬프트들이 있어서 제겐 보물처럼 느껴집니다.
실제로 데모 앱들을 써보시면 안정성이 아주 높진 않아요. 공짜인 대신 너무 많이 쓰면 400 에러가 나는데, 일일 호출 제한 같은 게 있지 않나 싶습니다(다른 계정으로 하면 실행돼요). 그래서 아이디어를 얻고 '이런 기능은 이렇게 구현하면 되는구나' 같은 코드 흐름을 익히는 데 더 큰 가치가 있다고 봅니다.
제가 몇 시간동안 사용해보면서 느낀 것들을 공유합니다.
- 구글이 Starter Apps를 공개한 이유
- Gemini의 동영상 처리 능력과 제한
- 데모 프롬프트 및 코드 분석
- Video Toys: 영상 이해하고 설명하기 + 바이브 코딩 예제
- Maps Planner: 멀티 모드 + 함수 사용 + 구조화된 출력 + 지도 API 예제
- 직접 만들어보기: 하마는 모르는 게 없어요
- 내가 만든 앱을 공유하는 방법
- 메이커들을 위한 또다른 자료, Gemini Cookbook
구글이 이 데모들을 왜 공개했을까?
최근 Gemini는 텍스트를 넘어 이미지나 영상도 이해하고 생성하는 멀티모달(multi-modal) 기능과 훌륭한 코딩 능력으로 주목받고 있는데요. 대부분은 LLM 챗봇 안에서만 사용되고, 일반인이 API 레벨로 활용하는 일은 많지 않았습니다.
뇌피셜이지만 구글은 이런 기능들이 API로도 많이 쓰이면서 돈을 버는 걸 기대하며 이 데모들을 선보인 게 아닌가 싶습니다. 모든 데모가 Gemini의 기능들을 코드 레벨로, 다른 구글 API와 엮어가며 어떻게 웹앱으로 구현하면 되는지 보여주는 쇼케이스이기 때문입니다. "Gemini가 이런 것까지 가능하다!"를 자신있게 알리는 것은 물론이고요.
참고: Gemini의 동영상 처리 능력과 제한
Gemini의 멀티모달 모델은 동영상 내용을 그대로 읽어서 내용을 추출하기 때문에 (대부분 자동 생성된 자막 기반으로 분석하는) 다른 AI들보다 훨씬 정확하게 영상에 관련된 작업을 수행할 수 있습니다.
공식문서에 따르면 동영상에서 초당 1프레임(FPS)의 이미지 프레임과 1Kbps, 단일 채널의 오디오를 추출하여 초마다 타임스탬프를 추가하는 식으로 동작합니다. 실제로 해보면 꽤 오래 걸리고, 토큰도 많이 소모되긴 해요.
동영상이 1초당 약 300개 토큰으로 변환되기 때문에, 컨텍스트 윈도우가 2백만 개인 Gemini Pro는 최대 2시간 길이의 동영상을 처리할 수 있고, 컨텍스트 윈도우가 1백만 개인 Gemini Flash는 최대 1시간 길이의 동영상을 처리할 수 있습니다.
유튜브에는 제약사항이 조금 더 추가됩니다:
- 하루에 최대 8시간
- 요청당 1개 동영상만 업로드 가능
- 전체 공개 동영상만 허용
데모 프롬프트 및 코드 분석
공개된 데모 중 복잡도가 높은 녀석을 2개만 조금 자세히 살펴보겠습니다.
Video Toys: 영상 이해하고 설명하기 + 바이브 코딩 예제
유튜브 영상을 Gemini 2.5로 분석하여, 간단한 인터랙티브 교육자료 앱을 바이브 코딩해서 만들어주는 데모입니다. 샘플 영상은 이미 내용을 분석해놔서 교육자료 앱을 바로 실행해볼 수 있습니다.
