Google 的 Gemini API 提供对 Google DeepMind 旗舰多模态模型的访问。Gemini 2.5 Pro 拥有 100 万标记的上下文窗口,在推理、编程以及包括图像、音频和视频理解在内的多模态任务方面表现出色。免费的 Gemini Flash 层使其适用于原型开发和低流量应用。可通过 Google AI Studio、Vertex AI 以及直接 API 访问。与 Google Workspace 和 Firebase 的原生集成,使其在 Google 生态系统内的应用程序中尤为强大。
API 详情
常见问题
是的,Gemini API 通过 Google AI Studio 提供免费套餐,额度非常慷慨(Gemini 1.5 Flash 支持 15 RPM,100 万 TPM)。通过 Google Cloud(Vertex AI)提供的付费套餐没有 RPM 限制,并且有企业级 SLA。Gemini 1.5 Flash 是最具性价比的模型之一,每百万输入 token 仅需 $0.075。
Gemini 是 Google 原生多模态模型,在训练时同时使用文本、图片、音频和视频,而不是将这些能力作为后续添加。Gemini 1.5 Pro 拥有 100 万 token 的上下文窗口(预览版可达 200 万),Gemini 1.5 Flash 是高吞吐应用中最快且最便宜的选择。
可以。Gemini 是原生多模态模型,能够分析图片、PDF、音频文件和视频。Gemini 1.5 Pro 每次请求可处理最多 1 小时视频、8 小时音频或 3,600 张图片。这在多媒体任务上远超大多数竞品模型。
兼容。Google 提供了一个兼容 OpenAI 的端点,只需更改 base URL 和模型名称,即可用官方 OpenAI Python 或 Node.js SDK 调用 Gemini 模型。这让你可以轻松将 Gemini 作为替代方案,无需重写集成代码。
