API de Google Gemini
IA multimodal: texto, imágenes, audio, video y código
La API Gemini de Google proporciona acceso a los modelos multimodales insignia de Google DeepMind. Gemini 2.5 Pro cuenta con una ventana de contexto de 1 millón de tokens y destaca en razonamiento, programación y tareas multimodales, incluyendo la comprensión de imágenes, audio y video. El nivel gratuito Gemini Flash lo hace accesible para la creación de prototipos y aplicaciones de bajo volumen. Disponible a través de Google AI Studio, Vertex AI y acceso directo por API. La integración nativa con Google Workspace y Firebase lo hace especialmente potente para aplicaciones dentro del ecosistema de Google.
Detalles de la API
Categorías
Preguntas frecuentes
Sí, la API de Gemini tiene un nivel gratuito a través de Google AI Studio con límites generosos (15 RPM, 1 millón de TPM para Gemini 1.5 Flash). El nivel de pago a través de Google Cloud (Vertex AI) no tiene límites de RPM y ofrece SLA empresariales. Gemini 1.5 Flash es uno de los modelos más rentables, con un costo de $0.075 por millón de tokens de entrada.
Gemini es el modelo multimodal nativo de Google, entrenado simultáneamente en texto, imágenes, audio y video, en lugar de añadir estas capacidades por separado. Gemini 1.5 Pro tiene una ventana de contexto de 1 millón de tokens (2 millones en vista previa), y Gemini 1.5 Flash es la opción más rápida y económica para aplicaciones de alto rendimiento.
Sí. Gemini es multimodal de forma nativa y puede analizar imágenes, archivos PDF, archivos de audio y video. Gemini 1.5 Pro puede procesar hasta 1 hora de video, 8 horas de audio o 3,600 imágenes por solicitud. Esto es significativamente más capaz que la mayoría de los modelos competidores para tareas multimedia.
Sí. Google proporciona un endpoint compatible con OpenAI para que puedas usar el SDK oficial de OpenAI en Python o Node.js con los modelos de Gemini simplemente cambiando la URL base y el nombre del modelo. Esto facilita probar Gemini como un reemplazo directo sin reescribir tu código de integración.
