Se usó la API de Cloud Translation para traducir esta página.

Gemini 2.5 Flash

Gemini 2.5 Flash es nuestro mejor modelo en términos de precio y rendimiento, y ofrece capacidades integrales. Gemini 2.5 Flash es nuestro primer modelo Flash que incluye capacidades de razonamiento, lo que te permite ver el proceso de razonamiento que sigue el modelo cuando genera su respuesta.

Para obtener información técnica aún más detallada sobre Gemini 2.5 Flash (como comparativas de rendimiento, información sobre nuestros conjuntos de datos de entrenamiento, esfuerzos en materia de sustentabilidad, uso y limitaciones previstos, y nuestro enfoque sobre la ética y la seguridad), consulta nuestro informe técnico sobre nuestros modelos de Gemini 2.5 y la tarjeta del modelo de Gemini 2.5 Flash.

2.5 Flash

Probar en Vertex AI Ver en Model Garden (Versión preliminar) Implementar app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Vertex AI habilitadas.

Especificaciones técnicas
ID de modelo	`gemini-2.5-flash`
Entradas y salidas compatibles	Entradas: Texto, Código, Imágenes, Audio, Video Salidas: Texto
Límites de tokens	Cantidad máxima de tokens de entrada: 1,048,576 Cantidad máxima de tokens de salida: 65,535 (valor predeterminado)
Funciones	Admitido Grounding with Google Search Ejecución de código Ajuste Instrucciones del sistema Resultados estructurados Llamada a función Contar tokens API de Live Función de versión preliminar Pensamiento Almacenamiento en caché del contexto Vertex AI RAG Engine Completado de chat No compatible
Tipos de uso	Admitido Capacidad de procesamiento aprovisionada Cuota compartida dinámica Predicción por lotes No compatible Cuota fija
Límite de tamaño de entrada	500 MB
	Imágenes	Cantidad máxima de imágenes por instrucción: 3,000 Tamaño máximo de la imagen: 7 MB Tipos de MIME admitidos: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Cantidad máxima de archivos por instrucción: 3,000 Cantidad máxima de páginas por archivo: 1,000 Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB Tamaño máximo de archivo para las cargas directas a través de la consola: 7 MB Tipos de MIME admitidos: `application/pdf`, `text/plain`
	Video	Duración máxima del video (con audio): Aproximadamente 45 minutos Duración máxima del video (sin audio): Aproximadamente 1 hora Cantidad máxima de videos por instrucción: 10 Tipos de MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens Cantidad máxima de archivos de audio por instrucción: 1 Comprensión del habla para: Resumen, transcripción y traducción de audio Tipos de MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0.0 a 2.0 (predeterminado 1.0) topP: 0.0 a 1.0 (predeterminado 0.95) topK: 64 (fijo) candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas
	Disponibilidad del modelo (Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada)	Global global Estados Unidos us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 Europa europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	Procesamiento de AA	Estados Unidos Multirregión Canadá northamerica-northeast1⁺ Europa Multirregión europe-west2^{* +} europe-west3^{* +} europe-west9^{* +} Asia-Pacífico asia-northeast1^{* +} asia-northeast3^{* +} asia-south1^{* +} asia-southeast1⁺ australia-southeast1^{* +}
	Consulta Residencia de datos para obtener más información.
Fecha límite de conocimiento	Enero de 2025
Versiones	`gemini-2.5-flash` Etapa de lanzamiento: DG Fecha de lanzamiento: 17 de junio de 2025 Fecha de descontinuación: 17 de junio de 2026 `gemini-live-2.5-flash` Etapa de lanzamiento: GA privada Fecha de lanzamiento: 17 de junio de 2025
Controles de seguridad
Controles de seguridad	Consulta Controles de seguridad para obtener más información.
Idiomas compatibles	Consulta Idiomas admitidos.
Precios	Consulta la sección de precios.

+ No se admite el ajuste supervisado
* Disponible solo para la ventana de contexto de 128 K; no se admite el ajuste supervisado

2.5 Flash

Probar en Vertex AI (Versión preliminar) Implementa una app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Vertex AI habilitadas.

Especificaciones técnicas
ID de modelo	`gemini-2.5-flash-preview-09-2025`
Entradas y salidas compatibles	Entradas: Texto, Código, Imágenes, Audio, Video Salidas: Texto
Límites de tokens	Cantidad máxima de tokens de entrada: 1,048,576 Cantidad máxima de tokens de salida: 65,535 (valor predeterminado)
Funciones	Admitido Grounding with Google Search Ejecución de código Instrucciones del sistema Resultados estructurados Llamada a función Contar tokens API de Live Función de versión preliminar Pensamiento Almacenamiento en caché del contexto Vertex AI RAG Engine Completado de chat No compatible Ajuste
Tipos de uso	Admitido Capacidad de procesamiento aprovisionada Cuota compartida dinámica No compatible Cuota fija Predicción por lotes
	Imágenes	Cantidad máxima de imágenes por instrucción: 3,000 Tamaño máximo de la imagen: 7 MB Tipos de MIME admitidos: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Cantidad máxima de archivos por instrucción: 3,000 Cantidad máxima de páginas por archivo: 1,000 Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB Tamaño máximo de archivo para las cargas directas a través de la consola: 7 MB Tipos de MIME admitidos: `application/pdf`, `text/plain`
	Video	Duración máxima del video (con audio): Aproximadamente 45 minutos Duración máxima del video (sin audio): Aproximadamente 1 hora Cantidad máxima de videos por instrucción: 10 Tipos de MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens Cantidad máxima de archivos de audio por instrucción: 1 Comprensión del habla para: Resumen, transcripción y traducción de audio Tipos de MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0.0 a 2.0 (predeterminado 1.0) topP: 0.0 a 1.0 (predeterminado 0.95) topK: 64 (fijo) candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas
	Disponibilidad del modelo (Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada)	Global global
	Consulta Residencia de datos para obtener más información.
Fecha límite de conocimiento	Enero de 2025
Versiones	`gemini-2.5-flash-preview-09-2025` Etapa de lanzamiento: Versión preliminar pública Fecha de lanzamiento: 25 de septiembre de 2025
Controles de seguridad
Controles de seguridad	Consulta Controles de seguridad para obtener más información.
Idiomas compatibles	Consulta Idiomas admitidos.
Precios	Consulta la sección de precios.

Imagen

Vista previa

Este producto o función es una oferta de vista previa de IA generativa, sujeta a las “Condiciones de las ofertas de la fase previa a la DG” de las Condiciones específicas del servicio de Google Cloud, así como a las Condiciones adicionales de los Productos de vista previa de IA generativa. En el caso de esta oferta de versión preliminar de IA generativa, los clientes pueden optar por usarla con fines comerciales o de producción, o divulgar el resultado generado a terceros, y pueden procesar datos personales como se describe en el Anexo de Tratamiento de Datos de Cloud, sujeto a las obligaciones y restricciones que se describen en el acuerdo en virtud del cual accedes a Google Cloud. Los productos de la fase previa a la DG están disponibles “tal como están” y pueden tener asistencia limitada. Para obtener más información, consulta las descripciones de la etapa de lanzamiento.

Probar en Vertex AI (Versión preliminar) Implementa una app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Vertex AI habilitadas.

Especificaciones técnicas
ID de modelo	`gemini-2.5-flash-image-preview`
Entradas y salidas compatibles	Entradas: Texto, Imágenes Resultados: Texto y una imagen
Límites de tokens	Cantidad máxima de tokens de entrada: 32,768 Cantidad máxima de tokens de salida: 32,768
Funciones	Admitido Instrucciones del sistema Contar tokens No compatible Grounding with Google Search Ejecución de código Ajuste Llamada a función API de Live Función de versión preliminar Pensamiento Almacenamiento en caché del contexto Vertex AI RAG Engine Completado de chat
Tipos de uso	Admitido Capacidad de procesamiento aprovisionada Cuota compartida dinámica No compatible Cuota fija Predicción por lotes
Límite de tamaño de entrada	500 MB
	Imágenes	Cantidad máxima de imágenes por instrucción: 3 Tamaño máximo de la imagen: 7 MB Cantidad máxima de imágenes de salida por instrucción: 10 Tipos de MIME admitidos: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Cantidad máxima de archivos por instrucción: 3 Cantidad máxima de páginas por archivo: 3 Tamaño máximo de cada archivo: 50 MB Tipos de MIME admitidos: `application/pdf`, `text/plain`
	Valores predeterminados de los parámetros	Temperatura: 0.0 a 2.0 (predeterminado 1.0) topP: 0.0 a 1.0 (predeterminado 0.95) topK: 64 (fijo) candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas
	Disponibilidad del modelo (Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada)	Global global
	Consulta Residencia de datos para obtener más información.
Fecha límite de conocimiento	Junio de 2025
Versiones	`gemini-2.5-flash-image-preview` Etapa de lanzamiento: Versión preliminar pública Fecha de lanzamiento: 26 de agosto de 2025
Controles de seguridad
Controles de seguridad	Consulta Controles de seguridad para obtener más información.
Idiomas compatibles	Consulta Idiomas admitidos.
Precios	Consulta la sección de precios.

Audio nativo de la API en vivo

Gemini 2.5 Flash con funciones de audio nativo de la API de Live Nuestra funcionalidad de audio nativo de vanguardia para la API de Live. Además de las funciones estándar de la API de Live, este modelo de vista previa incluye lo siguiente:

Calidad de audio mejorada: Experimenta una calidad de audio significativamente mejorada que se siente como hablar con una persona.
Calidad y adaptabilidad de voz mejoradas: El audio nativo de la API de Live proporciona interacciones de voz más naturales y enriquecidas con 30 voces en HD en 24 idiomas.
Presentamos Audio proactivo: Cuando se habilita Audio proactivo, el modelo solo responde cuando es pertinente. El modelo genera transcripciones de texto y respuestas de audio de forma proactiva solo para las preguntas dirigidas al dispositivo, y no responde a las preguntas que no se dirigen al dispositivo.
Presentamos el diálogo afectivo: Los modelos que usan audio nativo de la API de Live pueden comprender y responder de manera adecuada a las expresiones emocionales de los usuarios para tener conversaciones más matizadas.
Mejora de la interrupción: Interrumpe a Gemini de forma más natural y confiable, incluso en entornos ruidosos.
Llamada a función sólida: Mejoramos la tasa de activación, lo que permite que Gemini ejecute correctamente las funciones que defines para admitir tus casos de uso.
Transcripción precisa: Se mejoró significativamente la precisión de la transcripción de audio a texto.
Compatibilidad multilingüe sin problemas: Habla con Gemini en varios idiomas y cambiará entre ellos sin esfuerzo y sin necesidad de configuración previa. El idioma ya no es una barrera.

Para obtener más información sobre la API de Live, consulta los siguientes recursos:

Nuestra documentación independiente de la API de Live
Nuestros formatos de audio compatibles con la API de Live
Nuestros límites de sesiones simultáneas de la API de Live

Probar en Vertex AI

Especificaciones técnicas
ID de modelo	`gemini-live-2.5-flash-preview-native-audio-09-2025`
Entradas y salidas compatibles	Entradas: Texto, Audio, Video Salidas: Texto, Audio
Límites de tokens	Cantidad máxima de tokens de entrada: 128,000 Cantidad máxima de tokens de salida: 64,000 Ventana de contexto: 32,000 (predeterminada), actualizable a 128,000
Funciones	Admitido Grounding with Google Search Instrucciones del sistema Llamada a función API de Live Función de versión preliminar No compatible Ejecución de código Ajuste Resultados estructurados Pensamiento Almacenamiento en caché del contexto Vertex AI RAG Engine Completado de chat
Tipos de uso	Admitido Hasta 1,000 sesiones simultáneas No compatible Capacidad de procesamiento aprovisionada Cuota compartida dinámica Predicción por lotes
	Video	Resolución estándar: 768 × 768 Tipos de MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima de la conversación: De forma predeterminada, 10 minutos que se pueden extender. Formato de entrada de audio requerido: Audio PCM sin procesar de 16 bits a 16 kHz, little-endian Formato de salida de audio requerido: Audio PCM sin procesar de 16 bits a 24 kHz, little-endian Tipos de MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Sensibilidad cuando comienza a escucharse una voz: Baja Sensibilidad cuando se deja de escuchar una voz: Alta Relleno de prefijo: 0 Tamaño máximo del contexto: 128 K
Regiones admitidas
	Disponibilidad del modelo	Estados Unidos us-central1
	Consulta Residencia de datos para obtener más información.
Fecha límite de conocimiento	Enero de 2025
Versiones	`gemini-live-2.5-flash-preview-native-audio-09-17` Etapa de lanzamiento: Versión preliminar pública Fecha de lanzamiento: 18 de septiembre de 2025 `gemini-live-2.5-flash-preview-native-audio` Etapa de lanzamiento: Versión preliminar pública Fecha de lanzamiento: 17 de junio de 2025 Fecha de descontinuación: 18 de octubre de 2025
Controles de seguridad
Controles de seguridad	Consulta Controles de seguridad para obtener más información.
Idiomas compatibles	Consulta Idiomas admitidos.
Precios	Consulta la sección de precios.

Gemini 2.5 Flash Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

2.5 Flash

2.5 Flash

Imagen

Audio nativo de la API en vivo

Gemini 2.5 Flash