Gemini 2.5 Flash es nuestro mejor modelo en términos de precio y rendimiento, y ofrece capacidades integrales. Gemini 2.5 Flash es nuestro primer modelo Flash que incluye capacidades de razonamiento, lo que te permite ver el proceso de razonamiento que sigue el modelo cuando genera su respuesta.
Para obtener información técnica aún más detallada sobre Gemini 2.5 Flash (como comparativas de rendimiento, información sobre nuestros conjuntos de datos de entrenamiento, esfuerzos en materia de sustentabilidad, uso y limitaciones previstos, y nuestro enfoque sobre la ética y la seguridad), consulta nuestro informe técnico sobre nuestros modelos de Gemini 2.5 y la tarjeta del modelo de Gemini 2.5 Flash.
2.5 Flash
Probar en Vertex AI Ver en Model Garden (Versión preliminar) Implementar app de ejemplo
ID de modelo | gemini-2.5-flash |
|
---|---|---|
Entradas y salidas compatibles |
|
|
Límites de tokens |
|
|
Funciones |
|
|
Tipos de uso |
|
|
Límite de tamaño de entrada | 500 MB | |
Especificaciones técnicas | ||
Imágenes |
|
|
Documentos |
|
|
Video |
|
|
Audio |
|
|
Valores predeterminados de los parámetros |
|
|
Regiones admitidas | ||
Disponibilidad del modelo (Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada) |
|
|
Procesamiento de AA |
|
|
Consulta Residencia de datos para obtener más información. | ||
Fecha límite de conocimiento | Enero de 2025 | |
Versiones |
|
|
Controles de seguridad | ||
Consulta Controles de seguridad para obtener más información. | ||
Idiomas compatibles | Consulta Idiomas admitidos. | |
Precios | Consulta la sección de precios. |
* Disponible solo para la ventana de contexto de 128 K; no se admite el ajuste supervisado
2.5 Flash
Probar en Vertex AI (Versión preliminar) Implementa una app de ejemplo
ID de modelo | gemini-2.5-flash-preview-09-2025 |
|
---|---|---|
Entradas y salidas compatibles |
|
|
Límites de tokens |
|
|
Funciones |
|
|
Tipos de uso |
|
|
Especificaciones técnicas | ||
Imágenes |
|
|
Documentos |
|
|
Video |
|
|
Audio |
|
|
Valores predeterminados de los parámetros |
|
|
Regiones admitidas | ||
Disponibilidad del modelo (Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada) |
|
|
Consulta Residencia de datos para obtener más información. | ||
Fecha límite de conocimiento | Enero de 2025 | |
Versiones |
|
|
Controles de seguridad | ||
Consulta Controles de seguridad para obtener más información. | ||
Idiomas compatibles | Consulta Idiomas admitidos. | |
Precios | Consulta la sección de precios. |
Imagen
Probar en Vertex AI (Versión preliminar) Implementa una app de ejemplo
ID de modelo | gemini-2.5-flash-image-preview |
|
---|---|---|
Entradas y salidas compatibles |
|
|
Límites de tokens |
|
|
Funciones |
|
|
Tipos de uso |
|
|
Límite de tamaño de entrada | 500 MB | |
Especificaciones técnicas | ||
Imágenes |
|
|
Documentos |
|
|
Valores predeterminados de los parámetros |
|
|
Regiones admitidas | ||
Disponibilidad del modelo (Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada) |
|
|
Consulta Residencia de datos para obtener más información. | ||
Fecha límite de conocimiento | Junio de 2025 | |
Versiones |
|
|
Controles de seguridad | ||
Consulta Controles de seguridad para obtener más información. | ||
Idiomas compatibles | Consulta Idiomas admitidos. | |
Precios | Consulta la sección de precios. |
Audio nativo de la API en vivo
Gemini 2.5 Flash con funciones de audio nativo de la API de Live Nuestra funcionalidad de audio nativo de vanguardia para la API de Live. Además de las funciones estándar de la API de Live, este modelo de vista previa incluye lo siguiente:
- Calidad de audio mejorada: Experimenta una calidad de audio significativamente mejorada que se siente como hablar con una persona.
- Calidad y adaptabilidad de voz mejoradas: El audio nativo de la API de Live proporciona interacciones de voz más naturales y enriquecidas con 30 voces en HD en 24 idiomas.
- Presentamos Audio proactivo: Cuando se habilita Audio proactivo, el modelo solo responde cuando es pertinente. El modelo genera transcripciones de texto y respuestas de audio de forma proactiva solo para las preguntas dirigidas al dispositivo, y no responde a las preguntas que no se dirigen al dispositivo.
- Presentamos el diálogo afectivo: Los modelos que usan audio nativo de la API de Live pueden comprender y responder de manera adecuada a las expresiones emocionales de los usuarios para tener conversaciones más matizadas.
- Mejora de la interrupción: Interrumpe a Gemini de forma más natural y confiable, incluso en entornos ruidosos.
- Llamada a función sólida: Mejoramos la tasa de activación, lo que permite que Gemini ejecute correctamente las funciones que defines para admitir tus casos de uso.
- Transcripción precisa: Se mejoró significativamente la precisión de la transcripción de audio a texto.
- Compatibilidad multilingüe sin problemas: Habla con Gemini en varios idiomas y cambiará entre ellos sin esfuerzo y sin necesidad de configuración previa. El idioma ya no es una barrera.
Para obtener más información sobre la API de Live, consulta los siguientes recursos:
- Nuestra documentación independiente de la API de Live
- Nuestros formatos de audio compatibles con la API de Live
- Nuestros límites de sesiones simultáneas de la API de Live
ID de modelo | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
---|---|---|
Entradas y salidas compatibles |
|
|
Límites de tokens |
|
|
Funciones |
|
|
Tipos de uso | ||
Especificaciones técnicas | ||
Video |
|
|
Audio |
|
|
Valores predeterminados de los parámetros |
|
|
Regiones admitidas | ||
Disponibilidad del modelo |
|
|
Consulta Residencia de datos para obtener más información. | ||
Fecha límite de conocimiento | Enero de 2025 | |
Versiones |
|
|
Controles de seguridad | ||
Consulta Controles de seguridad para obtener más información. | ||
Idiomas compatibles | Consulta Idiomas admitidos. | |
Precios | Consulta la sección de precios. |