Esta página foi traduzida pela API Cloud Translation.

Gemini 2.5 Flash

O Gemini 2.5 Flash é o nosso melhor modelo em termos de preço e desempenho, e oferece capacidades abrangentes. O Gemini 2.5 Flash é o nosso primeiro modelo Flash com capacidades de raciocínio, que lhe permite ver o processo de raciocínio pelo qual o modelo passa quando gera a sua resposta.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash (como referências de desempenho, informações sobre os nossos conjuntos de dados de preparação, esforços em sustentabilidade, utilização e limitações pretendidas, e a nossa abordagem à ética e segurança), consulte o nosso relatório técnico sobre os nossos modelos Gemini 2.5 e o cartão do modelo do Gemini 2.5 Flash.

2.5 Flash

Experimentar na Vertex AI Ver no Model Garden (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.

Especificações técnicas
ID do modelo	`gemini-2.5-flash`
Entradas e saídas suportadas	Entradas: Texto, Código, Imagens, Áudio, Vídeo Resultados: Texto
Limites de tokens	Número máximo de tokens de entrada: 1 048 576 Tokens de saída máximos: 65 535 (predefinição)
Capacidades	Suportado Fundamentação com a Pesquisa Google Execução de código Ajuste Instruções do sistema Saída estruturada Chamada de funções Contagem de tokens API Live Funcionalidade de pré-visualização A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat Não suportado
Tipos de utilização	Suportado Débito aprovisionado Quota partilhada dinâmica Previsão em lote Não suportado Quota fixa
Limite de tamanho da entrada	500 MB
	Imagens	Número máximo de imagens por comando: 3000 Tamanho máximo da imagem: 7 MB Tipos MIME suportados: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de ficheiros por comando: 3000 Número máximo de páginas por ficheiro: 1000 Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB Tipos MIME suportados: `application/pdf`, `text/plain`
	Vídeo	Duração máxima do vídeo (com ��udio): Aproximadamente 45 minutos Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora Número máximo de vídeos por comando: 10 Tipos MIME suportados: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens Número máximo de ficheiros de áudio por comando: 1 Compreensão da fala para: Resumo, transcrição e tradução de áudio Tipos MIME suportados: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Predefinições de parâmetros	Temperatura: 0,0 a 2,0 (predefinição: 1,0) topP: 0,0 a 1,0 (predefinição: 0,95) topK: 64 (fixo) candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas
	Disponibilidade do modelo (Inclui a quota partilhada dinâmica e o débito aprovisionado)	Global Global Estados Unidos us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 Europa europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	Processamento de ML	Estados Unidos Multirregião Canadá northamerica-northeast1⁺ Europa Multirregião europe-west2^{* +} europe-west3^{* +} europe-west9^{* +} Ásia-Pacífico asia-northeast1^{* +} asia-northeast3^{* +} asia-south1^{* +} asia-southeast1⁺ australia-southeast1^{* +}
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Janeiro de 2025
Versões	`gemini-2.5-flash` Fase de lançamento: GA Data de lançamento: 17 de junho de 2025 Data de descontinuação: 17 de junho de 2026 `gemini-live-2.5-flash` Fase de lançamento: GA privado Data de lançamento: 17 de junho de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

+ O ajuste fino supervisionado não é suportado
* Disponível apenas para a janela de contexto de 128 K. O ajuste fino supervisionado não é suportado

2.5 Flash

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.

Especificações técnicas
ID do modelo	`gemini-2.5-flash-preview-09-2025`
Entradas e saídas suportadas	Entradas: Texto, Código, Imagens, Áudio, Vídeo Resultados: Texto
Limites de tokens	Número máximo de tokens de entrada: 1 048 576 Tokens de saída máximos: 65 535 (predefinição)
Capacidades	Suportado Fundamentação com a Pesquisa Google Execução de código Instruções do sistema Saída estruturada Chamada de funções Contagem de tokens API Live Funcionalidade de pré-visualização A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat Não suportado Ajuste
Tipos de utilização	Suportado Débito aprovisionado Quota partilhada dinâmica Não suportado Quota fixa Previsão em lote
	Imagens	Número máximo de imagens por comando: 3000 Tamanho máximo da imagem: 7 MB Tipos MIME suportados: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de ficheiros por comando: 3000 Número máximo de páginas por ficheiro: 1000 Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Google Cloud Storage: 50 MB Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB Tipos MIME suportados: `application/pdf`, `text/plain`
	Vídeo	Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora Número máximo de vídeos por comando: 10 Tipos MIME suportados: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens Número máximo de ficheiros de áudio por comando: 1 Compreensão da fala para: Resumo, transcrição e tradução de áudio Tipos MIME suportados: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Predefinições de parâmetros	Temperatura: 0,0 a 2,0 (predefinição: 1,0) topP: 0,0 a 1,0 (predefinição: 0,95) topK: 64 (fixo) candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas
	Disponibilidade do modelo (Inclui a quota partilhada dinâmica e o débito aprovisionado)	Global Global
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Janeiro de 2025
Versões	`gemini-2.5-flash-preview-09-2025` Fase de lançamento: pré-visualização pública Data de lançamento: 25 de setembro de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

Imagem

Pré-visualizar

Este produto ou funcionalidade é uma oferta de pré-visualização de IA generativa, sujeita aos "Termos das Ofertas de Pré-DG" dos Termos Específicos do Serviço da Google Cloud, bem como aos Termos Adicionais para Produtos de Pré-visualização de IA Generativa. Para esta oferta de pré-visualização de IA generativa, os clientes podem optar por utilizá-la para fins de produção ou comerciais, ou divulgar o resultado gerado a terceiros, e podem tratar dados pessoais conforme descrito na Alteração ao Tratamento de Dados do Cloud, sujeito às obrigações e restrições descritas no contrato ao abrigo do qual acede ao Google Cloud. Os produtos pré-GA estão disponíveis "tal como estão" e podem ter apoio técnico limitado. Para mais informações, consulte as descrições das fases de lançamento.

Experimentar no Vertex AI (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.

Especificações técnicas
ID do modelo	`gemini-2.5-flash-image-preview`
Entradas e saídas suportadas	Entradas: Texto, Imagens Resultados: Texto e imagem
Limites de tokens	Máximo de tokens de entrada: 32 768 Máximo de tokens de saída: 32 768
Capacidades	Suportado Instruções do sistema Contagem de tokens Não suportado Fundamentação com a Pesquisa Google Execução de código Ajuste Chamada de funções API Live Funcionalidade de pré-visualização A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat
Tipos de utilização	Suportado Débito aprovisionado Quota partilhada dinâmica Não suportado Quota fixa Previsão em lote
Limite de tamanho da entrada	500 MB
	Imagens	Número máximo de imagens por comando: 3 Tamanho máximo da imagem: 7 MB Número máximo de imagens de saída por comando: 10 Tipos MIME suportados: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de ficheiros por comando: 3 Número máximo de páginas por ficheiro: 3 Tamanho máximo do ficheiro por ficheiro: 50 MB Tipos MIME suportados: `application/pdf`, `text/plain`
	Predefinições de parâmetros	Temperatura: 0,0 a 2,0 (predefinição: 1,0) topP: 0,0 a 1,0 (predefinição: 0,95) topK: 64 (fixo) candidateCount: 1 a 8 (predefinição: 1)
Regiões suportadas
	Disponibilidade do modelo (Inclui a quota partilhada dinâmica e o débito aprovisionado)	Global Global
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Junho de 2025
Versões	`gemini-2.5-flash-image-preview` Fase de lançamento: pré-visualização pública Data de lançamento: 26 de agosto de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

Áudio nativo da API Live

Gemini 2.5 Flash com funcionalidades de áudio nativas da API Live a nossa funcionalidade de áudio nativa de vanguarda para a API Live. Além das funcionalidades padrão da API Live, este modelo de pré-visualização inclui:

Qualidade de áudio melhorada: desfrute de uma qualidade de áudio significativamente melhorada que lhe dá a sensação de estar a falar com uma pessoa.
Qualidade de voz e adaptabilidade melhoradas: o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes HD em 24 idiomas.
Apresentamos o áudio proativo: Quando o áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio proativamente apenas para consultas dirigidas ao dispositivo e não responde a consultas não dirigidas ao dispositivo.
Apresentamos o diálogo afetivo: os modelos que usam o áudio nativo da API Live podem compreender e responder adequadamente às expressões emocionais dos utilizadores para conversas mais detalhadas.
Interrupção melhorada: interrompa o Gemini de forma mais natural e fiável, mesmo em ambientes ruidosos.
Chamada de funções robusta: melhorámos a taxa de acionamento, o que permite ao Gemini executar com êxito as funções que define para suportar os seus exemplos de utilização.
Transcrição precisa: a precisão da transcrição de áudio para texto foi significativamente melhorada.
Suporte multilingue integrado: fale com o Gemini em vários idiomas, e este alterna facilmente entre eles sem qualquer pré-configuração. O idioma já não é uma barreira.

Para mais informações sobre a API Live, consulte:

A nossa documentação da API Live autónoma.
Os nossos formatos de áudio suportados pela API Live.
Os nossos limites de sessões simultâneas da API Live.

Experimentar no Vertex AI

Especificações técnicas
ID do modelo	`gemini-live-2.5-flash-preview-native-audio-09-2025`
Entradas e saídas suportadas	Entradas: Texto, Áudio, Vídeo Saídas: Texto, Áudio
Limites de tokens	Tokens de entrada máximos: 128 000 Tokens de saída máximos: 64 mil Capacidade de resposta: 32 000 (predefinição), atualizável para 128 000
Capacidades	Suportado Fundamentação com a Pesquisa Google Instruções do sistema Chamada de funções API Live Funcionalidade de pré-visualização Não suportado Execução de código Ajuste Saída estruturada A pensar Colocação em cache do contexto Vertex AI RAG Engine Conclusões de chat
Tipos de utilização	Suportado Até 1000 sessões em simultâneo Não suportado Débito aprovisionado Quota partilhada dinâmica Previsão em lote
	Vídeo	Resolução padrão: 768 x 768 Tipos MIME suportados: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima da conversa: Predefinição de 10 minutos que pode ser prolongada. Formato de entrada de áudio obrigatório: Áudio PCM de 16 bits não processado a 16 kHz, little-endian Formato de saída de áudio necessário: Áudio PCM de 16 bits não processado a 24 kHz, little-endian Tipos MIME suportados: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Predefinições de parâmetros	Início da sensibilidade da voz: baixa Sensibilidade ao fim da fala: elevada Preenchimento de prefixo: 0 Tamanho máximo do contexto: 128 K
Regiões suportadas
	Disponibilidade do modelo	Estados Unidos us-central1
	Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento	Janeiro de 2025
Versões	`gemini-live-2.5-flash-preview-native-audio-09-17` Fase de lançamento: pré-visualização pública Data de lançamento: 18 de setembro de 2025 `gemini-live-2.5-flash-preview-native-audio` Fase de lançamento: pré-visualização pública Data de lançamento: 17 de junho de 2025 Data de descontinuação: 18 de outubro de 2025
Controlos de segurança
Controlos de segurança	Consulte os Controlos de segurança para mais informações.
Idiomas suportados	Consulte os idiomas suportados.
Preços	Consulte os preços.

Gemini 2.5 Flash Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

2.5 Flash

2.5 Flash

Imagem

Áudio nativo da API Live

Gemini 2.5 Flash