Perspectiva de FSI: otimização de performance

Last reviewed 2025-07-28 UTC

Este documento do Google Cloud Framework bem arquitetado: perspectiva do setor de serviços financeiros (FSI, na sigla em inglês) fornece uma visão geral dos princípios e recomendações para otimizar o desempenho das cargas de trabalho do setor de serviços financeiros (FSI) no Google Cloud. As recomendações neste documento estão alinhadas ao pilar de otimização de performance do framework bem arquitetado.

A otimização de performance tem uma longa história nos serviços financeiros. Ele ajudou as organizações de serviços financeiros a superar desafios técnicos e quase sempre foi um facilitador ou acelerador para a criação de novos modelos de negócios. Por exemplo, os caixas eletrônicos (introduzidos em 1967) automatizaram o processo de dispensação de dinheiro e ajudaram os bancos a diminuir o custo da atividade principal. Técnicas como ignorar o kernel do SO e fixar threads de aplicativos em núcleos de computação ajudaram a alcançar baixa latência e determinismo para aplicativos de negociação. A redução na latência facilitou uma liquidez maior e mais firme com spreads mais estreitos nos mercados financeiros.

A nuvem cria novas oportunidades de otimização de performance. Ele também questiona alguns dos padrões de otimização aceitos historicamente. Especificamente, as seguintes compensações são mais transparentes e controláveis na nuvem:

  • Tempo de lançamento x custo.
  • Performance de ponta a ponta no nível do sistema x performance no nível do nó.
  • Disponibilidade de talentos x agilidade na tomada de decisões relacionadas à tecnologia.

Por exemplo, adaptar hardware e recursos de TI a requisitos de habilidades específicas é uma tarefa trivial na nuvem. Para oferecer suporte à programação de GPU, é fácil criar VMs baseadas em GPU. É possível escalonar a capacidade na nuvem para acomodar picos de demanda sem provisionar recursos em excesso. Isso ajuda a garantir que suas cargas de trabalho possam lidar com picos, como nos dias de folha de pagamento não agrícola e quando os volumes de negociação são significativamente maiores do que os níveis históricos. Em vez de gastar tempo escrevendo código altamente otimizado no nível de servidores individuais (como código altamente ajustado na linguagem C) ou escrevendo código para ambientes convencionais de computação de alto desempenho (HPC), você pode escalonar horizontalmente de maneira ideal usando um sistema distribuído baseado em Kubernetes bem arquitetado.

As recomendações de otimização de performance neste documento são mapeadas para os seguintes princípios fundamentais:

Alinhar as métricas de performance de tecnologia aos principais indicadores de negócios

É possível mapear a otimização de performance para resultados de valor comercial de várias maneiras. Por exemplo, em uma mesa de pesquisa compradora, um objetivo de negócios pode ser otimizar a produção por hora de pesquisa ou priorizar experimentos de equipes com um histórico comprovado, como índices de Sharpe mais altos. No lado da venda, você pode usar a análise para acompanhar o interesse do cliente e, assim, priorizar a capacidade de processamento para modelos de IA que oferecem suporte à pesquisa mais interessante.

Conectar metas de performance aos indicadores principais de desempenho (KPIs) também é importante para financiar melhorias de performance. As iniciativas de inovação e transformação de negócios (às vezes chamadas de esforços de mudança do banco) têm orçamentos diferentes e graus de acesso potencialmente diferentes aos recursos em comparação com as operações normais (BAU, na sigla em inglês) ou de execução do banco. Por exemplo, o Google Cloud ajudou as equipes de gerenciamento de riscos e tecnologia de um G-SIFI a colaborar com os analistas quantitativos da frente de atendimento em uma solução para realizar cálculos de análise de risco (como XVA) em minutos, em vez de horas ou dias. Essa solução ajudou a organização a atender aos requisitos de compliance relevantes. Também permitiu que os traders tivessem conversas de maior qualidade com os clientes, oferecendo spreads mais apertados, liquidez mais firme e hedge mais econômico.

Ao alinhar suas métricas de performance com indicadores de negócios, considere as seguintes recomendações:

  • Conecte cada iniciativa de tecnologia aos objetivos e resultados-chave (OKRs) relevantes da empresa, como aumentar a receita ou o lucro, reduzir custos e mitigar riscos de maneira mais eficiente ou abrangente.
  • Foco na otimização da performance no nível do sistema. Vá além da separação convencional entre mudança e execução do banco e dos silos de front-office e back-office.

Priorize a segurança sem sacrificar o desempenho por riscos não comprovados

A segurança e a conformidade regulatória nas organizações de serviços financeiros precisam ser de um padrão inequivocamente alto. Manter um alto padrão é essencial para evitar a perda de clientes e danos irreparáveis à marca de uma organização. Muitas vezes, o maior valor é derivado de inovações tecnológicas, como a IA generativa e serviços gerenciados exclusivos, como o Spanner. Não descarte automaticamente essas opções de tecnologia devido a uma concepção equivocada geral sobre risco operacional proibitivo ou postura inadequada de conformidade regulatória.

Google Cloud trabalhou em estreita colaboração com os G-SIFIs para garantir que uma abordagem baseada em IA para combate à lavagem de dinheiro (AML, na sigla em inglês) possa ser usada em todas as jurisdições em que as instituições atendem clientes. Por exemplo, o HSBC melhorou significativamente a performance da unidade de crimes financeiros (Fincrime) com os seguintes resultados:

  • Cerca de duas a quatro vezes mais atividades suspeitas confirmadas.
  • Reduza os custos operacionais eliminando mais de 60% dos falsos positivos e concentrando o tempo de investigação apenas em alertas acionáveis de alto risco.
  • Saídas auditáveis e explicáveis para apoiar a conformidade regulatória.

Considere as seguintes recomendações:

  • Confirme se os produtos que você pretende usar podem ajudar a atender aos requisitos de segurança, resiliência e compliance das jurisdições em que você opera. Para alcançar esse objetivo, trabalhe com as equipes de contas, de risco e de produtos. Google Cloud
  • Crie modelos mais avançados e ofereça transparência aos clientes usando a explicabilidade da IA (por exemplo, atribuição de valor de Shapley). Técnicas como a atribuição de valor de Shapley podem atribuir decisões do modelo a recursos específicos no nível de entrada.
  • Para alcançar a transparência das cargas de trabalho de IA generativa, use técnicas como citações de fontes, fundamentação e RAG.

  • Quando a capacidade de explicação não é suficiente, separe as etapas de tomada de decisão nos fluxos de valor e use a IA para automatizar apenas as etapas que não envolvem decisões. Em alguns casos, a IA explicável pode não ser suficiente ou um processo pode exigir intervenção humana devido a questões regulatórias (por exemplo, GDPR, Artigo 22). Nesses casos, apresente todas as informações necessárias para a tomada de decisões em um único painel de controle, mas automatize as tarefas de coleta, ingestão, manipulação e resumo de dados.

Repense sua arquitetura para se adaptar a novas oportunidades e requisitos

Aumentar suas arquiteturas atuais com recursos baseados na nuvem pode trazer um valor significativo. Para alcançar resultados mais transformadores, é necessário repensar periodicamente sua arquitetura usando uma abordagem com foco na nuvem.

Considere as recomendações a seguir para repensar periodicamente a arquitetura das suas cargas de trabalho e otimizar ainda mais a performance.

Usar alternativas baseadas na nuvem para sistemas e programadores de HPC locais

Para aproveitar a maior elasticidade, a postura de segurança aprimorada e os recursos abrangentes de monitoramento e governança, é possível executar cargas de trabalho de HPC na nuvem ou aumentar as cargas de trabalho locais para a nuvem. No entanto, para determinados casos de uso de modelagem numérica, como simulação de estratégias de investimento ou modelagem de XVA, combinar o Kubernetes com o Kueue pode oferecer uma solução mais eficiente.

Mudar para programação baseada em gráficos para simulações

As simulações de Monte Carlo podem ter um desempenho muito melhor em um sistema de execução baseado em gráficos, como o Dataflow. Por exemplo, o HSBC usa o Dataflow para executar cálculos de risco 16 vezes mais rápido do que a abordagem anterior.

Executar plataformas de negociação e bolsas de valores baseadas na nuvem

As conversas com clientes da Google Cloud revelam que o princípio de Pareto 80/20 se aplica aos requisitos de performance dos mercados e aplicativos de negociação.

  • Mais de 80% dos aplicativos de negociação não precisam de latência extremamente baixa. No entanto, eles se beneficiam muito da resiliência, da segurança e dos recursos de elasticidade da nuvem. Por exemplo, a BidFX, uma plataforma de câmbio multidistribuidora, usa a nuvem para lançar novos produtos rapidamente e aumentar significativamente a disponibilidade e a presença deles sem aumentar os recursos.
  • Os aplicativos restantes (menos de 20%) precisam de baixa latência (menos de um milissegundo), determinismo e justiça na entrega de mensagens. Normalmente, esses sistemas são executados em instalações rígidas e caras de colocation. Cada vez mais, até mesmo essa categoria de aplicativos está sendo reformulada na nuvem, seja na borda ou como aplicativos com priorização da nuvem.

Prepare sua tecnologia para atender às necessidades comerciais atuais e futuras

Historicamente, muitas organizações de serviços financeiros criaram tecnologias proprietárias para ganhar uma vantagem competitiva. Por exemplo, no início dos anos 2000, bancos de investimento e empresas de negociação bem-sucedidos tinham as próprias implementações de tecnologias fundamentais, como sistemas de publicação e assinatura e corretores de mensagens. Com a evolução das tecnologias de código aberto e da nuvem, essas tecnologias se tornaram commodities e não oferecem valor comercial incremental.

Considere as seguintes recomendações para preparar sua tecnologia para o futuro.

Adote uma abordagem de dados como serviço (DaaS) para reduzir o tempo de lançamento e aumentar a transparência de custos

As organizações de FSI geralmente evoluem por uma combinação de crescimento orgânico e fusões e aquisições (M&A). Como resultado, as organizações precisam integrar tecnologias diferentes. Eles também precisam gerenciar recursos duplicados, como fornecedores de dados, licenças de dados e pontos de integração.O Google Cloud oferece oportunidades para criar valor diferenciado em integrações pós-fusão.

Por exemplo, é possível usar serviços como o compartilhamento do BigQuery para criar uma plataforma de dados como serviço (DaaS, na sigla em inglês) pronta para análise. A plataforma pode fornecer dados de mercado e entradas de fontes alternativas. Essa abordagem elimina a necessidade de criar pipelines de dados redundantes e permite que você se concentre em iniciativas mais valiosas. Além disso, as empresas fundidas ou adquiridas podem racionalizar de forma rápida e eficiente as necessidades de licenciamento de dados e infraestrutura pós-fusão. Em vez de gastar tempo e esforço na adaptação e fusão de operações e patrimônios de dados legados, a empresa combinada pode se concentrar em novas oportunidades de negócios.

Crie uma camada de abstração para isolar sistemas atuais e abordar modelos de negócios emergentes

Cada vez mais, a vantagem competitiva dos bancos não é o sistema bancário principal, mas a camada de experiência do cliente. No entanto, os sistemas bancários legados costumam usar aplicativos monolíticos desenvolvidos em linguagens como Cobol e integrados em toda a cadeia de valor bancária. Essa integração dificultava a separação das camadas da cadeia de valor, tornando quase impossível fazer upgrade e modernizar esses sistemas.

Uma solução para esse desafio é usar uma camada de isolamento, como um sistema de gerenciamento de API ou uma camada de staging como o Spanner, que duplica o livro de registros e facilita a modernização dos serviços com análises avançadas e IA. Por exemplo, o Deutsche Bank usou o Spanner para isolar o sistema bancário principal legado e iniciar a jornada de inovação.