En este documento del Google Cloud Framework de Well-Architected: perspectiva de la industria de servicios financieros, se proporciona una descripción general de los principios y las recomendaciones para optimizar el rendimiento de tus cargas de trabajo de la industria de servicios financieros (FSI) en Google Cloud. Las recomendaciones de este documento se alinean con el pilar de optimización del rendimiento del Framework de Well-Architected.
La optimización del rendimiento tiene una larga historia en los servicios financieros. Ayudó a las organizaciones de FSI a superar los desafíos técnicos y casi siempre fue un factor que permitió o aceleró la creación de nuevos modelos de negocio. Por ejemplo, los cajeros automáticos (introducidos en 1967) automatizaron el proceso de dispensación de efectivo y ayudaron a los bancos a reducir el costo de su negocio principal. Las técnicas como la omisión del kernel del SO y la fijación de subprocesos de aplicaciones a núcleos de procesamiento ayudaron a lograr una latencia determinística y baja para las aplicaciones de trading. La reducción de la latencia facilitó una liquidez más alta y firme con diferenciales más ajustados en los mercados financieros.
La nube crea nuevas oportunidades para la optimización del rendimiento. También desafía algunos de los patrones de optimización históricamente aceptados. Específicamente, las siguientes compensaciones son más transparentes y controlables en la nube:
- Tiempo de salida al mercado en comparación con el costo
- Rendimiento integral a nivel del sistema en comparación con el rendimiento a nivel del nodo
- Disponibilidad de talento en comparación con la agilidad de la toma de decisiones relacionadas con la tecnología
Por ejemplo, adaptar los recursos de hardware y de TI a los requisitos de habilidades específicos es una tarea trivial en la nube. Para admitir la programación de GPU, puedes crear fácilmente VMs basadas en GPU. Puedes ajustar la capacidad en la nube para satisfacer los picos de demanda sin aprovisionar recursos en exceso. Esta capacidad ayuda a garantizar que tus cargas de trabajo puedan controlar las cargas máximas, como en los días de nómina no agrícola y cuando los volúmenes de operaciones son significativamente mayores que los niveles históricos. En lugar de invertir en escribir código altamente optimizado a nivel de servidores individuales (como código altamente ajustado en el lenguaje C) o escribir código para entornos convencionales de computación de alto rendimiento (HPC), puedes realizar un escalamiento horizontal de manera óptima con un sistema distribuido basado en Kubernetes bien diseñado.
Las recomendaciones de optimización del rendimiento que se incluyen en este documento se correlacionan con los siguientes principios fundamentales:
- Alinear las métricas de rendimiento de la tecnología con los indicadores comerciales clave
- Prioriza la seguridad sin sacrificar el rendimiento por riesgos no comprobados
- Repiensa tu arquitectura para adaptarte a las nuevas oportunidades y requisitos
- Prepara tu tecnología para el futuro y satisface las necesidades comerciales actuales y futuras
Alinear las métricas de rendimiento de la tecnología con los indicadores comerciales clave
Puedes correlacionar la optimización del rendimiento con los resultados de valor comercial de varias maneras. Por ejemplo, en un departamento de investigación del lado de la compra, un objetivo comercial podría ser optimizar la producción por hora de investigación o priorizar los experimentos de los equipos que tienen un historial comprobado, como índices de Sharpe más altos. En el lado de las ventas, puedes usar la analítica para hacer un seguimiento del interés de los clientes y, en consecuencia, priorizar la capacidad de procesamiento de los modelos de IA que admiten la investigación más interesante.
También es importante conectar los objetivos de rendimiento con los indicadores clave de rendimiento (KPI) de la empresa para financiar las mejoras de rendimiento. Las iniciativas de innovación y transformación empresarial (a veces denominadas esfuerzos de cambio del banco) tienen presupuestos diferentes y, potencialmente, distintos grados de acceso a los recursos en comparación con las operaciones habituales (BAU) o de ejecución del banco. Por ejemplo, Google Cloud ayudó a los equipos de tecnología y administración de riesgos de una G-SIFI a colaborar con los analistas cuantitativos de la oficina principal en una solución para realizar cálculos de análisis de riesgos (como el XVA) en minutos en lugar de horas o días. Esta solución ayudó a la organización a cumplir con los requisitos de cumplimiento pertinentes. También permitió que los operadores tuvieran conversaciones de mayor calidad con sus clientes, lo que potencialmente ofrece diferenciales más ajustados, mayor liquidez y cobertura más rentable.
Cuando alinees tus métricas de rendimiento con los indicadores comerciales, ten en cuenta las siguientes recomendaciones:
- Conecta cada iniciativa tecnológica con los objetivos y resultados clave (OKR) comerciales pertinentes, como aumentar los ingresos o las ganancias, reducir los costos y mitigar los riesgos de manera más eficiente o integral.
- Enfócate en optimizar el rendimiento a nivel del sistema. Mira más allá de la separación convencional entre el cambio del banco y el funcionamiento del banco, y los silos de la oficina principal y la oficina administrativa.
Prioriza la seguridad sin sacrificar el rendimiento para los riesgos no comprobados
La seguridad y el cumplimiento de las reglamentaciones en las organizaciones de FSI deben ser, sin lugar a dudas, de un alto nivel. Mantener un estándar alto es fundamental para no perder clientes y evitar daños irreparables a la marca de una organización. A menudo, el mayor valor se deriva de las innovaciones tecnológicas, como la IA generativa y los servicios administrados únicos, como Spanner. No descartes automáticamente esas opciones tecnológicas debido a una idea errónea generalizada sobre el riesgo operativo prohibitivo o la postura inadecuada de cumplimiento normativo.
Google Cloud ha trabajado en estrecha colaboración con los G-SIFI para asegurarse de que se pueda utilizar un enfoque basado en la IA para el Lavado de dinero (LD) en todas las jurisdicciones en las que las instituciones atienden a los clientes. Por ejemplo, HSBC mejoró significativamente el rendimiento de su unidad de delitos financieros (Fincrime) con los siguientes resultados:
- Casi dos o cuatro veces más actividades sospechosas confirmadas
- Reducción de los costos operativos gracias a la eliminación de más del 60% de los falsos positivos y la concentración del tiempo de investigación solo en las alertas de alto riesgo sobre las que se pueden tomar medidas.
- Resultados auditables y explicables para respaldar el cumplimiento de las reglamentaciones.
Ten en cuenta las siguientes recomendaciones:
- Confirma que los productos que piensas usar pueden ayudarte a cumplir con los requisitos de seguridad, resiliencia y cumplimiento de las jurisdicciones en las que operas. Para lograr este objetivo, trabaja con los equipos de cuentas, los equipos de riesgo y los equipos de productos. Google Cloud
- Crea modelos más potentes y brinda transparencia a los clientes aprovechando la explicabilidad de la IA (por ejemplo, la atribución del valor de Shapley). Las técnicas como la atribución del valor de Shapley pueden atribuir las decisiones del modelo a atributos particulares a nivel de la entrada.
Logra transparencia en las cargas de trabajo de IA generativa con técnicas como las citas a fuentes, la fundamentación y la RAG.
Cuando la interpretabilidad no es suficiente, separa los pasos de toma de decisiones en tus flujos de valor y usa la IA para automatizar solo los pasos que no impliquen toma de decisiones. En algunos casos, la IA explicable podría no ser suficiente o un proceso podría requerir intervención humana debido a inquietudes reglamentarias (por ejemplo, el RGPD, Artículo 22). En esos casos, presenta toda la información que el agente humano necesita para tomar decisiones en un solo panel de control, pero automatiza las tareas de recopilación, transferencia, manipulación y resumen de datos.
Repensar tu arquitectura para adaptarte a nuevas oportunidades y requisitos
Mejorar tus arquitecturas actuales con funciones basadas en la nube puede proporcionar un valor significativo. Para lograr resultados más transformadores, debes repensar periódicamente tu arquitectura con un enfoque centrado en la nube.
Considera las siguientes recomendaciones para repensar periódicamente la arquitectura de tus cargas de trabajo y optimizar aún más el rendimiento.
Usa alternativas basadas en la nube para los sistemas y los programadores de HPC locales
Para aprovechar una mayor elasticidad, una mejor postura de seguridad y amplias capacidades de supervisión y administración, puedes ejecutar cargas de trabajo de HPC en la nube o transferir cargas de trabajo locales a la nube. Sin embargo, para ciertos casos de uso de modelado numérico, como la simulación de estrategias de inversión o el modelado de XVA, combinar Kubernetes con Kueue podría ofrecer una solución más potente.
Cambia a la programación basada en gráficos para las simulaciones
Las simulaciones de Monte Carlo pueden tener un rendimiento mucho mayor en un sistema de ejecución basado en grafos, como Dataflow. Por ejemplo, HSBC usa Dataflow para ejecutar cálculos de riesgo 16 veces más rápido en comparación con su enfoque anterior.
Ejecutar plataformas de intercambio y comercio basadas en la nube
Las conversaciones con los clientes revelan que el principio de Pareto del 80/20 se aplica a los requisitos de rendimiento de los mercados y las aplicaciones de comercio. Google Cloud
- Más del 80% de las aplicaciones de comercio no necesitan una latencia extremadamente baja. Sin embargo, obtienen beneficios significativos de las capacidades de resiliencia, seguridad y elasticidad de la nube. Por ejemplo, BidFX, una plataforma de múltiples proveedores de divisas, usa la nube para lanzar nuevos productos rápidamente y aumentar significativamente su disponibilidad y alcance sin aumentar los recursos.
- Las aplicaciones restantes (menos del 20%) necesitan baja latencia (menos de un milisegundo), determinismo y equidad en la entrega de mensajes. Por lo general, estos sistemas se ejecutan en instalaciones rígidas y costosas de ubicación conjunta. Cada vez más, incluso esta categoría de aplicaciones se está replataformando en la nube, ya sea en el borde o como aplicaciones centradas en la nube.
Prepara tu tecnología para el futuro y satisface las necesidades comerciales actuales y futuras
Históricamente, muchas organizaciones de FSI crearon tecnologías propietarias para obtener una ventaja competitiva. Por ejemplo, a principios de la década de 2000, los bancos de inversión y las empresas de comercio exitosos tenían sus propias implementaciones de tecnologías fundamentales, como los sistemas de publicación y suscripción y los intermediarios de mensajes. Con la evolución de las tecnologías de código abierto y la nube, estas tecnologías se han convertido en productos básicos y no ofrecen valor comercial incremental.
Ten en cuenta las siguientes recomendaciones para preparar tu tecnología para el futuro.
Adopta un enfoque de datos como servicio (DaaS) para acelerar el tiempo de lanzamiento al mercado y lograr transparencia en los costos
Las organizaciones de FSI suelen evolucionar a través de una combinación de crecimiento orgánico y fusiones y adquisiciones (M&A). Como resultado, las organizaciones deben integrar tecnologías dispares. También deben administrar los recursos duplicados, como los proveedores de datos, las licencias de datos y los puntos de integración. Google Cloud brinda oportunidades para crear valor diferenciado en las integraciones posteriores a la fusión.
Por ejemplo, puedes usar servicios como el uso compartido de BigQuery para crear una plataforma de datos como servicio (DaaS) lista para el análisis. La plataforma puede proporcionar datos de mercado y entradas de fuentes alternativas. Este enfoque elimina la necesidad de crear canalizaciones de datos redundantes y te permite enfocarte en iniciativas más valiosas. Además, las empresas fusionadas o adquiridas pueden racionalizar de forma rápida y eficiente sus necesidades de infraestructura y licencias de datos posteriores a la fusión. En lugar de dedicar esfuerzos a adaptar y combinar las operaciones y los patrimonios de datos heredados, la empresa combinada puede enfocarse en nuevas oportunidades comerciales.
Crea una capa de abstracción para aislar los sistemas existentes y abordar los modelos de negocio emergentes
Cada vez más, la ventaja competitiva de los bancos no es el sistema bancario principal, sino su capa de experiencia del cliente. Sin embargo, los sistemas bancarios heredados suelen usar aplicaciones monolíticas que se desarrollaron en lenguajes como Cobol y se integran en toda la cadena de valor bancaria. Esta integración dificultó la separación de las capas de la cadena de valor, por lo que fue casi imposible actualizar y modernizar esos sistemas.
Una solución para abordar este desafío es usar una capa de aislamiento, como un sistema de administración de APIs o una capa de etapa de pruebas como Spanner, que duplica el libro de registros y facilita la modernización de los servicios con análisis avanzados y IA. Por ejemplo, Deutsche Bank usó Spanner para aislar su sistema bancario central heredado y comenzar su recorrido de innovación.