Ce document du Google Cloud Well-Architected Framework : perspective FSI fournit une présentation des principes et des recommandations pour optimiser les performances de vos charges de travail du secteur des services financiers (FSI) dans Google Cloud. Les recommandations de ce document s'alignent sur le pilier de l'optimisation des performances du framework Well-Architected.
L'optimisation des performances est une pratique courante dans les services financiers. Elle a aidé les organisations du secteur des services financiers à surmonter les défis techniques et a presque toujours permis ou accéléré la création de nouveaux modèles commerciaux. Par exemple, les distributeurs automatiques de billets (introduits en 1967) ont automatisé le processus de distribution d'argent liquide et ont aidé les banques à réduire le coût de leur activité principale. Des techniques telles que le contournement du noyau de l'OS et l'épinglage des threads d'application aux cœurs de calcul ont permis d'obtenir une latence déterministe et faible pour les applications de trading. La réduction de la latence a permis d'améliorer la liquidité et de la rendre plus ferme, avec des spreads plus serrés sur les marchés financiers.
Le cloud offre de nouvelles opportunités d'optimisation des performances. Il remet également en question certains schémas d'optimisation historiquement acceptés. Plus précisément, les compromis suivants sont plus transparents et contrôlables dans le cloud :
- Délai de mise sur le marché par rapport au coût.
- Performances de bout en bout au niveau du système par rapport aux performances au niveau du nœud.
- Disponibilité des talents par rapport à l'agilité de la prise de décision liée à la technologie.
Par exemple, adapter le matériel et les ressources informatiques à des exigences de compétences spécifiques est une tâche triviale dans le cloud. Pour prendre en charge la programmation GPU, vous pouvez facilement créer des VM basées sur GPU. Vous pouvez adapter la capacité dans le cloud pour faire face aux pics de demande sans surprovisionner les ressources. Cette fonctionnalité permet de s'assurer que vos charges de travail peuvent gérer les pics de charge, par exemple les jours de paie non agricole et lorsque les volumes de transactions sont nettement supérieurs aux niveaux historiques. Au lieu de dépenser de l'argent pour écrire du code hautement optimisé au niveau des serveurs individuels (comme du code très précis en langage C) ou pour écrire du code pour des environnements de calcul hautes performances (HPC) conventionnels, vous pouvez effectuer un scaling horizontal de manière optimale en utilisant un système distribué basé sur Kubernetes bien conçu.
Les recommandations d'optimisation des performances de ce document sont associées aux principes fondamentaux suivants :
- Aligner les métriques de performances technologiques sur les indicateurs clés de l'entreprise
- Prioriser la sécurité sans sacrifier les performances pour les risques non prouvés
- Repensez votre architecture pour vous adapter aux nouvelles opportunités et exigences
- Préparez votre technologie pour répondre aux besoins actuels et futurs de votre entreprise
Aligner les métriques de performances technologiques sur les indicateurs commerciaux clés
Vous pouvez mapper l'optimisation des performances aux résultats de valeur commerciale de plusieurs façons. Par exemple, dans un service de recherche buy-side, un objectif commercial peut être d'optimiser le résultat par heure de recherche ou de prioriser les tests des équipes ayant fait leurs preuves, comme celles ayant des ratios de Sharpe plus élevés. Du côté des ventes, vous pouvez utiliser l'analyse pour suivre l'intérêt des clients et, par conséquent, hiérarchiser le débit vers les modèles d'IA qui prennent en charge les recherches les plus intéressantes.
Il est également important d'associer les objectifs de performances aux indicateurs clés de performance (KPI) de l'entreprise pour financer l'amélioration des performances. Les initiatives d'innovation et de transformation de l'entreprise (parfois appelées efforts change-the-bank) disposent de budgets différents et peuvent avoir des degrés d'accès aux ressources potentiellement différents par rapport aux opérations habituelles ou run-the-bank. Par exemple, Google Cloud a aidé les équipes de gestion des risques et technologiques d'une IFSM à collaborer avec les analystes quantitatifs de front-office sur une solution permettant d'effectuer des calculs d'analyse des risques (tels que XVA) en quelques minutes au lieu de quelques heures ou jours. Cette solution a aidé l'organisation à répondre aux exigences de conformité pertinentes. Il a également permis aux traders d'avoir des conversations de meilleure qualité avec leurs clients, ce qui leur a permis de proposer des spreads plus serrés, une liquidité plus ferme et une couverture plus rentable.
Lorsque vous alignez vos métriques de performances sur les indicateurs commerciaux, tenez compte des recommandations suivantes :
- Associez chaque initiative technologique aux objectifs et résultats clés (OKR) pertinents pour l'entreprise, comme l'augmentation des revenus ou des bénéfices, la réduction des coûts et l'atténuation des risques de manière plus efficace ou holistique.
- Concentrez-vous sur l'optimisation des performances au niveau du système. Allez au-delà de la séparation conventionnelle entre "change-the-bank" et "run-the-bank", et des silos entre front office et back office.
Prioriser la sécurité sans sacrifier les performances pour les risques non prouvés
La sécurité et la conformité réglementaire dans les organisations du secteur des services financiers doivent être sans équivoque et de haut niveau. Il est essentiel de maintenir un niveau élevé pour éviter de perdre des clients et d'endommager de manière irréparable la marque d'une organisation. La plus grande valeur est souvent obtenue grâce à des innovations technologiques telles que l'IA générative et des services gérés uniques comme Spanner. Ne rejetez pas automatiquement ces options technologiques en raison d'une idée fausse générale concernant un risque opérationnel prohibitif ou une conformité réglementaire inadéquate.
Google Cloud a travaillé en étroite collaboration avec les établissements financiers d'importance systémique mondiale (G-SIFI) pour s'assurer qu'une approche basée sur l'IA pour la lutte contre le blanchiment d'argent puisse être utilisée dans les juridictions où les institutions servent leurs clients. Par exemple, HSBC a considérablement amélioré les performances de son unité de lutte contre la criminalité financière (Fincrime) avec les résultats suivants :
- Détectez et confirmez environ deux à quatre fois plus d'activités suspectes.
- Réduisez vos coûts opérationnels en éliminant plus de 60 % des faux positifs et en consacrant plus de temps à examiner les alertes exploitables signalant un risque élevé.
- Des résultats vérifiables et explicables pour respecter la conformité réglementaire.
Tenez compte des recommandations suivantes :
- Vérifiez que les produits que vous prévoyez d'utiliser peuvent vous aider à répondre aux exigences de sécurité, de résilience et de conformité pour les juridictions dans lesquelles vous opérez. Pour atteindre cet objectif, collaborez avec les équipes Google Cloudchargées des comptes, des risques et des produits.
- Créez des modèles plus performants et offrez de la transparence à vos clients en tirant parti de l'explicabilité de l'IA (par exemple, l'attribution de la valeur Shapley). Des techniques telles que l'attribution de la valeur Shapley peuvent attribuer les décisions du modèle à des caractéristiques spécifiques au niveau de l'entrée.
Assurez la transparence des charges de travail d'IA générative en utilisant des techniques telles que les citations de sources, l'ancrage et la RAG.
Lorsque l'explicabilité ne suffit pas, séparez les étapes de prise de décision dans vos flux de valeur et utilisez l'IA pour automatiser uniquement les étapes qui ne nécessitent pas de prise de décision. Dans certains cas, l'IA explicable peut ne pas suffire ou un processus peut nécessiter une intervention humaine en raison de problèmes réglementaires (par exemple, l'article 22 du RGPD). Dans ce cas, présentez toutes les informations dont l'agent humain a besoin pour prendre des décisions dans un seul panneau de contrôle, mais automatisez les tâches de collecte, d'ingestion, de manipulation et de synthèse des données.
Repensez votre architecture pour vous adapter aux nouvelles opportunités et exigences
L'ajout de fonctionnalités cloud à vos architectures actuelles peut apporter une valeur considérable. Pour obtenir des résultats plus transformateurs, vous devez repenser périodiquement votre architecture en adoptant une approche cloud-first.
Tenez compte des recommandations suivantes pour repenser régulièrement l'architecture de vos charges de travail afin d'optimiser davantage les performances.
Utiliser des alternatives cloud aux systèmes et planificateurs HPC sur site
Pour profiter d'une élasticité accrue, d'une sécurité renforcée et de fonctionnalités de surveillance et de gouvernance étendues, vous pouvez exécuter des charges de travail HPC dans le cloud ou décharger des charges de travail sur site vers le cloud. Toutefois, pour certains cas d'utilisation de la modélisation numérique, comme la simulation de stratégies d'investissement ou la modélisation XVA, combiner Kubernetes avec Kueue peut offrir une solution plus puissante.
Passer à la programmation basée sur les graphiques pour les simulations
Les simulations de Monte-Carlo peuvent être beaucoup plus performantes dans un système d'exécution basé sur des graphiques tel que Dataflow. Par exemple, HSBC utilise Dataflow pour exécuter des calculs de risque 16 fois plus rapidement qu'avec son approche précédente.
Exécuter des plates-formes d'échange et de trading basées dans le cloud
Les conversations avec les clients Google Cloud révèlent que le principe de Pareto 80/20 s'applique aux exigences de performances des applications de marché et de trading.
- Plus de 80 % des applications de trading n'ont pas besoin d'une latence extrêmement faible. Toutefois, ils bénéficient des capacités de résilience, de sécurité et d'élasticité du cloud. Par exemple, BidFX, une plate-forme multiconcessionnaire de change, utilise le cloud pour lancer rapidement de nouveaux produits et augmenter considérablement leur disponibilité et leur couverture sans augmenter les ressources.
- Les applications restantes (moins de 20 %) ont besoin d'une faible latence (moins d'une milliseconde), de déterminisme et d'équité dans la diffusion des messages. Ces systèmes fonctionnent généralement dans des installations colocalisées rigides et coûteuses. De plus en plus, même cette catégorie d'applications est replatformée dans le cloud, soit en périphérie, soit en tant qu'applications cloud-first.
Pérennisez votre technologie pour répondre aux besoins actuels et futurs de votre entreprise
Historiquement, de nombreuses organisations du secteur des services financiers ont développé des technologies propriétaires pour obtenir un avantage concurrentiel. Par exemple, au début des années 2000, les banques d'investissement et les sociétés de trading performantes avaient leurs propres implémentations de technologies fondamentales telles que les systèmes pub-sub et les courtiers de messages. Avec l'évolution des technologies Open Source et du cloud, ces technologies sont devenues des produits de base et n'offrent plus de valeur commerciale incrémentielle.
Tenez compte des recommandations suivantes pour pérenniser votre technologie.
Adoptez une approche "data-as-a-service" (DaaS) pour accélérer la mise sur le marché et assurer la transparence des coûts.
Les institutions financières évoluent souvent grâce à une combinaison de croissance organique et de fusions et acquisitions. Par conséquent, les organisations doivent intégrer des technologies disparates. Ils doivent également gérer les ressources en double, telles que les fournisseurs de données, les licences de données et les points d'intégration. Google Cloud offre des opportunités de créer une valeur différenciée dans les intégrations post-fusion.
Par exemple, vous pouvez utiliser des services tels que le partage BigQuery pour créer une plate-forme de données en tant que service (DaaS) prête à l'analyse. La plate-forme peut fournir des données de marché et des entrées provenant de sources alternatives. Cette approche élimine la nécessité de créer des pipelines de données redondants et vous permet de vous concentrer sur des initiatives plus intéressantes. De plus, les entreprises fusionnées ou acquises peuvent rapidement et efficacement rationaliser leurs besoins en matière de licence de données et d'infrastructure après la fusion. Au lieu de s'efforcer d'adapter et de fusionner les opérations et les patrimoines de données existants, l'entreprise combinée peut se concentrer sur de nouvelles opportunités commerciales.
Créez une couche d'abstraction pour isoler les systèmes existants et répondre aux nouveaux modèles économiques.
De plus en plus, l'avantage concurrentiel des banques ne réside pas dans le système bancaire central, mais dans leur couche d'expérience client. Toutefois, les anciens systèmes bancaires utilisent souvent des applications monolithiques développées dans des langages tels que Cobol et intégrées à l'ensemble de la chaîne de valeur bancaire. Cette intégration rendait difficile la séparation des couches de la chaîne de valeur, ce qui rendait presque impossible la mise à niveau et la modernisation de ces systèmes.
Pour relever ce défi, vous pouvez utiliser une couche d'isolation telle qu'un système de gestion des API ou une couche intermédiaire comme Spanner, qui duplique le livre de référence et facilite la modernisation des services grâce à l'analyse avancée et à l'IA. Par exemple, la Deutsche Bank a utilisé Spanner pour isoler son ancien système bancaire central et commencer son parcours d'innovation.