Dieses Dokument im Google Cloud Well-Architected Framework: FSI perspective bietet einen Überblick über Prinzipien und Empfehlungen zur Optimierung der Leistung Ihrer Arbeitslasten für die Finanzdienstleistungsbranche (Financial Services Industry, FSI) in Google Cloud. Die Empfehlungen in diesem Dokument entsprechen der Säule zur Leistungsoptimierung des Well-Architected Framework.
Die Leistungsoptimierung hat in der Finanzdienstleistungsbranche eine lange Tradition. Sie hat Finanzinstituten geholfen, technische Herausforderungen zu meistern, und war fast immer ein Enabler oder Beschleuniger für die Entwicklung neuer Geschäftsmodelle. Geldautomaten (1967 eingeführt) haben beispielsweise die Bargeldausgabe automatisiert und Banken geholfen, die Kosten ihres Kerngeschäfts zu senken. Techniken wie das Umgehen des Betriebssystemkernels und das Anpinnen von Anwendungs-Threads an Rechenkerne trugen dazu bei, deterministische und niedrige Latenzzeiten für Trading-Anwendungen zu erreichen. Die geringere Latenz führte zu einer höheren und stabileren Liquidität mit geringeren Spreads auf den Finanzmärkten.
Die Cloud bietet neue Möglichkeiten zur Leistungsoptimierung. Außerdem werden einige der bisher akzeptierten Optimierungsmuster infrage gestellt. Insbesondere die folgenden Kompromisse sind in der Cloud transparenter und besser kontrollierbar:
- Produkteinführungszeit im Vergleich zu Kosten.
- End-to-End-Leistung auf Systemebene im Vergleich zur Leistung auf Knotenebene.
- Verfügbarkeit von Fachkräften im Vergleich zur Agilität der technologiebezogenen Entscheidungsfindung.
So ist es beispielsweise in der Cloud ganz einfach, Hardware und IT-Ressourcen an bestimmte Kompetenzanforderungen anzupassen. Zur Unterstützung der GPU-Programmierung können Sie ganz einfach GPU-basierte VMs erstellen. Sie können die Kapazität in der Cloud skalieren, um Nachfragespitzen zu bewältigen, ohne Ressourcen überzubereitstellen. So können Sie sicherstellen, dass Ihre Arbeitslasten Spitzenlasten bewältigen können, z. B. an Tagen, an denen die Lohn- und Gehaltsabrechnungen außerhalb der Landwirtschaft veröffentlicht werden, und wenn das Handelsvolumen deutlich höher ist als in der Vergangenheit. Anstatt hochoptimierten Code auf der Ebene einzelner Server zu schreiben (z. B. hochgradig optimierter Code in der Programmiersprache C) oder Code für herkömmliche Hochleistungs-Computing-Umgebungen (HPC) zu schreiben, können Sie optimal skalieren, indem Sie ein gut strukturiertes Kubernetes-basiertes verteiltes System verwenden.
Die Empfehlungen zur Leistungsoptimierung in diesem Dokument sind den folgenden Grundprinzipien zugeordnet:
- Technologie-Leistungsmesswerte an wichtigen Geschäftskennzahlen ausrichten
- Sicherheit priorisieren, ohne die Leistung für unbewiesene Risiken zu beeinträchtigen
- Architektur an neue Möglichkeiten und Anforderungen anpassen
- Technologie zukunftssicher machen, um aktuelle und zukünftige Geschäftsanforderungen zu erfüllen
Technologie-Leistungsmesswerte an wichtigen Geschäftskennzahlen ausrichten
Es gibt verschiedene Möglichkeiten, die Leistungsoptimierung den Geschäftsergebnissen zuzuordnen. In einem Buy-Side-Research-Desk könnte ein Geschäftsziel beispielsweise darin bestehen, die Leistung pro Forschungsstunde zu optimieren oder Experimente von Teams mit einer nachgewiesenen Erfolgsbilanz zu priorisieren, z. B. mit höheren Sharpe Ratios. Auf der Verkaufsseite können Sie mit Analysen das Interesse von Kunden verfolgen und den Durchsatz zu KI-Modellen, die die interessantesten Recherchen unterstützen, entsprechend priorisieren.
Es ist auch wichtig, Leistungsziele mit wichtigen KPIs (Key Performance Indicators) des Unternehmens zu verknüpfen, um Leistungsverbesserungen zu finanzieren. Initiativen zur Geschäftsinnovation und -transformation (manchmal auch als Change-the-Bank-Bemühungen bezeichnet) haben unterschiedliche Budgets und möglicherweise unterschiedliche Zugriffsrechte auf Ressourcen im Vergleich zu BAU- oder Run-the-Bank-Vorgängen. Google Cloud hat beispielsweise den Risikomanagement- und Technologieteams einer G-SIFI geholfen,mit den quantitativen Analysten im Frontoffice an einer Lösung für die Durchführung von Risikoanalyseberechnungen (z. B. XVA) in Minuten statt Stunden oder Tagen zusammenzuarbeiten. Diese Lösung hat der Organisation geholfen, die relevanten Compliance-Anforderungen zu erfüllen. Außerdem konnten die Händler qualitativ hochwertigere Gespräche mit ihren Kunden führen und potenziell engere Spreads, eine stabilere Liquidität und kostengünstigere Absicherungen anbieten.
Wenn Sie Ihre Leistungsmesswerte an Geschäftsindikatoren anpassen, sollten Sie die folgenden Empfehlungen berücksichtigen:
- Verknüpfen Sie jede Technologieinitiative mit den relevanten Geschäftszielen und ‑schlüsselergebnissen (Objectives and Key Results, OKRs), z. B. Umsatz- oder Gewinnsteigerung, Kostensenkung und effizientere oder ganzheitlichere Risikominderung.
- Konzentrieren Sie sich auf die Optimierung der Leistung auf Systemebene. Sehen Sie über die herkömmliche Trennung zwischen „Change the Bank“ und „Run the Bank“ sowie zwischen Front- und Backoffice hinaus.
Sicherheit priorisieren, ohne die Leistung für unbewiesene Risiken zu beeinträchtigen
Sicherheit und Einhaltung von Vorschriften in Finanzinstituten müssen zweifelsfrei auf hohem Niveau sein. Ein hoher Standard ist unerlässlich, um Kunden nicht zu verlieren und irreparablen Schaden für die Marke eines Unternehmens zu vermeiden. Oft wird der höchste Wert durch technologische Innovationen wie generative KI und einzigartige, verwaltete Dienste wie Spanner erzielt. Solche Technologieoptionen sollten nicht automatisch aufgrund eines pauschalen Missverständnisses über ein unvertretbares Betriebsrisiko oder eine unzureichende Einhaltung von Vorschriften verworfen werden.
Google Cloud hat eng mit G-SIFIs zusammengearbeitet, um sicherzustellen, dass ein KI-basierter Ansatz für Anti-Money Laundering (AML) in allen Gerichtsbarkeiten verwendet werden kann, in denen die Institutionen Kunden bedienen. HSBC hat die Leistung seiner Abteilung für Finanzkriminalität (Fincrime) deutlich gesteigert. Die Ergebnisse sind:
- Fast zwei- bis viermal mehr bestätigte verdächtige Aktivitäten.
- Senkung der Betriebskosten durch die Eliminierung von über 60% der falsch positiven Ergebnisse und die Konzentration der Untersuchungszeit auf risikoreiche, umsetzbare Benachrichtigungen.
- Prüfbare und erklärbare Ergebnisse zur Unterstützung der Einhaltung gesetzlicher Vorschriften.
Beachten Sie die folgenden Empfehlungen:
- Prüfen Sie, ob die Produkte, die Sie verwenden möchten, die Sicherheits-, Resilienz- und Complianceanforderungen für die Gerichtsbarkeiten erfüllen, in denen Sie tätig sind. Um dieses Ziel zu erreichen, arbeiten Sie mit Google CloudAccount-Management-, Risikomanagement- und Produktteams zusammen.
- Leistungsfähigere Modelle erstellen und Kunden Transparenz bieten, indem Sie die Erklärbarkeit von KI nutzen (z. B. Shapley-Wert-Attribution). Mit Techniken wie der Shapley-Wert-Attribution können Modellentscheidungen bestimmten Features auf der Eingabeebene zugeordnet werden.
Sorgen Sie für Transparenz bei generativen KI-Arbeitslasten, indem Sie Techniken wie Quellenangaben, Grounding und RAG verwenden.
Wenn die Erklärbarkeit nicht ausreicht, trennen Sie die Entscheidungsschritte in Ihren Wertströmen und verwenden Sie KI nur, um die nicht entscheidungsbezogenen Schritte zu automatisieren. In einigen Fällen reicht erklärbare KI möglicherweise nicht aus oder ein Prozess erfordert aufgrund von behördlichen Bedenken (z. B. DSGVO, Artikel 22) menschliches Eingreifen. Stellen Sie in solchen Fällen alle Informationen, die der Kundenservicemitarbeiter für die Entscheidungsfindung benötigt, in einem einzigen Steuerfeld dar, automatisieren Sie jedoch die Aufgaben zum Erfassen, Aufnehmen, Bearbeiten und Zusammenfassen von Daten.
Architektur an neue Möglichkeiten und Anforderungen anpassen
Wenn Sie Ihre aktuellen Architekturen mit cloudbasierten Funktionen erweitern, kann das einen erheblichen Mehrwert bieten. Um transformative Ergebnisse zu erzielen, müssen Sie Ihre Architektur regelmäßig mit einem Cloud-First-Ansatz überdenken.
Beachten Sie die folgenden Empfehlungen, um die Architektur Ihrer Arbeitslasten regelmäßig zu überdenken und die Leistung weiter zu optimieren.
Cloudbasierte Alternativen zu lokalen HPC-Systemen und ‑Schedulern verwenden
Um von höherer Elastizität, einem verbesserten Sicherheitsstatus und umfassenden Monitoring- und Governance-Funktionen zu profitieren, können Sie HPC-Arbeitslasten in der Cloud ausführen oder lokale Arbeitslasten in die Cloud verlagern. Für bestimmte Anwendungsfälle für die numerische Modellierung, z. B. die Simulation von Anlagestrategien oder die XVA-Modellierung, kann die Kombination von Kubernetes mit Kueue jedoch eine leistungsstärkere Lösung bieten.
Auf grafische Programmierung für Simulationen umstellen
Monte-Carlo-Simulationen können in einem auf Graphen basierenden Ausführungssystem wie Dataflow viel leistungsfähiger sein. HSBC verwendet Dataflow beispielsweise, um Risikoberechnungen 16-mal schneller als mit dem bisherigen Ansatz auszuführen.
Cloudbasierte Börsen und Handelsplattformen betreiben
Gespräche mit Google Cloud Kunden haben ergeben, dass das 80/20-Pareto-Prinzip für die Leistungsanforderungen von Markt- und Handelsanwendungen gilt.
- Für mehr als 80% der Trading-Anwendungen ist keine extrem niedrige Latenz erforderlich. Sie profitieren jedoch erheblich von den Funktionen der Cloud in Bezug auf Resilienz, Sicherheit und Elastizität. BidFX, eine Multi-Dealer-Plattform für den Devisenhandel, nutzt die Cloud beispielsweise, um schnell neue Produkte einzuführen und ihre Verfügbarkeit und Reichweite deutlich zu steigern, ohne Ressourcen zu erhöhen.
- Die verbleibenden Anwendungen (weniger als 20%) benötigen eine niedrige Latenz (weniger als eine Millisekunde), Determinismus und Fairness bei der Zustellung von Nachrichten. Normalerweise werden diese Systeme in starren und teuren Colocation-Einrichtungen betrieben. Auch diese Kategorie von Anwendungen wird zunehmend in die Cloud migriert, entweder am Edge oder als Cloud-First-Anwendungen.
Technologie zukunftssicher machen, um aktuelle und zukünftige Geschäftsanforderungen zu erfüllen
In der Vergangenheit haben viele Finanzinstitute eigene Technologien entwickelt, um sich einen Wettbewerbsvorteil zu verschaffen. So hatten beispielsweise erfolgreiche Investmentbanken und Handelsunternehmen in den frühen 2000er-Jahren eigene Implementierungen von grundlegenden Technologien wie Pub/Sub-Systemen und Message-Brokern. Mit der Entwicklung von Open-Source-Technologien und der Cloud sind solche Technologien zu Commodities geworden und bieten keinen zusätzlichen geschäftlichen Mehrwert.
Beachten Sie die folgenden Empfehlungen, um Ihre Technologie zukunftssicher zu machen.
Einführung eines Data-as-a-Service-Ansatzes (DaaS) für eine schnellere Markteinführung und Kostentransparenz
FSI-Organisationen entwickeln sich oft durch eine Kombination aus organischem Wachstum und Fusionen und Übernahmen (Mergers and Acquisitions, M&A). Daher müssen die Organisationen unterschiedliche Technologien integrieren. Außerdem müssen sie doppelte Ressourcen wie Datenanbieter, Datenlizenzen und Integrationspunkte verwalten. Google Cloud bietet Möglichkeiten, um bei Integrationen nach Fusionen einen differenzierten Mehrwert zu schaffen.
Sie können beispielsweise Dienste wie BigQuery-Freigabe verwenden, um eine analysebereite Data-as-a-Service-Plattform (DaaS) zu erstellen. Die Plattform kann sowohl Marktdaten als auch Eingaben aus alternativen Quellen liefern. So müssen keine redundanten Datenpipelines erstellt werden und Sie können sich auf wichtigere Initiativen konzentrieren. Außerdem können die fusionierten oder übernommenen Unternehmen ihre Anforderungen an die Datenlizenzierung und Infrastruktur nach der Fusion schnell und effizient rationalisieren. Statt sich mit der Anpassung und Zusammenführung von Legacy-Datenbeständen und ‑Vorgängen zu befassen, kann sich das kombinierte Unternehmen auf neue Geschäftsmöglichkeiten konzentrieren.
Abstraktionsebene erstellen, um vorhandene Systeme zu isolieren und neue Geschäftsmodelle zu berücksichtigen
Der Wettbewerbsvorteil für Banken liegt zunehmend nicht im Kernbanksystem, sondern in der Kundenerlebnisschicht. In älteren Bankensystemen werden jedoch häufig monolithische Anwendungen verwendet, die in Sprachen wie Cobol entwickelt wurden und in die gesamte Wertschöpfungskette der Bank integriert sind. Diese Integration erschwerte die Trennung der Ebenen der Wertschöpfungskette, sodass es nahezu unmöglich war, solche Systeme zu aktualisieren und zu modernisieren.
Eine Lösung für diese Herausforderung ist die Verwendung einer Isolierungsebene wie eines API-Verwaltungssystems oder einer Staging-Ebene wie Spanner, die das Book of Record dupliziert und die Modernisierung von Diensten mit erweiterten Analysen und KI erleichtert. Die Deutsche Bank hat beispielsweise Spanner verwendet, um ihre Legacy-Core-Banking-Umgebung zu isolieren und mit Innovationen zu beginnen.