流程總覽

總覽

本頁面���������������範 AI 處理程序,並介紹相關重要概念,方便客戶瞭解相關資訊。這項服務主要針對將使用 AML AI 訓練、測試及部署模型的團隊。

銀行可透過 AML AI 自動訓練、測試及部署偵測洗錢的模型。AML AI 指南分為五個左側導覽部分,對應下列五個步驟。

步驟說明
1. 設定 AML AI 確認 Google Cloud 專案已準備好使用 AML AI。啟用必要的 Google Cloud 服務,並設定記錄和配額。 建立一或多個 AML AI 執行個體。
2. 為 AML AI 準備資料 查看資料模型和結構定義。決定要納入哪些資料。 收集及轉換必要的核心銀行資料、風險調查資料,以及您需要的任何其他資料。建立及驗證資料集。
3. 產生模型並評估成效 瞭解 AML AI 引擎、模型和回測。
  1. 設定引擎
  2. 訓練模型
  3. 評估模型效能
4. 產生風險分數和可解釋性 註冊零售和商業銀行客戶。使用模型為下列項目產生個別風險分數和可解釋性:
  • 風險治理分析與測試
  • 前製和正式版使用
5. 準備模型和風險管理 將經過微調、訓練、評估和預測的 AML AI 輸出內容,與 AML 概念和產品文件結合,以符合模型風險治理程序的要求。

建立、測試及部署模型的核心反詐欺 AI 技術作業如下所示。這些支援步驟對應上表中的步驟 2 至 4。

  1. 建立 AML AI 資料集:為 AML AI 建立一組結構化的 BigQuery 輸入資料表
  2. 引擎設定:針對 AML AI 資料集調整 AML AI 引擎,包括超參數調整
  3. 模型訓練:使用引擎設定和資料集訓練 AML AI 模型
  4. 回測:根據資料集的歷來資料測試 AML AI 模型,並匯總成效
  5. 註冊各方:註冊各方 (銀行的客戶,擁有銀行產品並傳送或接收交易),以便在預測中評分
  6. 預測:產生可用於實際工作環境的派對分數和可解釋性

引擎設定、模型訓練、模型回測和模型預測都需要 AML AI 資料集做為輸入內容,並傳回其他作業中使用的相應構件。舉例來說,模型訓練會傳回經過訓練的 AML AI 模型參照,可用於回測或預測。如需作業的技術詳細資料,請參閱 REST 參考資料總覽

反洗錢 AI 程序的依附元件樹狀結構

反洗錢 AI 程序的依附元件樹狀結構

使用反洗錢 AI 時的重要考量

本節旨在向客戶介紹反洗錢 AI 的關鍵概念,並提供一些最佳做法。如要進一步瞭解這些主題,請參閱專屬指南和提供的連結。

日期一致性

AML AI 會根據不同的作業使用不同的時間範圍。請謹慎選取每項作業的日期,確保可靠的結果。特別是為了避免結果出現偏差,請務必確保用於訓練反洗錢 AI 模型的月份,與用於回測的月份不重疊。

由於 AML AI 資料集包含多個月的資料,因此資料集可用於多項作業,但必須依據這些正確的日期選項。下圖說明使用 AML AI 的開發週期,其中單一資料集內的不同時間範圍 (跨越 42 個月) 用於設定引擎 (超參數調整)、訓練和回測。所有這些程序都會使用回溯期,為模型提供背景資訊,並可安全地與用於其他作業的資料重疊。

如要進一步瞭解 AML AI 資料集和不同作業的時限,請參閱「瞭解資料範圍和時間長度」。

如要確保正確記錄資料隨時間的變化,請參閱「資料隨時間的變化」。

建立 AML AI 資料集 - 步驟 1-4

製作批次頻率

在預測時,AML AI 會根據每個日曆月的資料產生 AML 風險分數。客戶通常會在每月批次處理程序中使用 AML AI,建議您盡可能在有完整交易資料的月份執行預測作業。

欄位一致性

如同任何機器學習程序,訓練資料和測試資料之間的資料應盡可能一致。如果欄位未一致填入資料,變更可能會導致結果不準確。強烈建議您採取必要步驟,確保在開發週期中,每個作業的欄位都能一致填入資料,尤其是在每個作業使用不同資料集的情況下。詳情請參閱「資料集一致性」。

引擎設定

建立引擎設定後,通常不需要為每個新資料集或每個開發週期重新建立引擎設定。在引擎設定中為某個資料集選擇的超參數,通常在類似的資料集上也能發揮良好的效能。

下圖說明迭代式開發週期,而上圖則是使用單一資料集進行模型訓練和回測作業。

詳情請參閱「何時應調整或繼承」。

建立 AML AI 資料集 - 步驟 3-4

資料歷程

大多數模型治理政策都會定義追蹤資料系譜的必要條件,這些資料系譜會用於引擎設定、訓練、評估和預測等所有機器學習作業。客戶有責任追蹤這類資料沿革。

建議您在所有輸入資料、AML AI 資源和輸出資料的名稱中使用專屬 ID,以便追蹤各階段的沿革。這有助於確保在特定執行作業中,資源之間的連結強度。客戶也可以為所有反洗錢 AI 資源加上標籤,以符合血統規定。

此外,建議您在 API 要求中使用 BigQuery 快照,確保資料階層正確無誤。

這項設定可協助您回答「這個引擎設定來自何處?」和「這個模型來自何處?」等問題,同時協助調查及解決事件。

如要進一步瞭解如何建立及管理反詐欺 AI 資源,請參閱 REST API 頁面。

建立 AML AI 資料集 - 步驟 3-4