은행 보안 강화: 사기 탐지를 위한 머신러닝
게시 됨: 2023-11-14모든 기회에는 위협이 따릅니다. 은행 산업의 디지털화로의 전환은 고객 경험을 개선하고 고객 기반을 이전에 은행 서비스를 이용하지 못했던 인구로 확대했습니다. 단점은 온라인 거래와 디지털 결제 솔루션이 사기꾼들이 악용할 수 있는 새로운 길을 열었다는 것입니다.
KMPG 사기 조사 결과에 따르면 사이버 공격의 빈도와 심각도가 증가하여 수십억 달러의 손실이 발생하는 것으로 나타났습니다.
위 그래프는 2022년 미국의 결제수단별 사기손실 가치를 보여준다. 은행송금과 결제가 15억9000만 달러의 손실로 가장 높았다.
이러한 손실로 인해 은행 기관은 금융 사기를 탐지, 완화 및 방지하기 위한 새로운 솔루션을 채택해야 했습니다. 그러한 방법 중 하나가 인공지능(AI), 특히 머신러닝입니다.
이 기사에서는 혜택 및 실제 적용을 포함하여 사기 탐지를 위한 기계 학습 에 대해 알아야 할 모든 것을 논의합니다.
사기 탐지의 진화
기존 사기 탐지는 규칙 기반 접근 방식을 따릅니다. 이름에서 알 수 있듯이 거래가 진짜인지 사기인지를 결정하는 일련의 규칙이나 조건에 따라 운영됩니다. 일반적인 조건에는 위치(사용자의 평소 지역을 벗어나서 구매하는가?)와 빈도(사용자가 평소에 구매하는 횟수와 유형이 있는가?)가 포함됩니다.
조건을 충족하는 경우에만 거래가 진행됩니다. 예를 들어, 오하이오에 있는 고객이 갑자기 뉴질랜드에서 POS 요금을 청구하게 되었습니다. 해당 위치가 사용자의 지역 번호를 벗어나므로 시스템에서는 해당 거래를 사기로 표시합니다.
이러한 유형의 사기 탐지 시스템에는 몇 가지 단점이 있습니다.
- 이는 많은 수의 거짓 긍정을 생성합니다. 이곳은 실제 고객의 결제를 차단하는 곳입니다.
- 융통성이 없습니다. 규칙 기반 접근 방식은 고정된 결과를 사용하므로 디지털 뱅킹의 추세에 적응하기 어렵습니다. 새로운 형태의 사기를 포착하려면 규칙을 바꿔야 합니다.
- 확장되지 않습니다. 데이터가 증가하면 이를 방지하기 위한 노력도 늘어납니다. 시스템에 대한 모든 변경은 수동으로 수행되므로 비용과 시간이 많이 소요됩니다.
규칙 기반 사기 탐지가 작동합니다. 그러나 단점으로 인해 현대 디지털 환경에는 적합하지 않습니다. 패턴을 인식할 수 없으며 사람의 개입에 의존합니다.
또한 해커는 9-5 근무 일정을 따르지 않으며 위치 스푸핑, 고객 행동 가장과 같은 정교한 방법을 배포하여 사기 탐지 시스템을 속일 수 있습니다. 따라서 연중무휴로 작동하는 똑같이 고도로 개발된 시스템이 필요합니다.
머신러닝을 시작하세요.
머신 러닝은 데이터를 사용하여 사기 탐지 알고리즘을 교육하여 데이터 패턴과 관계를 파악하고 통찰력을 얻고 예측을 수행하는 인공 지능(AI)입니다 .
당신은 머신러닝을 모르더라도 이미 익숙합니다. 예를 들어, 귀하가 Instagram 게시물에 참여할 때마다 귀하는 귀하가 좋아하는 콘텐츠 유형에 대한 정보를 알고리즘에 제공합니다. 그런 다음 피드에 추가할 유사한 콘텐츠를 찾기 위해 앱을 샅샅이 뒤집니다.
머신러닝이 사기 탐지를 어떻게 변화시킬 것인가
머신 러닝을 활용한 은행 사기 탐지는 사기를 더 빠르고, 더 유연하고, 더 정확하게 식별하고 대응함으로써 이미 업계를 변화시키고 있습니다.
AI 시스템은 고객 데이터의 패턴을 분석하고 과거 위협과 새로운 위협을 기반으로 규칙을 자동으로 변경합니다.
앞서 언급한 뉴질랜드 POS 요금을 기억하시나요? 기계 학습을 사용한 사기 탐지는 동일한 은행 카드로 해당 위치로 가는 항공편을 구매한 것으로 간주합니다. 따라서 새로운 차변은 합법적일 가능성이 높습니다.
사기를 탐지하기 위한 알고리즘을 훈련하는 데는 감독된 기계 학습과 비지도 기계 학습이라는 두 가지 모델이 사용됩니다.
감독형 기계 학습
지도 학습 모델은 사기 또는 사기 아님 태그가 지정된 대량의 데이터를 알고리즘에 제공합니다. 알고리즘은 이러한 예를 연구하고 어떤 패턴과 관계가 합법적인 거래와 사기성 거래를 구별하는지 학습합니다.
이 학습 모델은 데이터에 수동으로 태그를 지정해야 하므로 시간이 많이 걸립니다. 또한 데이터 세트에는 올바르게 레이블이 지정되고 잘 구성되어 있어야 합니다. 잘못 태그된 거래는 알고리즘의 정확성에 영향을 미칩니다.
또한 훈련 세트에 포함된 입력에서만 학습합니다. 따라서 새로 출시된 모바일 뱅킹 앱 기능을 통한 거래 내역 데이터에 포함되지 않은 거래에는 플래그가 지정되지 않습니다. 이제 사기꾼들이 이용할 수 있는 허점이 생겼습니다.
비지도 머신러닝
비지도 학습 모델은 최소한의 인간 입력을 사용합니다. 이 알고리즘은 태그가 지정되지 않은 대량의 데이터에서 패턴과 관계를 학습하고 유사점과 차이점을 기준으로 데이터 세트를 그룹화합니다.
목표는 훈련 데이터 세트에 포함되지 않은 비정상적인 활동을 찾아내는 것입니다. 따라서 비지도 학습은 지도 학습이 중단되는 지점을 선택하고 새로운 사기를 감지합니다.
지도 또는 비지도 기계 학습 모델 중에서 선택할 필요가 없다는 점을 기억하십시오. 함께(반지도 학습 모델) 또는 독립적으로 사용할 수 있습니다.
사기 탐지에 ML을 사용할 때의 이점
우리는 은행에서 기계 학습을 사용하여 사기 탐지의 이점을 암시했지만 이에 대해 더 자세히 논의해 보겠습니다.
- 속도
기계 학습 계산은 빠르게 이루어지며 실시간으로 사기 결정을 내립니다. 규칙 기반 알고리즘도 실시간으로 결정을 내리지만, 사기 행위를 신고하기 위해 서면 규칙을 사용합니다.
사전 정의된 규칙이 없는 새로운 시나리오에서는 어떻게 되나요? 이는 거짓양성 또는 거짓음성으로 이어집니다.
기계 학습은 새로운 패턴을 자동으로 감지하여 정기적인 고객 활동을 분석하고 밀리초 내에 적절한 결과를 계산합니다.
- 정확성
규칙 기반 탐지 시스템은 고객 행동의 미묘한 차이를 탐지하지 못하기 때문에 실제 거래를 차단하거나 사기 거래를 허용합니다.
기계 학습 시스템은 알려진 사기 행위와 같이 서면 규칙 이상의 변수를 고려합니다. 이러한 변수는 트랜잭션의 맥락을 파악하여 오탐률을 낮추는 데 도움이 됩니다.
- 유연성
기계 학습은 유연하고 반응적입니다. 자체 학습 기능을 통해 이 시스템은 새로운 시나리오에 적응하고 새로운 위협을 탐지할 수 있습니다. 규칙 기반 시스템은 엄격하고 학습 기능이 없습니다. 따라서 사전에 정의된 규칙에 따라서만 사기 행위에 대응할 수 있습니다.
- 능률
기계 학습 알고리즘은 초당 수천 건의 거래 데이터를 분석할 수 있습니다. 낮거나 중간 정도의 사기 사건을 조사하는 데 인건비와 간접비를 지출하는 대신, 머신러닝은 반복적이거나 명백한 사기를 처리할 수 있습니다. 이를 통해 사기 전문가는 인간의 통찰력이 필요한 복잡한 패턴에 집중할 수 있습니다.
- 확장성
데이터 양이 증가하면 규칙 기반 시스템에 부담이 가해집니다. 새로운 규칙은 시스템의 복잡성을 가중시켜 유지 관리를 어렵게 만듭니다. 오류나 모순이 있으면 전체 모델이 무효화될 수 있습니다.
머신러닝 시스템은 그 반대입니다. 그들은 많은 양의 새로운 데이터를 흡수할 뿐만 아니라 성능도 향상됩니다.
사기 탐지에 사용되는 기계 학습 기술
AI 사기 탐지에 사용되는 다양한 알고리즘을 살펴보기 전에 시스템 작동 방식을 간략하게 살펴보겠습니다.
첫 번째 단계는 데이터 입력입니다. 모델의 정확도는 데이터의 양과 품질에 따라 달라집니다. 고품질 데이터를 추가할수록 모델이 더욱 정확해집니다.
다음으로, 모델은 데이터를 분석하고 정상적인 행동과 사기 행위를 설명하는 주요 특징을 추출합니다 . 이러한 기능에는 고객 신원(이메일 또는 전화번호), 위치(IP 또는 배송 주소), 결제 방법(카드 소유자 이름 및 발송 국가) 등이 포함됩니다.
세 번째 단계는 진짜 거래와 사기 거래를 구별하기 위해 (더 많은 데이터로) 알고리즘을 훈련시키는 것 입니다. 모델은 훈련 데이터 세트를 수신하고 다양한 경우의 사기 확률을 예측합니다. 알고리즘이 충분히 훈련되면 시작할 준비가 된 것입니다.
이제 사용할 수 있는 다양한 알고리즘을 살펴보겠습니다.
1. 로지스틱 회귀
로지스틱 회귀는 지도 학습 알고리즘입니다. 모델의 매개변수를 기반으로 사기 또는 비사기라는 이진 척도로 사기 확률을 계산합니다.
그래프의 긍정적인 측면에 있는 거래는 사기일 가능성이 가장 높으며 부정적인 측면에 있는 거래는 합법적일 가능성이 가장 높습니다.
2. 의사결정나무
의사결정 트리는 지도 학습 알고리즘이지만 로지스틱 회귀 알고리즘보다 더 발전합니다. 데이터를 수준별로 분석하여 거래의 진위 여부를 판단하는 계층적 의사결정 구조입니다.
아래는 신용카드 사기 탐지를 위한 의사결정 트리를 보여줍니다.
부정거래 여부를 판별하는 조건은 거래금액이다. 거래 금액이 설정된 임계값을 초과하면 알고리즘은 이를 사기로 간주합니다. 그렇지 않은 경우 트리는 트랜잭션 시간이라는 또 다른 조건을 확인합니다. 만약 타이밍이 특이하다면(여기서는 오전 3시) 사기일 가능성이 높습니다. 그렇지 않은 경우 다른 조건을 확인합니다. 계속됩니다.
3. 랜덤 포레스트
랜덤 포레스트는 각 결정 트리가 신원, 위치 등 다양한 조건을 확인하는 여러 결정 트리의 조합입니다.
모든 매개변수를 확인한 후 모든 하위 트리에서 결정을 내립니다. 합산된 총액에 따라 거래가 진짜인지 사기인지가 결정됩니다.
4. 신경망
신경망은 복잡하고 감독되지 않는 알고리즘입니다. 인간의 두뇌에서 영감을 받은 신경망은 여러 계층의 데이터를 처리하여 높은 수준의 특징을 추출합니다. 이 알고리즘은 그림, 텍스트, 오디오 및 기타 데이터의 패턴을 인식할 수 있는 딥 러닝과 함께 작동합니다.
다음은 신경망의 단순화된 버전입니다.
신경망에는 입력, 은닉, 출력의 세 가지 계층이 있습니다. 입력 계층은 데이터를 처리하고, 은닉 계층은 입력 계층의 데이터를 분석하여 숨겨진 패턴을 식별하고, 출력 계층은 데이터를 분류합니다.
심층 신경망에는 여러 개의 숨겨진 레이어가 있습니다. 비선형 관계를 식별하고 전례 없는 사기 시나리오를 탐지하는 데 적합합니다.
5. 지원 벡터 머신
SVM(지원 벡터 머신)은 이상값을 예측, 분류 및 감지하는 지도 학습 알고리즘입니다.
이 선형 SVM 그림은 초평면이라는 직선으로 구분된 두 개의 데이터 세트를 보여줍니다. 데이터를 사기와 사기가 아닌 것으로 분류하는 결정 경계입니다.
초평면에서 더 멀리 있는 데이터 포인트는 쉽게 분류됩니다. 서포트 벡터(초평면에 가장 가까운)는 분류하기 어렵습니다. 이러한 이상값은 제거되면 초평면의 위치에 영향을 미칠 수 있습니다.
6. K-최근접 이웃
KNN(K-Nearest Neighbor)은 지도 학습 알고리즘입니다. 유사한 항목이 서로 가까이 존재한다는 가정하에 작동합니다.
아래는 간단한 그림입니다.
새로운 데이터 항목은 카테고리 A 또는 B에 배치되어야 합니다. 알고리즘은 유클리드 거리라는 수학 방정식을 사용하여 데이터 포인트 사이의 거리를 계산합니다. 새 데이터 포인트는 이웃이 가장 많은 그룹에 속합니다. 가장 가까운 데이터 세트에 '사기' 태그가 지정되면 해당 거래는 사기로 분류됩니다.
과제 탐색 및 전략적 고려 사항
모든 기술과 마찬가지로 사기 탐지를 위한 기계 학습 통합과 관련된 어려움이 커지고 있습니다. 다음은 귀하가 직면할 수 있는 몇 가지 일반적인 문제입니다.
부적절한 인프라
많은 은행 시스템은 대량의 복잡한 데이터를 분석할 수 없습니다. 게다가 대부분의 데이터는 격리되어 별도의 저장 시설에 보관됩니다.
불행하게도 이 문제를 빠르게 해결할 수 있는 방법은 없습니다. 적절한 하드웨어와 소프트웨어에 투자해야 합니다.
숙련된 핀테크 앱 개발 대행사와 협력하여 특정 데이터 세트에 적합한 알고리즘을 자동으로 선택하고, 원시 데이터를 가져와 기계 학습을 위해 준비하고, 데이터를 시각화하고, 알고리즘을 테스트하는 등의 인프라를 설정해야 합니다.
데이터 품질 및 보안
데이터 품질은 사기 탐지를 위해 머신러닝을 구현하려는 금융 기관에게 중요한 문제입니다. 기계 학습 모델은 좋은 데이터와 나쁜 데이터를 구분하지 않습니다. 따라서 알고리즘이 관련이 없거나 불완전한 데이터로 오염되면 모델의 정확도가 부정확해집니다.
Amazon Kinesis와 같은 데이터 수집 솔루션은 원시 데이터를 수집, 정리 및 변환하여 기계 학습 모델에 적합하게 만듭니다. 데이터를 정리하고 정리한 후에는 민감한 데이터와 민감하지 않은 데이터를 분리해야 합니다. 기밀정보를 암호화하여 안전한 시설에 보관하세요. 또한 이 데이터에 대한 액세스를 제한해야 합니다.
재능이 부족하다
사람들이 두려워하는 것에도 불구하고 머신러닝은 일자리를 빼앗지 않습니다. 그것은 정반대입니다. 인간의 통찰력과 경험이 필요한 복잡한 사례를 관리하려면 사기 분석가가 여전히 필요합니다. 또한, 머신러닝은 새로운 기술이고 해당 분야의 전문가가 충분하지 않습니다.
이는 구직자에게는 좋은 소식이지만 기계 학습의 잠재력을 최대한 활용할 수 없는 기관에게는 그렇지 않습니다. 기계 학습을 구현할 수 있는 기술을 갖춘 기업과 협력하면 이러한 과속을 극복할 수 있습니다.
머신러닝을 활용한 은행 사기 탐지 사례 연구
이제 머신러닝을 활용한 은행 사기 탐지의 실제 사례를 살펴보겠습니다.
사기 탐지
Danske Bank는 덴마크의 다국적 금융 기업입니다. 덴마크 최대 은행이자 북유럽 최고의 소매 은행입니다. 규칙 기반 탐지 시스템 하에서 은행은 사기를 완화하는 데 어려움을 겪었습니다. 사기 적발률은 40%, 오탐률은 99.5%였습니다.
데이터 소프트웨어 회사인 Teradata와 협력하여 Danske는 딥 러닝 소프트웨어를 통합하여 잠재적인 사기 활동을 식별하는 데 도움을 주었습니다. 그 결과, 거짓양성은 60% 감소하고 참양성은 50% 증가했습니다.
자금 세탁 방지
OakNorth는 영국의 상업 대출 은행으로, 기업 확장에 비즈니스 및 개인 금융 서비스를 제공합니다. 은행은 자금세탁 방지 수표 제공업체와 고객용 제공업체로 나누어진 심사 프로세스를 갖고 있었습니다. 더욱이 정치적으로 노출된 사람(PEP)에 대한 심사에서는 많은 오탐이 발생했습니다.
사기 및 AML 탐지 회사인 ComplyAdvantage와 협력하여 은행은 심사 및 지속적인 모니터링 솔루션을 통합하여 규정 준수를 간소화하고 데이터를 통합했습니다. 이는 은행의 대출 업무와 저축 업무 간의 신속한 데이터 전송을 촉진했습니다.
신용 인수
Hawaii USA Credit Union은 하와이 최대 규모의 신용협동조합이자 Forbes Magazine이 선정한 최고의 신용협동조합 중 하나입니다. Fintech 회사와 경쟁하고 위험을 증가시키지 않으면서 개인 대출 포트폴리오를 성장시키고 싶었습니다.
Zest AI와 협력하여 신용협동조합은 AI 기반 개인 대출 모델을 사용하여 의사결정 프로세스를 자동화했습니다. 이 모델은 VantageScore 신용 점수 시스템보다 더 깊은 통찰력을 제공하기 위해 278개의 변수를 사용했습니다. 그 결과, 승인률은 21% 증가했고, 연체/대출 신청 사기율은 0%였습니다.
사기 탐지를 위해 ML을 사용할 때 주요 고려 사항
기계 학습을 사용하여 은행에서 사기를 탐지하는 것은 효율적이지만 어려운 일이기도 합니다. 이러한 시스템은 정확한 데이터를 많이 요구합니다. 그렇지 않으면 모델이 제대로 작동하지 않습니다.
여기 머신러닝 프로세스를 최적화하기 위한 몇 가지 팁이 있습니다.
1. 입력변수의 개수를 제한한다
이 기사 전체에서 우리는 더 많은 것이 더 많은 것이라고 말했습니다. 이는 데이터 볼륨에 있어서도 마찬가지입니다. 그러나 사기 탐지 변수의 수가 적을수록 더 많습니다.
사기 행위를 조사할 때 고려해야 할 일반적인 기능은 다음과 같습니다.
- IP 주소
- 이메일 주소
- 배송 주소
- 평균 주문/거래 금액
특성 수가 적을수록 알고리즘 훈련 시간이 짧아진다는 이점이 있습니다. 또한 중복되거나 관련 없는 데이터 세트 문제를 방지할 수 있습니다.
2. 규정 준수 보장
사기 예방은 데이터 보안의 일부입니다. 다른 하나는 데이터 프라이버시입니다. 많은 국가에는 기관이 고객 데이터를 수집, 사용 및 저장하는 방법에 관한 법률이 있습니다. 중국의 개인정보 보호법(PIPL), 캘리포니아 소비자 개인정보 보호법(CCPA), 유럽 연합의 일반 데이터 보호 규정(GDPR) 등이 있습니다.
이러한 법칙은 기계 학습에 사용되는 데이터에 영향을 미칩니다. 대부분의 데이터 개인 정보 보호 규정 준수 규정의 기본 원칙은 통지/동의입니다. 기계 학습 알고리즘 훈련을 위한 데이터를 포함하여 사용자 요청 이외의 목적으로 고객 데이터를 사용하려면 이를 통보하고 허가를 받아야 합니다.
개인 정보 보호 표준을 준수하는 가장 간단한 방법은 규정 준수 기능을 갖춘 기술 파트너를 이용하는 것입니다. 예를 들어, 데이터 개인 정보 보호 및 보안을 유지하는 방법을 이해하는 은행 앱 개발 회사와 협력해야 합니다.
3. 합리적인 기준점 설정
거래 가치 규칙에는 수락 또는 거부 응답을 트리거하기 위한 최소 요구 사항이 있습니다. 보안과 사용자 경험의 균형을 맞추는 임계값이 필요합니다. 기준이 너무 엄격하면 합법적인 거래가 차단될 위험이 있습니다. 임계값이 너무 느슨하면 사기 성공률이 높아집니다.
위험 선호도를 계산하여 올바른 균형을 찾으세요. 금융기관이나 상품마다 위험도가 다릅니다. 예를 들어, 소액 대출 은행 서비스는 소액 대출에 대해 높은 기준점을 설정할 수 있습니다. 상업은행은 주택담보대출에 대해 관대할 수 없습니다.
미래를 예측하다
미래는 바로 지금입니다. 그러나 조직의 17%만이 사기 방지 프로그램에 머신러닝을 사용합니다. 뒤쳐지지 마십시오.
다음은 머신러닝을 통해 은행 보안에 기대할 수 있는 몇 가지 획기적인 발전입니다.
- 장치 프로파일링 : 뱅킹 네트워크에 연결되는 다양한 장치를 식별하고 특정 장치의 기능과 동작을 분석합니다.
- 자동화된 이상 탐지 및 대응 : 알려진 장치에서 사기 행위를 식별하고 영향을 받는 시스템을 격리합니다.
- 제로데이 탐지 : 이전에 알려지지 않은 취약점과 악성 코드를 식별하여 사이버 공격으로부터 조직을 보호합니다.
- 데이터 마스킹 : 기밀 데이터를 자동으로 감지하고 익명화합니다.
- 확장된 통찰력 : 여러 장치와 위치에서 사기 동향을 식별합니다.
- 혁신적인 정책 : 기계 학습 통찰력을 사용하여 관련 보안 정책을 추진합니다.
자산 관리 기관이든 신용 조합이든 AI와 머신러닝은 사기 탐지에 엄청난 기회를 제공합니다.
그러나 해커가 이러한 기술을 사용하여 보호 조치를 우회할 수도 있다는 점을 기억하는 것이 중요합니다. 이러한 공격에 앞서 나가려면 머신러닝 모델을 업데이트하세요. 오래된 인간 지능으로 AI 기반 보안을 강화할 수도 있습니다.