카카오페이의 이상 거래 탐지 시스템(FDS) 에 관한 탐구
작성자: 빅데이터응용학과 23학번 오소민
작성일자: 11/22
카카오페이의 AI 기술 서비스 이용 동향
카카오페이의 2022년 ESG 보고서를 보면 현재 기업은 AI 기술을 금융 서비스에 적용하고 있다. 흔히 우리가 카카오페이 서비스를 이용 할 때 인증수단으로 얼굴 인증 시스템이 사용된다.
또한, 카카오페이는 사용자의 데이터들을 기반으로 개인 금융상품 및 컨텐츠를 추천해주고 있다.
이 과정 속에서 제일 중요한 AI 기술 서비스는 이상 거래 탐지 시스템(FDS)이다.
금융 서비스를 이용하는데 어느날 내가 아닌 다른 사람이 600만원 어치 샤넬 백을 구매했다는 메시지가 날아온다면?
이상 거래를 탐지해주는 시스템은 이 작업에서 꼭 필요하다. 카카오페이는 위와 같은 상황을 방지하고자 사전예방 장치를 두고 있다.
카카오페이 이상 거래 탐지 시스템(FDS) 소개와 원리
카카오페이의 이상 거래 탐지 시스템(Fraud Detection System)은 거래 내역, 고객 정보, 평소 거래 패턴 등을 분석하여 의심되는 이상 거래를 탐지하고 차단하는 기술이다. FDS는 주로 머신러닝 또는 딥러닝을 통해 미리 학습된다. 빅데이터를 분석하여 거래를 탐지하기 때문에 사기결제나 보이스피싱 문제를 해결 할 수 있다.
FDS는 크게 1) 정보수집, 2) 이상거래 분석 및 탐지,3) 대응 으로 이루어진다.
FDS 분석 방법에는 오용 탐지 모델, 이상 탐지 모델이 있는데, 우린 특히 이상 탐지 모델을 적용해 볼것이다.
이상탐지 모델은 미리 정상 행위에 대한 패턴을 저장해두고 이상행위 발생 시 다음 거래 행동을 차단한다.
일단 인공지능 모델이 학습되었다고 가정하고 전체 과정으로 크게 봐보자.
<이상 거래 탐지 시스템 (FDS) 전체 구조>
1. 정보수집
우선 사전에 고객정보와 외부정보가 데이터 형식으로 저장되어야 한다. 여기서 말하는 고객정보란 고객의 기본 정보(성명,성별,직업,나이,사는 곳, 접속 환경)과 계좌와 관련된 정보(거래내역,계좌 개설 일자, 계좌 잔액, 계좌 거래 휴면 기간, 입출금 특성 )등 을 담고 있다. 외부정보는 대상 계좌와 타 계좌 간 거래 관계, 타 금융기관에서 접수된 민원, 통신사 정보 등을 담고 있다.
2. 이상거래 분석 및 탐지
수집된 고객정보와 외부정보를 FDS 에게 미리 학습시켜 놓는다. 머신러닝으로 소비자의 거래 패턴을 학습시키는 건데 이 과정은 뒤에서 따로 설명하도록 하겠다. 일단, FDS가 학습되었다고 가정해보자.
자 이제 실시간으로 거래 정보가 들어오면 실시간 거래 데이터는 로그 수집 시스템에 저장된다. 그리고 데이터를 정제해서 이상 거래 분석 시스템에 전달한다. 그럼 이제 FDS(이상 거래 분석 시스템)에서 실시간 거래 데이터와 학습된 패턴들(고객정보,외부정보)를 종합적으로 판단하여 거래 이상 여부를 판단한다.
3. 대응
만약 이상한 거래 패턴을 발견하면 접속 차단을 하던가 해당 담당자에게 확인 알람을 보내는 등 자동화된 시스템을 수행한다. 이런 사기 패턴을 인공지능 모델에게 새로운 또 학습시켜 시스템을 보강한다.
FDS를 머신러닝으로 학습시키는 방법
최근 기업 개발자들은 머신러닝과 딥러닝으로 결합하여 FDS를 학습시키는 방향으로 가고 있다.
일반적으로 머신러닝 알고리즘에는 지도학습과 비지도학습 , 2가지 유형이 있다.
다음 FDS에는 지도 학습 모델을 사용한다. 지도학습 알고리즘은 마치 교사와 학생의 행위와 같다. 교사를 알고리즘 설계자라고 생각하고 학생을 인공지능 모델이라고 해보자. 교사(알고리즘 설계자)는 가공한 데이터들에 라벨링을 하여 이상, 정상 행위에 대한 판단을 해두어야 한다.
※라벨링은 모델이 학습 할 수 있도록 패턴에 답을 달아 두는 것이다.
특히, 이 지도 학습 법 중 이진 분류 모델 (Binary Classification Prediction Model)이 사용된다.
이진 분류 모델이란 이상 행위, 정상 행위와 같이 이분법적으로 행위를 예측하는 것이다.
이진 분류 예측 알고리즘의 기본 원리는 로지스틱 회귀(Logistic regression)이다. 로지스틱 회귀는 이진 분류 문제를 다루기 적합한 회귀 알고리즘이다. 로지스틱 함수는 시그모이드 변환을 적용하여 출력을 확률 점수로 변환한다. 사기 거래 행위를 0이라고 하고 정상 거래 행위를 1로 치환하여 데이터를 학습 시킬 수 있다. 조금 더 보강되어야 한다고 생각되면 딥러닝 기술을 결합하여 더 복잡한 패턴을 학습하게 한다.
직접 적용해본 카카오페이의 FDS
<카카오페이 이상 거래 탐지 서비스 구조도>
먼저, 다음과 같이 고객과 관련된 데이터들( 고객정보 데이터, 계좌 관련 데이터, 외부데이터)을 수집한다.
<고객데이터>
이름: 오00
성별: 여
접속위치: 남양주시, 위치좌표
<계좌정보>
계좌 개설 날짜 : 2022년 12월 20일
11월 소비내역
계좌(예금, 적금) 정보
<외부정보>
카카오페이와 연결된 계좌: 국민은행, 농협, 카카오뱅크 등
통신사: KT
이 데이터들에서 얻은 패턴을 FDS에 미리 머신러닝으로 학습시켜놓는다.
EX) 1. 오00 고객은 한달에 70만원 이상의 갑작스러운 음식 소비를 하지 않는다.
2. 오00 고객의 주 접속환경은 경희대학교 주변이다.
3. 현재 오00 고객의 최근 거래는 남양주시이다. 최근 거래가 얼마 되지 않았는데
다른 지역에서 다음 고객 아이디를 이용한 거래가 일어났다면 이상 거래로 추정해야한다.
수집된 데이터들을 종합적으로 비교해보면 이 거래는 잘못되었다.
마지막 대응 과정에서는 자동적으로 결제가 미승인 되었다 .즉, 결제창이 차단되었다.
또한,해당 담당자에게 경고 메시지가 전달된다.
이상 거래 탐지 알고리즘(FDS)의 단점과 개선방향
금융서비스에 FDS가 있다고 다 안전한 건 아니다. 핀테크 부정 결제가 있었는데 이를 FDS가 인지 하지 못하는 경우가 있다. FDS를 더 정교하게 학습시켜야한다. 계속 계속 새로운 패턴과 특성들을 업데이트 해주는 것이 중요하다.
또한, 이상 거래가 아닌데 이상거래로 인식하여 특정 서비스가 정지되어 카카오페이 이용자가 불편함을 겪는 경우도 생긴다.
카카오페이는 2022년 ESG 보고서에서 정기 점검 활동을 통해 알고리즘 적정성과 투명성을 유지하고 모델 버저닝과 기계학습을 통해 해당 모델을 안정적으로 적용 할 수 있는 기반을 만들겠다고 언급했다.
※참고문헌 출처
'Study > 데이터산업 백서' 카테고리의 다른 글
우리은행의 CDP 기술 탐구 (0) | 2023.11.22 |
---|---|
AICC 기술에 관하여 - 기업 KT의 사례 중심으로 (0) | 2023.11.22 |
데이터 활용으로 인한 농업 분야의 변화 - 에그태그(Agtech) (1) | 2023.11.22 |
뱅크샐러드의 마이데이터 활용 분석 (0) | 2023.11.07 |
삼성과 하이퍼클로바X 협업 관련된 데이터 활용 분석 (0) | 2023.11.07 |