AI 일반 (기술외)

금융 AI, 어느 분야를 먼저 해야할까요?

작동미학 2021. 1. 26. 00:29
반응형

 내가 추진 분야를 적절히 고를 수 있다면, 이 문제는 너무나 중요한 문제가 아닐 수 없다. 사실은 그 어떤 주제보다도 다른 사람들과 많은 이야기를 나누고 싶은 분야이기도 하고, 컨설팅을 담당하는 분들을 만날 기회가 있으면 늘 질문하는 주제이기도 하다. 사람마다 추진했던 분야와 당시 상황, 관심도가 달라 의견이 많이 다를 수 있는 것도 어쩔 수 없다. 

 

 이에 관해 운이 좋아서, 외국의 잔뼈가 굵은 유명 솔루션 컨설턴트 분들과도 이야기를 나눌 기회가 있었다. 국내외 다양한 프로젝트 경험이 있는 분들과도 그렇다. 경험이 얕은 분도 계시고 다양한 분도 계셨다. 그러나 내 결론은 이렇다. 아무도 쉽게 정확한 정답을 말해줄 수 없다. (그래도 뒤에 후보 분야들 몇개와 내 의견-역시 편협하겠지만-을 다룰 예정이다)

 

 조금 달리 표현해보면 유능한 컨설턴트일수록 회사의 사정에 따라 다르다고 이야기를 풀어나간다. 거기에는 이유가 있다. AI 그러니까 머신러닝이나 고급 통계기법을 통한 판단은 앞서 밝혔듯이 그 문제를 해결해주는 전체가 아니라, 큰 업무를 해결하는 일부분이며, 해당 업무 조직이 사용할 몇가지 툴 중의 하나일 뿐이다. ( finai.tistory.com/5 ) 그렇기 때문에 AI가 해결하는 작은 부분이 어떠한가보다, 나머지 전체와의 조화와 결합이 훨씬 그 전체 업무 생산성 향방을 좌우하게 된다. 해당 분류/인식 툴 개선 정도로는 그 업무 분야 전체를 압도하기가 어려운 경우가 많은 것이다. 특히 그 툴을 다룰 준비가 안된 조직의 경우에는 그것이 "방치"라는 독이 되어 다가갈 수 있다. 그래서 그 "툴 개선"이 적절하게 해당 조직과 조화되어야 초기에 성과를 거둘 수 있다. 

 

 과거에 외국산 룰엔진을 써서 프로젝트를 추진했다가, 결국에는 그 룰엔진을 다룰 인력을 점점 유지하기가 힘들어, 모두 수기 코딩으로 전환해서 처리한 적이 있다. 어떤 룰이든 쉽게 빠르게 코딩없이 적용하겠다고 도입한 툴이, 오히려 관리 부담으로 다가온 것이다. 룰엔진 영업 담당자는 늘 홍보에서 그 툴이 쉽다고 설명한다. 하지만 늘 담당자가 오면 새로 그 툴을 익혀야 한다. 그리고 이런 일들이 생각보다 흔하게 발생하는데 그 툴과 운영 방식이 그 조직과 비지니스 환경과 업무 규모에 적절해야만 성공할 수 있다. 몇가지 룰이 만들어져서 거의 변경이 없는 작은 조직이라면, 룰엔진이 필요없는 것이다.

 

 해당 업무 담당자나 조직의 스타일, 보유 역량도 영향을 끼친다. 신기술에 지대한 관심을 가지고 어떻게든 배워서 향상하려고 하는 영역에서는 AI도입의 장점은 살아나고 단점은 상쇄시키면서, 훨씬 더 빨리 신기술이 도입 후 개선되고 투자 효과가 나타날 수 있다. 그런데 반대 유형의 조직에서는 단점만 커지면서 결국 잘 되지 않을 수 있는 것이다. 과거의 익숙한 툴이 더 운영하기 쉽고 직관적일 수도 있는 것이다. 정확도가 좀 낮아도 말이다.

 

 때에 따라서는 특정 AI 모델을 매우 선호하는 담당자나 팀이 있는 경우는, 더 탁월한 최신 모델로 알려진 것보다 그 담당자가 선호하는 모델로 하는게 나을 수 있다. 더 쉽게 운영/유지보수가 가능하기 때문이다. 운영하기 편한 모델만큼 좋은 툴은 드물다. 

 

 내부 튜닝 필요성이 떨어지는, 즉 외부 데이터만으로 잘 훈련되어 특별한 자체 데이터 훈련 없이도 곧바로 쓸 수 있는 완제품형의 AI 모델인 경우도 있다. 이 경우는 일반의 다른 프로젝트와 유사할 수도 있다. AI기술 특성이 줄어든다. 하지만 그 외의 경우는 도입하려는 AI 솔루션이나 툴은 조직과 사람을 가린다. 이 부분을 이해하지 못하면 초기 구축 과정이나 운영과정에서 앞서 글들에서 밝혔던 실패를 밟게 된다. 즉 효과적으로 운영되지 못하는 상황에 직면하게 된다. (외주가 아닌 상황에서도 그래서 이 글은 참조가 될 수 있다. finai.tistory.com/8 )

 

 그래서 AI 기술은 끝없이 해당 담당자들이 잘 수용하여 효율적으로 개선해 나갈 수 있는지가, 그 모델이 얼마나 최신의 정확한 학습 결과물을 만들 수 있느냐, 우리 회사에 가용한 데이터의 상태는 어떠한가(언제나 실무에서는 가장 중요해지는) 등이 다른 회사에서는 ROI(투자대비이익)가 잘 나왔느냐보다 더 중요하다. 정형화된 룰 기반이 AI모델기반의 인식기/분류기보다 낡아 보이지만, 최소한 분명하며 제어 가능하고, 단순한 몇가지 변경만으로, 운영자가 제어하면서 상황을 통제할 수 있을 수도 있다. 더 높은 정확도가 기대됨에도 불구하고, AI모델이 만능인 것은 아니다.

 

 하지만 이런 몇가지 유의사항에도 불구하고, 금융 분야에서 유명 후보 분야는 존재한다. 아마 지금 이순간도 다양한 시도가 벌어지고 있을 것이다. 대표적으로 나열되는 분야가 아래와 같다. 간단히 리뷰해보자.

 

https://data-flair.training/blogs/data-science-in-finance/ 발췌

 

1. 신용평가 분야

 

 신용평가 분야는 이미 조직내 모델이나 시스템 측면 모두 강자들이 존재한다. 금융기관의 신용평가는 역사가 오래되었으며 담당자들은 많은 경험을 가지고 있고, 또한 여러가지 규제 환경(특정 사유로 고객의 신용도를 낮추면-차별하면- 안된다) 제약이 있고, 역시 오랜 기간 함께한 신용평가사의 지원을 받는 분야이다. 막연한 외부 AI 전문가는 그 안에 오랜 히스토리를 모르면 단지 몇가지 조언 수준에 그치기가 쉽다.

 

 따라서 전체적인 개혁보다는 해당 사업분야의 몇가지 기발한 아이디어가 있다면 오히려 그것을 접목하는 것이 가능한지 상의해서 같이 협업하는 모양새가 좋은 출발이라고 생각한다. 대개 보면 원래 담당자들은 그 수많은 역사 속에 상당부분 시도했던 경험들을 가지고 있고 자부심도 강하다. 데이터든 모델이든 말이다.

 

 그리고 신용평가는 상당히 오랫동안 축적된 데이터에 기반하여 천천히 움직인다. 지속가능함이 다른 어느 분야보다 중요하다. 그러나 불행히도 우리가 시도할 아마도 새로운 데이터는 그 검증 역사가 길지 않고, 데이터가 안정적으로 유지될지 불안한 방법일 것이다. 좀더 분명하게 신용도가 높다고 확신할 수 있는 특정 고객을 잡아내는 아이템(이자를 절감해주는 것을 금지하는 규제는 없으므로)으로 시작해 긴 호흡으로 접근이 필요하다.

 

 바꾸어 이야기하면 신용평가 분야의 어려운 점은 연체방지를 위한 부정적 평가를 하는 것이 비지니스 효과는 좋지만, 함부로 고객을 차별할 수 없다는 것과, 위와 같이 오랜 기간 연체 현황에 대한 검증과 재반영이 필요하다는 부분을 이해해야 한다는 점이다. 오히려 비지니스 영향도(연체율이 회사 전체에 미치는 영향이 크므로)가 지나치게 크기 때문에 변화가 어려운 분야이기도 하다.

 

2. Fraud Detection

 

 금융 분야에서 Fraud는 생각보다 넓은 분야이다. 어찌보면 용어 그대로 '사기꾼이나 범죄자'를 막는다는 개념으로 접근되는 경우가 많은데, 일단 Fraud가 발생하는 행동 들을 나열 해보자. 수신 계좌를 타인명의로 불법 개설(대포 통장)하여 범죄 행위에 사용하는 행위(수신 사기), 명의도용하거나 부정한 방법으로 대출을 받는 행위(여신 사기), 카드를 부정으로 사용하는 행위(카드 부정 발급, 카드 도용), 자금세탁방지 행위, 보이스 피싱 행위 등 모든 일상에서 벌어나는 금융과 연관된 범죄와 연결되어 있다.

 

 이 분야도 금융기관에는 룰기반으로 잘 다져진 시스템이 존재하는 경우가 많다. 그래서 대개 룰기반 시스템과의 경쟁이 자주 발생하며 비교되게 된다.

 

 AI/머신러닝 기반의 신규 체계가 기존 룰기반 시스템과의 경쟁에서 불리한 것은, 바로 편중되고 적은 데이터이다.  fraud 상황은 압도적은 많은 "평범한 상황들 속"에서 매우 극소수의 특이 경우이고, 수집된 일반 상황 데이터에는 실제 식별되지 못한 fraud도 같이 섞여있을 수도 있다. 따라서 이렇게 오류를 포함할 수 있으면서도 편중된 데이터를 다룰 수 있는 준비가 필요하다. 비지도 학습이나 데이터 증폭 등 상황이 더 준비되기 전까지 초기에 다양한 접근이 이루어져야 한다. (그리고 신기하게도 최종은 잘 label된 데이터로 지도 학습을 해야만 원하는 정확도가 달성될 것이다) 

 

 개인적으로는 초기에는 룰기반과 섞는 작업이 필요하다고 생각한다. fraud의 결과가 도출되면 왜 그것이 fraud인지에 대해서 어느정도 설명이 필요하기 때문이다. AI/머신러닝은 복잡한 상관관계를 잡아내는데 더 강하다보니, 오히려 검출에 대해 어떤 분명한 설명을 할 수 없는 경우가 발생한다. 따라서 설명 가능한 "룰"로 미리 분류하고, 그 그룹의 세부적인 값들을 머신러닝 기법으로 찾는 형태의 하이브리드 접근이 더 현실적일 수 있다. 룰 기반과의 타협과 협조가 필요하다.

 

 그리고 각 fraud분야의 비지니스 시급성/효과에 대한 이해도 필요하다. 기업의 이익 관점에서만 보면, 다양한 fraud분야가 있지만 해당 적발관리가 금융기관에 실질적인 이득을 주는 분야가 따로 존재할 수 있기 때문이다. 그 순서대로 업무를 추진해야만 적절한 규모의 투자가 지속될 수 있다. 예를 들면 수신 사기 적발은 여신 사기 적발보다 금융기관에 주는 실질적인 이득이 낮다. 따라서 고객, 감독당국, 금융기관이 해당 fraud에서 입는 피해에 대한 각각의 상황을 잘 고려해야 한다. 어떤 경우는 감독당국의 규제 패널티가 너무 커져서 반드시 개선해야 하는 상황이 올 수도 있다.

 

 최근에는 자연어 처리나 영상 처리, 빅데이터 기술이 발전하면서 전통적인 금융 데이터(거래나 고객정보 등) 대비하여 신분증 이미지나 상담 내역, 채널 방문 이력 등 다양한 분야에서 이 fraud detection을 지원하는 것이 가능해진 것도 이 분야를 끊임없는 다양한 시도의 장으로 만들 수 있지 않나 개인적으로 생각된다.

 

 어차피 필수적으로 다루어야할 영역이고 담당자들도 AI/머신러닝에 대한 기대가 있는 분야이므로 다른 영역으로 확산되기전 여러가지 시도를 빠르게 진행 할 수 있는 분야이기도 하다. 기존 담당자들이 데이터를 어느정도 정비해두었을 확률도 높다. AI사업 추진자라면 늘상 가까이에서 파악해야 하는 분야이다.

 

 

3. 고객 분석/마케팅

 

 고객군을 분류하고 마케팅 대상을 선정하고 효과를 예측하는 데도 AI/통계 모델이 사용될 수 있다. 대개 CRM을 다루는 부서에서 시도될 수 있는 영역이다.

 

 다양한 고객 캠페인을 수행하고 있지만 늘 어떤 대상으로 해당 캠페인을 진행할지는 CRM담당자에게는 숙제가 된다. 메시징 비용과 이벤트 비용이 곧바로 매출 실적으로 이어지게 하려면 효과적인 고객 타겟팅이 중요하기 때문이다. 

  

 우선은 기존의 담당자 직관과 몇가지 룰에 의존하는 방법에 대비하여, 과거 데이터 기반의 모델을 적용하는 시도가 필요하다. 아마도 소폭의 효과 향상을 기대해볼 수 있겠다. 그리고 이 방법과 병행해 기반하는 고려 데이터 분야를 늘리면서 실험하는 것을 권고한다.

 

 왜냐하면 기존의 정형화된 데이터 기반하여 시행착오를 거쳐온 담당자의 직관을 넘어, 굉장한 개선을 얻기 힘든 것도 사실이기 때문이다. 이 과정은 해당 담당자가 기존에 시도해보지 못했던 낯선 데이터를 지속 추가하고 AI/머신러닝 방법이 지속 효과적인 분야를 발견해나가면서 더 나아질 수 있다. 전에 금융기관에서 원활히 사용하지 못하던 방문이력이나 메뉴, 방문 패턴, 상담 내역 등의 로그성 데이터에 관심을 가질 필요가 있다. 과거와 다르게 다양한 복합 비정형 데이터, 자연어를 처리할 수 있는 기술들이 데이터 엔지니어링 측면이나 데이터 사이언스 측면에서 많이 개선되었다. 따라서 이런 분야들과의 결합에 대해 더 시행착오를 거치고 확산시킬만 하다. 방문한 고객의 행동 패턴이나 상담은 고객의 직접 의지를 나타내기 때문에 여러가지 면에서 효과적인 feature가 된다.

 

 

4. 대고객 AI 기능

 

 최근에는 금융기관도 고객 추천이나 알고리즘 트레이딩 등의 분야로 AI기반의 대고객 기능을 시도하고 있다. 이런 분야들은 언뜻보면 앞서 내부 고객 분야와 별 차이가 없다고 생각할 수 있겠으나 현실은 다르다. 우선 전체 처리 아키텍쳐가 내부 업무 대상과 비교해보면 SLA나 경험 관점의 상향이 필수다. 에러율이나 장애 및 속도, 실시간 성에 있어서 더 민감하게 되는 경우가 크다. 예를 들면 재해복구(DR)를 염두해두어야 할 수도 있다. 실행 비용도 더 많이 올라간다.

 

 그리고 여전히 금융분야에서는 이 주제들은 앞서 분야보다 더 어렵다. 관련하여 오랫동안 시도한 솔루션사들도 이렇게 다양하게 좋은 결과를 내서 자리잡은 형태도 드물기 때문이다. 대부분 소규모의 솔루션사가 난립하고 있는 상황이다.

 

 따라서 개인적으로는 내부에서 전문가를 먼저 투입하기 보다는, 다양한 아웃소싱에 더 무게 중심을 두는게 좋다고 생각한다. 이 분야가 내부 데이터보다는 외부 데이터에 의존하는 것이 많은 것도 그 이유이다. 그렇게 각기 전문 회사의 노하우를 점차 기관 내부에 반영하여 지속 협업하는 형태가 정석이라고 생각한다.

 

 무엇보다 그러기 위해 우리가 가진 데이터로 고객에게 얼마만큼의 만족도를 줄 수 있는 결과물을 낼 수 있는지에 대한 현실성 있는 예측도 중요하다. 즉, 내부 일정 수준에 있는 실무자가 그 데이터를 잘 살폈을때 고객에게 유효한 개선 제안을 할 수 있는가?를 물어야 한다. 또한 앞서 밝힌 것처럼 아직은 모든 것을 자동으로 최적으로 제공해주기 보다는 다수의 초보자가 고객을 보조해주는 형태가 우선일 것이라는 고려도 필요하다. ( finai.tistory.com/5 ) 오히려 고객이 많은 시간을 들여서 전체를 탐색해야 하는 것을, 고객에게 편안한 UI/UX에 기반해 AI 조수들을 통해 해결하는 형태의 접근이 먼저이다.

 

 그 이후에 좀더 간결하게 완전자동화 해주는 것이 실제 고객 경험을 개선해주는 방법이라고 생각한다. 언급한대로 아직 시장에 킬러 어플리케이션이라고 부를만한 AI 추천 서비스가 드문 상황이나, 왜 그러한지에 대한 나름의 고민이 필요한 분야이다. 최근의 금융권 전반에 불어닥치는 마이데이터 서비스가 아마 이러한 고민을 금융권에 더 가속시키게 되지 않을까 예측하고 있다.

 

 

5.  챗봇

 

 많은 금융사들이 챗봇을 진행하고 있고, 개인적으로는 최근 1~2년 간의 자연어 처리 기술의 폭발적인 향상으로 이 분야는 유망하다고 생각한다. 고객 상담 분량이 더 많을 수록 경제 효과도 높다. 그러나 역시 주의는 필요하다.

 

 먼저 역시 이 분야도 모든 것이 자동으로 처리된다고 하면 오산이다. Google BERT를 필두로 GPT-3등 최근 기술발전으로 몇가지 자연어 처리 방법은 훨씬 나아졌지만, 역시 사람의 개입이 많은 분야이다. 새로운 상품이 출시되면 늘 새로운 콘텐츠를 먼저 이식해야 한다. 한번도 고객과 나눠본적이 없는 대화에 AI가 대응해야 하는데, 이런 상황들에 대해 당연히 초기에는 데이터가 없다. 따라서 팀 규모 이상의 상담/영업 담당자가 참여하는 콘텐츠 관리 주체와 엔지니어와의 협업이 필요하다. 챗봇의 대화 시나리오를 설계하고 내용을 우선 입력하고, 그리고 지속적으로 이를 다듬는 고단한 과정을 진행할 준비가 되어 있어야 한다. 그래야만 챗봇을 사용하는 고객이 일정 수준의 만족을 얻고 해당 챗봇에 대해 신뢰하고 지속 사용할 수 있는 것이다.

 

 사업 추진 측에서 몇가지의 기술만으로 소수의 담당자가 챗봇을 유지하기는 어렵다는 사실을 주의할 필요가 있다. 최근 기술을 잘 반영하는 솔루션사와 관련 콘텐츠를 현행화하고 개선하는 내부 팀이 결합되지 않으면 챗봇의 역할이 점점 더 협소해지면서 실제 예상했던 ROI가 나오지 않을 것이다.

 

 비슷한 맥락으로 챗봇은 고객의 불만을 끊임없이 모니터링하고 개선해야 한다. 고객이 챗봇 대화 도중에 빠져나와 실제 상담사로 전환되는 비율이나 챗봇 전반의 성공률을 평가하는 지표를 선정해 상시 개선하는 작업이 필수다. 가만히 두면 실 상담사 전환 비율이 계속 높아질 수 밖에 없다.

 

 

6. 리스크 분석

 

 금융기관은 전통적으로 다양한 리스크 분석 시스템을 가지고 있고, 잘 짜여져 있는 틀을 포함한다. 따라서 관련 업무 전반을 건드리기 보다는 비지니스 영향도가 큰 분야를 선택해서 시도하는 작업을 선택하게 될것이다. 

 

 따라서 이 분야도 오히려 기존 데이터와 방법론에 AI나 머신러닝을 접목하는 것보다는 기존에 다루지 못했던 데이터를 추가하는 형태의 시도가 어떤가 제안한다. 연체나 부도 관련하여 다양한 외부데이터나 비정형 데이터 들을 같이 결합하여 개선이 가능한지 시험하고 반영하는 것이다. 카드 사용, 입출금 내역 패턴 변화 등은 어떨까? 오히려 기존 틀이 견고한 분야이기 때문에, 더 상상력을 부가해야 된다고 생각한다.

 

 

 이제 마무리를 해보자. AI 개선 분야를 선정하는 것은 앞서 이야기했듯이 조직의 AI전파에 매우 중요하다. 개선 효과가 지지부진한 분야의 프로젝트가 오래 지속되면 어떤 조력자에 의한 것이든 추진 탄력이 떨어질 수 밖에 없기 때문이다. 1년이 넘는 프로젝트가 드문 것이 일반적인 회사의 상황이니 이 분야의 전담자가 초기에 선택한 분야들이 AI의 중장기 전파 속도를 결정하게 된다. 작은 성공들이 없이는 지지되지 못하기 때문이다.

 그리고 이 적절한 분야 찾기는 앞서 밝혔듯이, 개선되었을때의 비지니스 효과와 개선에 드는 비용, 무엇보다 활용가능한 데이터 확보 가능성, 최근 AI모델의 향상정도, AI모델 운영의 지속가능성, 해당 부서 신기술 수용성이나 협업 적정성 등 여러가지를 놓고 끊임없이 리뷰되어 선택되어야 한다. 특정 규제 이슈가 터져 사업이 탄력을 받을 수도 있고, 새로온 담당자가 기존의 허들을 없애 줄 수도 있다. 만약에 내가 검토하는 분야가 존재하는데, 위의 요소들이 한두개라도 기준에 미달되면 조금더 우선순위를 미루는 것도 방법이다. 만약에 모든 것이 불확실하다면? 역시 데이터가 잘 준비된 분야에 먼저 결과를 내는 것도 방법이다. 데이터가 없으면 아무것도 나오지 않는다.

 

반응형