기술 스택/Python

데이터 도메인을 넓혀서 - 금융

없음 출신 2022. 11. 16. 13:31

아래 글과 이어지는 내용입니다!

 

데이터 도메인을 넓혀보자는 목표

복잡한 현실을 직관적으로 보여주는 데이터가 좋아요. 다양한 생각을 나누고 논쟁하는 자리가 즐거워요. 제 논리로 설득하는 것도 즐겁고요. (참고로 제 mbti는 estp에요. 논쟁을 좋아하는 쌈탉이

kkomz.tistory.com

 

첫번째로 살펴본 도메인은 '금융'입니다.

 

금융은 대다수 국민이 사용하는 서비스에요. 예적금, 카드, 대출 등 다양한 상품을 제공하고

수많은 유저를 확보해 데이터를 학습하기에도 좋은 조건이죠.

머신러닝은 대량의 데이터로 기계를 학습시키는데, 데이터 수가 많을수록 성능이 좋기 때문이에요.

 

금융회사는 사용자를 위한 다양한 서비스를 고민하고 제시해요. 이러한 노력에 대한 수요는 갈수록 높아질 거에요.

(전통적인 예금 업무에서 서비스를 통한 매출 향상으로 그 흐름이 바뀌고 있다는 논문이 있어요.)

 

제가 해결하고 싶은 문제는 금융취약계층을 위한 맞춤형 서비스입니다. 

 

타지에서 올라와 서울에 집을 구하거나, 방학을 맞아 해외여행을 가기 위한 자금 마련 등 저마다의 이유로 금융 상품이 필요할 거에요.

그러나 이들은 너무 많은 상품들, 나에게 적합한 상품이 무엇인지 모르겠고, 해당 대출의 위험도가 예상되지 않아 선택에 어려움을 겪어요.

이때 내가 원하는 상품의 대출 상환률을 예측하여 알려준다면 어떨까요?

대출 상환 예측 모형은 우리 은행의 대출 상품이 안전하다는 인식과 긍정적인 대출 경험을 제공할 거에요.

 

또한 나에게 딱 맞는 금융 상품을 제공해준다면 쉽고 편리하게 선택할 수 있어요.

고객 이탈 예측 모형은 이탈고객의 특성을 정의하고 이를 통해 적절한 마케팅을 시도할 수 있어요.

뿐만 아니라 사전 메시지나 알림 서비스 등을 통해 기존 고객의 이탈을 방지하고,

이탈 고객의 행동 패턴을 사전에 차단함으로써 재유치를 위한 전략으로써 활용될 수도 있어요.

 

이런 데이터가 잔존하고 운용되는 체계를 이해할 필요가 있어요.

데이터는 전부 기업마다 고유한 데이터 웨어하우스에 적재되어있죠.

우리가 모바일 앱에 들어갔을 때 보이는 화면과 기능들에서 발생하는 다양한 로그데이터가 실제 뒷단에서는 어떻게 쌓이고 있는지 궁금해요.

잘 정돈하여 보관하고, 필요할 때 검색할 수 있는 기술을 익히는 것이 도움이 될 거에요.

결국에 개발하려는 모형은 이 데이터를 활용해야 하는데, 어디에 어떤 형식으로 데이터가 적재되어 있는지 알아야 이를 꺼내 잘 가공하고 활용할 수 있기 때문이죠.