빅데이터_Big Data

4 - 고객 프로파일링(Customer Profiling) - 데이터 분석 프레임 관점

The Yellow Lion King 2017. 1. 7. 19:00
반응형

4 - 고객 프로파일링(Customer Profiling) - 데이터 분석 프레임 관점

 



안녕하세요, 꾸벅 !!!




고객 프로파일링 관련 네번째 포스팅입니다.

이번에는 고객 프로파일링의 핵심(?)이라고 할 수 있는 분석 프레임에 대해서 생각해보겠습니다.

기본적으로 다른 프로파일링과 다르게 고객과 기업에서 제공하고자 하는 상품 또는 서비스와의 매칭에 사용되는 것이 고객 프로파일링이라고 생각됩니다.
즉, 고객은 고객이 좋아하는(원한는) 상품/서비스를 제공 받고
기업은 상품/서비스 제공을 통해 이윤을 창출할 수 있도록 잘 연결해주는 것이 기업에서의 고객 프로파일링이라고 할 수 있죠.
(그렇기 때문에 주로 마케팅이나 영업에 관련된 분들이 관심이 많으실 것 같습니다.).
이번 포스팅의 제목처럼 데이터 분석 프레임 관점으로 보려는 것은
바로 고객과 상품/서비스의 연계 분석을 위해 어떤 프레임에서 고민하는 것이 좋은지 생각해보기 위해서 였습니다.

이렇게 생각해 보시죠. 여러분은 데이터 분석/활용의 실력을 인정받게 되어 새로운 직무인 Data Scientist 또는 Data Engineer 로 일하게 되었다고 생각해보시죠.
회사의 요구는 앞서 말한 것 처럼 회사의 상품/서비스를 고객에게 효과적/효율적으로 제공하기 위한 고객 프로파일링을 만들어주길 원하고 있습니다.
자!, 여러분은 어떻게 하시겠습니까?
...
...
...

잠시 생각해 보시죠  

...
...
...
...

제 생각을 말씀드리면 고객을 적당한 특징으로 분류하기 위한 고객 프로피일링이 있어야할 것 같고,
상품/서비스에 해당하는 프로파일링이 있을 것 같고,
이 두개를 연결해주는 것이 필요할 것 같습니다.

이처럼 고객, 상품/서비스, 연결을 고련하는 프레임웍을 Customer Product Framework 이라 부르겠습니다.





고객프로파일 <-- 연결특징 --> 상품 프로파일


[그림]



먼저,고객을 프로파일링하는 방법은 앞선 포스팅에서 언급한 것처럼 심리학 관점에서의 다양한 시각으로 데이터를 수집하고 분석함으로서 확보가 가능할 것 입니다.
(물론 데이터에 따라 깊이는 다를 것입니다.)
즉, 고객의 생리/심리/사회적 관점의 데이터를 찾고 만들어내어 고객군을 특정하는데 필요한 지표를 만들고 관리하는 것 입니다.
그러나 일반적으로 정부/공공기관 또는 대기업이 아닌 이상 이처럼 고객을 분석하기 위한 데이터가 충분하지 않은 것이 현실 입니다.
어쩔 수 없이 회사내에 존재하는 고객관련 데이터를 모두 모으고, 분석해서 새로운 데이터를 생성해서 활용해야겠지요.

이때 중요한 것이 회사의 상품/서비스와의 관계를 고려하는 것이 필요합니다.
우리가 고객프로파일링을 하는 것은 일반적인 인구/집단의 특성을 분석하고자 하는 것이 아니라 회사의 상품/서비스를 잘 제공하고자 하기 위함이기 때문입니다. 이를 위해서 상품/서비스가 제공하고자 하는 내용과 타겟 고객에 대한 이해가 필요합니다.
(여기서 잠깐, 상품/서비스의 종류가 다양한지 않고 고가의 상품/서비스인 경우에는 전체적인 프레임을 잡아서 관리하는 것보다 통계 모델에 따른 타겟 고객 설정/활용이 효율적일 수 있습니다.)

예를 들면, 음악 스트리밍 서비스를 제공하는 스포티파이에서는 사용자를 모험심, 다양성, 참신성, 지역성,주류성으로 분류하여 사용자 특징을 분류한다고 합니다. (상세내용 아래 참조)
느낌 오셨는지요?!
바로 상품의 특성을 고려한 지표들 입니다.
일반적인 특성을 나열해 놓은 것이 아니라 상품/서비스와 연관되어있는 것들을 지표로 삼은 것 같습니다.
일반적인 특성으로는 심리학에서 말하는 성격/성향(Big 5)와 같은 내용들로 지표를 만들 수도 있겠지만 이를 실제 상품/서비스와 연계해서 쓰기에는 많은 노력과 시간이 필요하기 때문에 일반적인 기업에서 이러한 방법을 선택하기에는 쉽지 않은 것 같습니다.
요 방법은 따로 다시 이야기 해보기로 하고요..^^



그렇다면, 상품/서비스의 프로파일링은 어떻게 하는게 좋을까요?
상품/서비스의 특성 역시 상품/서비스를 분류하기 위한 독특한 특질 이라고 할 수 있겠습니다.
노트북을 예로 들면 어떤 특질이 있을 까요?
최신 기술의 적용 정도, 모니터 화면 크기의 정도, 무게의 정도, 온라인 게임을 위한 그래픽지원 수준 등등, 보통 상품의 스펙이라고 하는 부분의 내용이 들어 갈 수 있을 것 같습니다.
그렇다면 위에서 봤던 스포티파이에서는 음악 서비스의 특질을 어떻게 분류하고 있을까요?
소리의 특성을 음향적 특성, 음악가 친밀도, 라이브수준, 인기도, 말의 양, 속도 등 11가지를 관리하고 있습니다.

마지막으로 이 두 개의 특징을 연결하는 연결의 특징에는 무엇이 있을까요?
보통은 상품/서비스의 구매/이용 특성에 해당하는 것들이 이에 해당될 것 같습니다.
스포티파이에서는 청취 형태를
평소에 듣는 음악가, 평소에 듣는 노래, 좋아하는 음악, 싫어하는 음악 등 6개로 관리한다고 합니다.

눈치 체신 분들도 계시겠지만 모든 지표/특성들이 고객을 중심으로 바라보면서 정의/사용됩니다.
연결의 특징도 결국에는 고객의 특징중 일부로 이해될 수 있고,
서비스의 특징(음악의 특징)도 결국 이를 이용하는 고객의 특징으로 이해될 수 있지요.
(그래야 잘된 프레임이라고 할 수 있을 것 같습니다. ^^)
결국 이모든 특징들이 고객과 연결되어 고객을 구분짖는 특징으로 사용될 수 있다는 이야기이지요.


스포티파이의 방법은 상품/서비스 중심의 프로파일링이라고 할 수 있을 것 같습니다. 왜냐하면 관리 지표나 내용이 고객보다는 음악 관련된 것이 더 많기 때문입니다.
처음에도 말씀 드린 것처럼 일반적인 기업에서는 고객정보가 충분하지 않기 때문에 상품/서비스 기획에서 고려했던 프로파일(페르소나, 스팩 등)을 이용해서 데이터를 생성하는 것이 빠르고 편해서인것 같습니다.


다음 시간에는 이러한 특징들을 만들어 내기 위해 필요한 분석 기법과 IT관점에서의 기술적 구현 방법에 대해서 이야기해 보겠습니다.
분석 기법에는 고전적인 통계 기법(스코어링 기법 포함)과, 요즘 뜨고있는 인공지는, 기계학습 등의 방법이 있습니다.
그리고 기술적 구현 방법에는 5~6년 전부터 빅데이터가 화두가 되면서 다양한 오픈소스 프로그램과 소프트웨어 솔루션들이 출현하고 있습니다. 오픈소스 프로그램의 예를 들면 하둡(Hadoop), 스파크(SPARK), Hive, SQL, DBMS 등의 기술이 활용되고 있습니다.
다음 시간에 조금더 자세하게 이야기해 보겠습니다.

(아래는 스포티파이의 프로파일링 방법)
(출처: 이것이 빅데이터 기업이다. /함유근)

스포티파이 사용자 프로파일링(Profiling)

소리의 특성, 청취자의 특성, 청취 형태 3가지를 결합하여 사용자 프로파일 생성

소리의 특성

  • 음향적 특성(acousticness) : 노래의 음향적 특성을 점수화
  • 음악가 친밀도(artist affinity) : 특정 음악가에게 느끼는 친말도
  • 음악가 인기도(artist hottness) : 음악가의 최근 온라인 활동 정도
  • 춤추기 용이성(danceability) : 노래가 얼마나 춤추기에 적합한가의 정도
  • 지속도(duration) : 초 단위로 측정한 노래 길이
  • 에너지 : 노래의 전반적인 에너지
  • 라이브 수준 : 노래가 라이브로 녹음되었는지 여부
  • 소리 크기 : 노래의 전반적인 볼륨
  • 노래 인기도 : 최근 온라인상에서 노래의 인기도
  • 말의 양 : 노래 가사의 양
  • 템포 : 노래의 분당 비트(BPM)


스포티파이는 취향 프로파일링 기술을 이용해 사용자가 음악을 즐기는 특징을 포착해 개인의 취향 및 선호를 파악하는데, 아래 5가지의 특성을 반영.

  • 모험심 : 평소 편안하게 듣는 범주 밖의 음악을 얼마나 자주 듣는가
  • 다양성 : 청취자의 선호 스타일과 음악 장르가 얼마나 다양한가
  • 참신성 : 옛날 음악 대비 새로운 최신 음악에 대한 청취자의 선호도는 어떠한가.
  • 지역성 : 청취자가 선호하는 음악가의 출신 지역이 전 세계적으로 얼마나 광범위한가
  • 주류성 : 무명 음악가 대비 유명 음악가에 대한 청취자의 친밀도는 어떠한가


청취 형태

  • 평소에 듣는 음악가
  • 평소 듣는 노래
  • 좋아하는 음악
  • 싫어하는 음악
  • 음악에 대한 평가
  • 듣다가 건너 뛰는 음악



이처럼 특성을 뽑아내는 것은 오랜기간동안 해당 비즈니스 관련 업무를 한 사람 만 가능하다고 생각 할수 있지만, 아닙니다! 바로 데이터분석을 통해 오랫동안 해당 도메인에서 일히지 않았어도 찾아낼 수 있습니다. 간단하게는 Regression이나 주성분 분석, 또는 Clustering을 통해서도 가능 합니다.
이러한  상세 방법은 다른 포스팅에서 자세히 설명드립니다




감사합니다.

반응형