반응형

어떻게 하면 고객의 성향을 알수 있을까?

가장 확실한 방법은 MBTI 테스트를 고객 별로 실행하고 결과를 확인하는 것이다. 이보다 확실 할 수는 없다.
그러나 실제 고객 분석 시 실현 가능성이 매우 낮다. 왜냐하면 많은 비용과 시간이 들 뿐만 아니라 고객이 이를 원하지 않을 수도 있기 때문이다.
고객 성향을 예측하는 방법으로는 여러가지가 있을 수 있겠지만 간단한 방법중 하나가 워드 클라우드(Word Cloud) 또는 태그 클라우드(Tag Cloud)가 아닌가 싶다.
특정 텍스트 즉, 말뭉치(Corpus)에서 단어의 출현 빈도수에 비례하여 단어의 크기, 색상 등이 표시되는 이미지를 생성하는 방법이다.
(상세 내용은 아래의 Wiki 페이지를 참고하기 바란다.)
https://ko.wikipedia.org/wiki/%ED%83%9C%EA%B7%B8_%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C

 

태그 클라우드 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 태그 클라우드(영어: tag cloud) 또는 워드 클라우드(word cloud)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓

ko.wikipedia.org

고객이 생성한 텍스트 말뭉치를 분석해서 고객의 특성을 파악하는데 사용할 수 있다. 이를 통해 고객이 얼마나 다양한 단어를 사용하는지, 어떤 단어를 더 자주 사용하는지 알 수 있다. 이러한 정보를 확대해서 해석하면 고객이 얼마나 관심분야가 넓은지, 어떤 분야에 더 관심이 있는지 등을 알 수 있으며 이러한 분석을 정기적으로 실행할 경우 이러한 특성의 변화 추이도 알아낼 수 있다.
이러한 분석의 진행은 크게 3단계로 나눌 수 있으며, 고객 데이터 확보, 워드 클라우드 생성, 생성된 워드 클라우드 해석/분석의 단계를 거친다.
고객 데이터 확보는 '개인정보 보호법', '정보통신망 이용 촉진 및 정보 보호 등에 관한 법률' 등 관련 법에서 정한 절차와 고객 동의 등을 통해서 확보 및 관리되어야 한다.
워드 클라우드를 생성하는 방법은 여러 프로그래밍 언어에서 여러 종류의 관련 패키지 프로그램이 제공되기 때문에 여러 가지 방법으로 만들 수 있고 만들기도 쉬운 편이다. 본 글에서는 가장 찾기 쉽고 만들기 쉽도록 파이썬(Python) 프로그램 언어에 wordcloud 라는 패키지를 이용하겠다. 여기서 패키지란 재사용을 위해 특정 기능을 위해 미리 개발해서 묶어 놓은 프로그램이라고 생각하자. 이러한 프로그램의 설치 및 이용을 위해서는 다음과 같은 절차 단계가 필요하다.

  1. 파이썬 설치
  2. wordcloud 패키지 설치
  3. 프로그램 작성 또는 다운로드
  4. 실행 및 해석

아래에서 하나씩 차근차근 따라하기만 하면 된다.
(나중에 복잡한 기능을 추가하여 분석하고자 할 경우에는 하나씩 따라하고, 개발이나 분석보다는 활용과 빠른 결과에 관심이 많은 분들은 제일 아래의 기타 워드 클라우드 서비스 내용을 참고하기 바란다. 그래도 한번 읽어보기를 권장한다.)

  1. 파이썬 설치

아래의 링크를 클릭하여 파이썬 홈페이지에 접속한다.
https://www.python.org/downloads/

 

Download Python

The official home of the Python Programming Language

www.python.org

접속하면 아래와 같은 화면이 보이고 왼쪽에 있는

를 클릭한다.

그러면 접속한 시스템의 운영 소프트웨어에 맞는 최신 버전의 파이썬 프로그램이 자동으로 다운로드 된다.
다운로드된 파일을 클릭하여 파이썬 프로그램을 컴퓨터에 설치한다.
윈도우즈에서는 cmd 창, 맥OS에서는 터미널을 실행하여 창을 연다.
터미널에 python을 입력하고 엔터(enter)를 누르면 파이썬 프로그램이 실행된다.
>>> 이 표시되면 정상적으로 설치되고 실행된 것이다.
실행한 파이썬 프로그램을 종료는 방법은 >>> 상태에서 exit()을 입력하고 엔터를 누른다.



2. wordcloud 패키지 설치
이제 두번째 단계인 wordcloud 패키지를 설치해보자.
터미널에서 아래와 같이 입력한다.

$ pip install wordcloud

그러면 패키지 설치가 자동으로 실행되면서 마지막에 성공 또는 실패에 대한 메시지가 나온다.



3. 프로그램 작성 또는 다운로드
참고한 페이지 정보: https://amueller.github.io/word_cloud/auto_examples/simple.html

 

Minimal Example — wordcloud 1.8.1 documentation

© Copyright 2020, Andreas Mueller

amueller.github.io

위의 페이지를 참고하여 미리 간단한 내용을 실행할 수 있도록 일부 프로그램을 수정해서 아래의 코드 저장소(Code Repository)에 저장해 놓았다. https://github.com/replayh/wordcloud_simple_example.git
따라서, 코드 저장소 내용을 다운 받으면 워드 클라우드 프로그램을 작성한 것과 동일하게 이용할 수 있다.
다운로드 방법은 cmd 또는 터미널 창에 아래와 같이 입력하면 된다.

$ git clone https://github.com/replayh/wordcloud_simple_example.git



4. 실행 및 해석
자~! 이제 프로그램을 실행해 보자!!!
먼저 실행시킬 프로그램이 있는 폴더로 이동하기 위해 아래와 같이 입력한다.

$ cd wordcloud_simple_example

아래와 같은 실행 명령어와 엔터를 입력한다.

$ python simple_wordcloud.py 

모든 내용이 정상적으로 진행되었다면 아래와 같은 이미지의 워드 클라우드를 볼 수 있을 것이다.

앞서서 연재한 '[연재] 고객분석 1- 고객 구매 행동 모델 및 성격유형' 글의 내용으로 만든 워드 클라우드 이미지

워드 클라우드를 해석해보면 해당글에서 많이 언급된 단어는 고객, 구매, 행동, 성격, AIDA 등이 있다는 것을 알 수 있다.
제목을 모르더라도 글의 주요 내용이 많이 언급된 단어의 내용과 크게 다르지 안음을 알 수 있다.
다운로드 받은 프로그램 파일중에서 sample.txt 라는 파일이 있다. 메모장이나 텍스트 편집기를 이용하여 이 파일의 내용을 변경하고 저장한뒤에 다시 실행시키면 변경된 내용을 활용하여 분석된 결과를 볼 수 있다.


기타 워드 클라우드 서비스
개발이나 분석보다는 활용과 빠른 결과에 관심이 많은 분들의 경우 아래의 링크를 클릭하여 프로그램 설치 없이 온라인에서 워드 클라우드를 만들어 볼 수 있다.
http://bit.ly/YellowLionKing
또는 http://wordcloud.kr

 

워드클라우드

워드클라우드 워클생성기 워클 단어구름 한글 워드클라우드 구름단어 글자구름 구름글자 태그클라우드 워드클라우드 태그구름 랜덤이미지 블로그이미지 페이스북이미지

wordcloud.kr

 



워드 클라우드의 장점과 단점

이처럼 워드 클라우드는 텍스트 데이터의 전반적인 내용을 쉽고 빠르게 분석할 수 있는 유용한 도구이다.
그러나 작은 양의 텍스트 데이터를 가지고 분석했을 경우 해석 시 의미의 왜곡을 일으킬 수 있기 때문에 어느 정도 규모 이상의 빅데이터를 가지고 분석해야 왜곡을 줄일 수 있다. 또한 시간의 변화에 따른 의미를 제공해주지 못한다는 한계가 있다. 이를 해결하는 방법으로 일별/주별/월별 워드 카운트 숫자를 지속적으로 관리하여 꺽은 선 그래프를 만들어서 보완할 수 있다.
제시된 프로그램은 간단한 내용을 빠르게 분석하는 예를 보여주기 위한 것이다. 실제로 서비스에 활용하기 위해서는 단어를 잘 찾고 불필요한 단어 제거를 위해 사전을 사용하도록 개선하거나, 문맥을 잘 이해하고 단어를 분리해 내는 방법의 개선 등이 이루어져야 한다. 물론 최근의 인공지능/기계학습 기술과 알고리즘의 발전으로 이전보다 쉽고 정확하게 실행할 수 있다.

 


정리

이번 시간에는 고객의 성향 분석 및 판단을 위해 워드 클라우드를 만들고 해석하는 방법에 대하여 이야기해 보았다. 파이썬 언어로 작성된 간단한 프로그램을 다운받아 실행시켜 보거나 온라인에서 워드 클라우드를 만들어 보고 결과를 분석 및 해석해 보았다.
다음에는 간단한 분류기를 만들어 보자.

 

워드 클라우드의 알고리즘에 해당하는 BoW(Bag of Words) 관련해서는 아래를 참고해 주세요.

https://bigdatamaster.tistory.com/159

 

BoW : Bag of Words

BoW: Bag of Words BoW는 자연어 즉, 텍스트(text)를 처리하는 방법 중에 하나로 간단하고 이해하기 쉬운 방법중 하나입니다. 짧게 말하면 단어가방(Bag of Words)를 가지고 문장을 표현하는 방법 입니다.

bigdatamaster.tistory.com

 

반응형
반응형

이번에는 고객 구매 행동 모델과 성격유형에 대해서 알아보자.

고객 구매 행동 모델

고객 구매 행동 모델은 간단히 말하면 기업의 제품이나 서비스에 대하여 고객이 행동하는 행동패턴의 유형을 분류해 놓은 것이다. 

가장 최초의 모델은 1898년 E. S. Lewis 가 고안한 AIDA 방법으로 고객의 구매 행동 패턴을 Awareness, Interest, Desire, Action 순서로 정의한 것이다. 즉, 고객이 특정 제품/서비스가 있는지를 인지(Awareness)하는 단계(쉽게 말하면 광고/홍보를 접하는 단계)로 시작하고, 그 제품/서비스가 주는 혜택이나 도움이되는 내용을 고객이 이해하게 됨에 따라서 제품/서비스에 대해서 흥미(Interest)를 갖게 되는 단계를 거친다.  그리고 이러한 흥미가 고객과 밀접한 관계가 있음을 알게되면서 해당 제품/서비스에 대한 사용/소유 욕구(Desire)를 갖게 된다는 것이다. 그리고 마지막으로 고객은 해당 상품에 대한 구매 의사를 갖게 되고 매장에 방문하거나 온라인으로 접속해서 해당 상품을 시험사용하거나 구매하게 된다.

이처럼 AIDA 모델은 선형적이고 순차적 단계를 가지고 있으며 각 단계를 거치면서 고객 수는 줄어들게 된다. 이러한 현상을 구매 퍼널(The pharse funnel), 마케팅 퍼널, 또는 고객 퍼널 이라고 한다.

 

 

 

 

 

이처럼 고객 구매 행동 모델은 고객이 상품과 관련되서 생각하고 행동하게되는 단계를 나누어 놓은 것이다. 이러한 모델은 제조업의 쇄퇴와 서비스업의 증대, 온라인 서비스의 증가 등의 사회와 산업의 변화에 따라서 고객 구매 행동 모델도 AIDAS(Interest → Desire → Action → Satisfaction), AISDALSLove(Awareness → Interest → Search → Desire → Action → Like/dislike → Share → Love/Hate) 등 다양하게 변형 및 발전 되었다. 이처럼 여러 가지의 모델이 있기 때문에, 다루어야 할 제품/서비스에 따라서 그리고 마케팅 구조에 따라서 적합한 모델을 선택하고 검토하는 것이 중요하다.  본 연재의 목적은 고객 구매 행동 모델과 성격유형을 활용한 효과적인 고객 분석 방법에 대한 것 이므로 이후 부터는 가장 간단한 방법인 AIDA를 기준으로 한다. 기타 AIDA에 대한 자세한 내용은 아래의 Wiki 페이지를 참고하기 바란다.

AIDA 설명 from Wiki : https://en.wikipedia.org/wiki/AIDA_(marketing)

 

AIDA (marketing) - Wikipedia

Generalised hierarchy of effects sequence The AIDA model is just one of a class of models known as hierarchy of effects models or hierarchical models, all of which imply that consumers move through a series of steps or stages when they make purchase decisi

en.wikipedia.org

 

 

성격유형

성격유형은 널리 알려진 MBTI를 기준으로 설명하고자 한다. MBTI(Myers-Briggs Type Indicator)는 1962년에 Myers와 Briggs에 의해 고안된 성격 유형 지표이다.  에너지의 방향, 인식 기능, 의사결정 기능, 생활 양식, 이렇게 4개의 특성을 기준으로 측정하여 16개의 성격 유형으로 나눈다.

지표(성격) 과 설명: from Wiki

한 사람에 대해서 각 척도별로 두 지표중 어느 쪽에 더 가까운지를 정할 수 있고, 이렇게 정해진 4가지의 지표 특성을 조합하여 한 개인의 성격 유형이 된다.

따라서, 모든 사람은 아래와 같이 총 16가지의 성격 유형 중에 하나로 구분 될 수 있다.

MBTI 성격 유형 : from Wiki

MBTI 관련 보다 자세한 내용과 관련 정보는 아래의 한국MBTI연구소 홈페이지를 참고하기 바란다.

http://www.mbti.co.kr/

 

::(주)한국MBTI연구소::

 

www.mbti.co.kr

 

 

본 연재에서는 가장 많은 유형으로 알려진 ISTJ 유형을 기준으로 설명할 예정이다.

ISTJ는 내향/감각/사고/판단의 지표 특성을 가지는 성격 유형이다. 즉, 여러사람과 자주 어울리기 보다는 홀로 시간을 보내면서 에너지를 축적하는 내성적인 성격이며, 정보수집 시 직관이 아닌 감각을 이용하고, 의사결정 시에는 느낌이 아닌 사고(이성적 판단)을 기준으로하며, 생활양식으로는 계획적이고 규칙과 기한 준수를 중요하게 생각하는 성격인 사람들이다. 이러한 성격 특징들을 이해한 상태에서 고객 구매 행동 모델의 각 단계별로 어떤 고객 경험을 제공하는게 좋을 지를 세심하게 설계 해야만 많은 고객이 구매 퍼널을 쉽고 빠르고 통과 수 있을 것 이다. 다시말하면, 가장 좋은 고객 경험 설계는 고객 구매 행동 모델의 각 단계별로 16가지 성격 유형에 대하여 설계된 고객 경험 설계라고 할 수 있겠다. 

다음에는 본격적인 분석 방법에 대한 이야기를 진행해 보자. 말뭉치 분석에 기본이되는 워드 클라우드를 살펴보고, 그 다음 시간에는 데이터 분석을 통해 ISTJ 유형을 찾아내는 방법에 대해서 이야기해보자.

 

반응형
반응형

한 사람이 붐비는 인파를 뚫고 할인 매대에서 티셔츠를 집어들다.
"예쁘네 이거사야지!"
몆번 훌터보더니 바로 계산대로 가서 계산을 했다.
그런데 저쪽 구석에서 한참동안을 서서 옷들을 뒤척이고 몇번 입어보기 까지했던 한 젊은이는 그냥 매대를 떠난다.

'별의별 사람들이 다있어!, 성격 참 특이하네!!!'

성향에 대한 관심과 연구는 어제 오늘의 이야기가 아니다.
아마도 원시 시대에 함께 사냥을 하면서도 성격이야기를 했을 것이다.
오랜동안 심리학에서 연구되어 왔으며, 시장 자본주의 발달에 따라 이윤 추구의 대상이 되는 고객을 더 잘 이해하고자 심도 깊게 다루어 졌다.
무엇보다 인간 본성에 대한 관심은 인간으로써 갖게되는 특권이자 굴레이기 때문이 아닌가 싶다. 생각하는 동물의 특권이자, 정답 없는 질문과 대답의 연속인 것 같다.

이번 연재는 MBTI의 특징과 고객분석에서의 활용이라는 관점에서 이야기하고자 한다.

MBC, SBS 등 방송에서도 많이 언급되는 연예인들의 MBTI와 아예 방송 프로그램의 주제로 MBTI가 주제로 다루어지는 등 매우 많이 알려져있다. 정확한 정의를 보면 MBTI는 성격진단 및 분석에 사용되는 지표로 마이어스-브릭스 유형 지표(영어: Myers-Briggs Type Indicator, MBTI)의 약자이다.

이 것은 선호하는 세계, 인식형태, 판단기준, 생활양식, 이렇게 4개 요소를 중심으로 각 2가지의 구분을 이용하여 성격을 16종류로 분류 한 것이다.

내향 (Introversion) 외향 (Extroversion) 선호하는 세계: 내면 세계 / 세상과 타인
직관 (iNtuition) 감각 (Sensing) 인식형태: 실제 너머로 인식 / 실제적인 인식
감정 (Feeling) 사고 (Thinking) 판단기준: 관계와 사람 위주 / 사실과 진실 위주
인식 (Perceiving) 판단 (Judging) 생활 양식: 즉흥적인 생활 / 계획적인 생활

위키피디아 https://ko.wikipedia.org/wiki/MBTI


이처럼 한 사람에게서 특정한 방향성을 가지는 특징은 어린시절 경험했던 일들의 반영과 습관에서 기인한다고 생각한다.
이 얼마나 신기하고 드라마 같은 일인가!
당신이 어려서 격은 일들이 당신의 잠재의식 속에 성향으로 자리잡아서 당신의 평생을 바꾸다니! 특히나 중요한 결정이든 아니든 말이다...

이러한 성향은 성인이되어 자본 시장의 구성원으로써의 경제 활동에도 영향을 미친다. 따라서, 마케팅에서 말하는 구매단계와 MBTI 성향별 대응을 살펴보면 판매 전략방안을 어떻게 수립할 것인지 명확해질 것 이다.
(나중에 AIDA/AISAS 등과 성격유형( ISTJ등)을 매칭하여 정리할 예정이다)
따라서, 기업의 제품과 서비스에 맞게 성향별 전달 홍보 메시지를 다르게 하여 효과를 극대화 할수 있겠다.
예를들면, TJ에게는 기능성과 가성비 등을 중심으로 전달하고 FP에게는 사용시 느낌과 분위기, 그리고 타임세일의 실행이 효과적일 것이다.

성향 판단을 위한 데이터 분석 방법은 다음 부터 이야기하고자 한다.
대략의 순서는 빈출분석(워드 클라우드), 연관어 분석, 집단성향도출분석, 특성분류분석 등이 될 것 같다.

글을 잘 쓸 수 있도록 응원바란다.

전에 작성한 고객프로파일링 관련 글도 도움이 될것이다.
https://bigdatamaster.tistory.com/m/6

1 - 고객 프로파일링(Customer Profiling) - 1 개요 :데이터 분석

 1 - 고객 프로파일링(Customer Profiling) - 1 개요 :데이터 분석 안녕하세요, 주제는 고객 프로파일링 입니다. 특히, 고객 Communication 측면에서의 프로파일일에 대해서 이야기해 보겠습니다. 고객은 두

bigdatamaster.tistory.com

반응형
반응형

4 - 고객 프로파일링(Customer Profiling) - 데이터 분석 프레임 관점

 



안녕하세요, 꾸벅 !!!




고객 프로파일링 관련 네번째 포스팅입니다.

이번에는 고객 프로파일링의 핵심(?)이라고 할 수 있는 분석 프레임에 대해서 생각해보겠습니다.

기본적으로 다른 프로파일링과 다르게 고객과 기업에서 제공하고자 하는 상품 또는 서비스와의 매칭에 사용되는 것이 고객 프로파일링이라고 생각됩니다.
즉, 고객은 고객이 좋아하는(원한는) 상품/서비스를 제공 받고
기업은 상품/서비스 제공을 통해 이윤을 창출할 수 있도록 잘 연결해주는 것이 기업에서의 고객 프로파일링이라고 할 수 있죠.
(그렇기 때문에 주로 마케팅이나 영업에 관련된 분들이 관심이 많으실 것 같습니다.).
이번 포스팅의 제목처럼 데이터 분석 프레임 관점으로 보려는 것은
바로 고객과 상품/서비스의 연계 분석을 위해 어떤 프레임에서 고민하는 것이 좋은지 생각해보기 위해서 였습니다.

이렇게 생각해 보시죠. 여러분은 데이터 분석/활용의 실력을 인정받게 되어 새로운 직무인 Data Scientist 또는 Data Engineer 로 일하게 되었다고 생각해보시죠.
회사의 요구는 앞서 말한 것 처럼 회사의 상품/서비스를 고객에게 효과적/효율적으로 제공하기 위한 고객 프로파일링을 만들어주길 원하고 있습니다.
자!, 여러분은 어떻게 하시겠습니까?
...
...
...

잠시 생각해 보시죠  

...
...
...
...

제 생각을 말씀드리면 고객을 적당한 특징으로 분류하기 위한 고객 프로피일링이 있어야할 것 같고,
상품/서비스에 해당하는 프로파일링이 있을 것 같고,
이 두개를 연결해주는 것이 필요할 것 같습니다.

이처럼 고객, 상품/서비스, 연결을 고련하는 프레임웍을 Customer Product Framework 이라 부르겠습니다.





고객프로파일 <-- 연결특징 --> 상품 프로파일


[그림]



먼저,고객을 프로파일링하는 방법은 앞선 포스팅에서 언급한 것처럼 심리학 관점에서의 다양한 시각으로 데이터를 수집하고 분석함으로서 확보가 가능할 것 입니다.
(물론 데이터에 따라 깊이는 다를 것입니다.)
즉, 고객의 생리/심리/사회적 관점의 데이터를 찾고 만들어내어 고객군을 특정하는데 필요한 지표를 만들고 관리하는 것 입니다.
그러나 일반적으로 정부/공공기관 또는 대기업이 아닌 이상 이처럼 고객을 분석하기 위한 데이터가 충분하지 않은 것이 현실 입니다.
어쩔 수 없이 회사내에 존재하는 고객관련 데이터를 모두 모으고, 분석해서 새로운 데이터를 생성해서 활용해야겠지요.

이때 중요한 것이 회사의 상품/서비스와의 관계를 고려하는 것이 필요합니다.
우리가 고객프로파일링을 하는 것은 일반적인 인구/집단의 특성을 분석하고자 하는 것이 아니라 회사의 상품/서비스를 잘 제공하고자 하기 위함이기 때문입니다. 이를 위해서 상품/서비스가 제공하고자 하는 내용과 타겟 고객에 대한 이해가 필요합니다.
(여기서 잠깐, 상품/서비스의 종류가 다양한지 않고 고가의 상품/서비스인 경우에는 전체적인 프레임을 잡아서 관리하는 것보다 통계 모델에 따른 타겟 고객 설정/활용이 효율적일 수 있습니다.)

예를 들면, 음악 스트리밍 서비스를 제공하는 스포티파이에서는 사용자를 모험심, 다양성, 참신성, 지역성,주류성으로 분류하여 사용자 특징을 분류한다고 합니다. (상세내용 아래 참조)
느낌 오셨는지요?!
바로 상품의 특성을 고려한 지표들 입니다.
일반적인 특성을 나열해 놓은 것이 아니라 상품/서비스와 연관되어있는 것들을 지표로 삼은 것 같습니다.
일반적인 특성으로는 심리학에서 말하는 성격/성향(Big 5)와 같은 내용들로 지표를 만들 수도 있겠지만 이를 실제 상품/서비스와 연계해서 쓰기에는 많은 노력과 시간이 필요하기 때문에 일반적인 기업에서 이러한 방법을 선택하기에는 쉽지 않은 것 같습니다.
요 방법은 따로 다시 이야기 해보기로 하고요..^^



그렇다면, 상품/서비스의 프로파일링은 어떻게 하는게 좋을까요?
상품/서비스의 특성 역시 상품/서비스를 분류하기 위한 독특한 특질 이라고 할 수 있겠습니다.
노트북을 예로 들면 어떤 특질이 있을 까요?
최신 기술의 적용 정도, 모니터 화면 크기의 정도, 무게의 정도, 온라인 게임을 위한 그래픽지원 수준 등등, 보통 상품의 스펙이라고 하는 부분의 내용이 들어 갈 수 있을 것 같습니다.
그렇다면 위에서 봤던 스포티파이에서는 음악 서비스의 특질을 어떻게 분류하고 있을까요?
소리의 특성을 음향적 특성, 음악가 친밀도, 라이브수준, 인기도, 말의 양, 속도 등 11가지를 관리하고 있습니다.

마지막으로 이 두 개의 특징을 연결하는 연결의 특징에는 무엇이 있을까요?
보통은 상품/서비스의 구매/이용 특성에 해당하는 것들이 이에 해당될 것 같습니다.
스포티파이에서는 청취 형태를
평소에 듣는 음악가, 평소에 듣는 노래, 좋아하는 음악, 싫어하는 음악 등 6개로 관리한다고 합니다.

눈치 체신 분들도 계시겠지만 모든 지표/특성들이 고객을 중심으로 바라보면서 정의/사용됩니다.
연결의 특징도 결국에는 고객의 특징중 일부로 이해될 수 있고,
서비스의 특징(음악의 특징)도 결국 이를 이용하는 고객의 특징으로 이해될 수 있지요.
(그래야 잘된 프레임이라고 할 수 있을 것 같습니다. ^^)
결국 이모든 특징들이 고객과 연결되어 고객을 구분짖는 특징으로 사용될 수 있다는 이야기이지요.


스포티파이의 방법은 상품/서비스 중심의 프로파일링이라고 할 수 있을 것 같습니다. 왜냐하면 관리 지표나 내용이 고객보다는 음악 관련된 것이 더 많기 때문입니다.
처음에도 말씀 드린 것처럼 일반적인 기업에서는 고객정보가 충분하지 않기 때문에 상품/서비스 기획에서 고려했던 프로파일(페르소나, 스팩 등)을 이용해서 데이터를 생성하는 것이 빠르고 편해서인것 같습니다.


다음 시간에는 이러한 특징들을 만들어 내기 위해 필요한 분석 기법과 IT관점에서의 기술적 구현 방법에 대해서 이야기해 보겠습니다.
분석 기법에는 고전적인 통계 기법(스코어링 기법 포함)과, 요즘 뜨고있는 인공지는, 기계학습 등의 방법이 있습니다.
그리고 기술적 구현 방법에는 5~6년 전부터 빅데이터가 화두가 되면서 다양한 오픈소스 프로그램과 소프트웨어 솔루션들이 출현하고 있습니다. 오픈소스 프로그램의 예를 들면 하둡(Hadoop), 스파크(SPARK), Hive, SQL, DBMS 등의 기술이 활용되고 있습니다.
다음 시간에 조금더 자세하게 이야기해 보겠습니다.

(아래는 스포티파이의 프로파일링 방법)
(출처: 이것이 빅데이터 기업이다. /함유근)

스포티파이 사용자 프로파일링(Profiling)

소리의 특성, 청취자의 특성, 청취 형태 3가지를 결합하여 사용자 프로파일 생성

소리의 특성

  • 음향적 특성(acousticness) : 노래의 음향적 특성을 점수화
  • 음악가 친밀도(artist affinity) : 특정 음악가에게 느끼는 친말도
  • 음악가 인기도(artist hottness) : 음악가의 최근 온라인 활동 정도
  • 춤추기 용이성(danceability) : 노래가 얼마나 춤추기에 적합한가의 정도
  • 지속도(duration) : 초 단위로 측정한 노래 길이
  • 에너지 : 노래의 전반적인 에너지
  • 라이브 수준 : 노래가 라이브로 녹음되었는지 여부
  • 소리 크기 : 노래의 전반적인 볼륨
  • 노래 인기도 : 최근 온라인상에서 노래의 인기도
  • 말의 양 : 노래 가사의 양
  • 템포 : 노래의 분당 비트(BPM)


스포티파이는 취향 프로파일링 기술을 이용해 사용자가 음악을 즐기는 특징을 포착해 개인의 취향 및 선호를 파악하는데, 아래 5가지의 특성을 반영.

  • 모험심 : 평소 편안하게 듣는 범주 밖의 음악을 얼마나 자주 듣는가
  • 다양성 : 청취자의 선호 스타일과 음악 장르가 얼마나 다양한가
  • 참신성 : 옛날 음악 대비 새로운 최신 음악에 대한 청취자의 선호도는 어떠한가.
  • 지역성 : 청취자가 선호하는 음악가의 출신 지역이 전 세계적으로 얼마나 광범위한가
  • 주류성 : 무명 음악가 대비 유명 음악가에 대한 청취자의 친밀도는 어떠한가


청취 형태

  • 평소에 듣는 음악가
  • 평소 듣는 노래
  • 좋아하는 음악
  • 싫어하는 음악
  • 음악에 대한 평가
  • 듣다가 건너 뛰는 음악



이처럼 특성을 뽑아내는 것은 오랜기간동안 해당 비즈니스 관련 업무를 한 사람 만 가능하다고 생각 할수 있지만, 아닙니다! 바로 데이터분석을 통해 오랫동안 해당 도메인에서 일히지 않았어도 찾아낼 수 있습니다. 간단하게는 Regression이나 주성분 분석, 또는 Clustering을 통해서도 가능 합니다.
이러한  상세 방법은 다른 포스팅에서 자세히 설명드립니다




감사합니다.

반응형

+ Recent posts