반응형

심리학의 모든 지식, 폴 클라인먼/정명진

 

심리학과 관련된 인물과 주요 내용에 대해서 잘 정리된 책이다. 그래서 그런지 약간은 심리학 사전 같은 느낌도 든다. 중요한 것은 심리학과 관련된, 특히 주요한 인물과 연구 및 그 내용을 알기 쉽게 정리해 놓았다. 기본적으로 조건/반응으로 유명한 파블로프의 연구, 스키너의 상자(, 쇼킹한 심리학자 스탠리 밀그램(전기충격), 교도소 실험 필립 짐바르도, 그리고 말할 것도 없는 프로이드(정신분석), 융(분석심리학), 애들러(개인심리학)까지....

 인상적인 내용이 많이 있다. 심리학에 대한 역사나 흐름에 대한 이해에는 도움이 적을 수 있지만 주요한 인물과 그 연구 내용이 무엇인지를 알기에는 매우 좋은 책으로 생각된다.

잉크 얼룩으로 성격을 파악하는 헤르만 로르샤흐의 접근은 마치 타로 점을 연상시킨다. 10개의 잉크 얼룩 카드를 보고 어떤 것으로 보이는지를 듣고 이것을 분석해서 성격을 알아내는 것이다.
케슈탈트 심리학에서는 행동과 마음의 복잡한 일들은 별도로 연구되어서는 안되고 하나로 봐야한다는 인식도 인상적이다. 그 밖에 레이먼드 캐텔의 16가지 성격 요인들, 아이젱크이 3가지 특질, 5가지 성격 특질 요소 등 성격과 관련된 연구도 많이 되었던 것을 알 수 있었다. 인상적이었다.

또한 헐의 연구가 흥미로왔다. 40~50년대 행동주의 심리학자인 클라크 헐(Clark Hull)의 욕구감소이론을 통한 행동 설명 노력이 인상적이다. 사람이 행동하는 이유는 생리적 욕구를 해결하기 위해서라는 설명이다. 욕구의 가장 평범한 예는 갈증과 허기, 몸을 따스하게 하는 것 등이 포함된다. 인상적인 이유는 헐이 학습과 행동에 관한 공식을 만들어 내려고 노력했다는 점이다.

행동에 관한 수학적 연역 이론
sEr = V * D * K * J * sHr -sIr - Ir - sOr - sLr

sEr : 자극 잠재력을 뜻한다. 한 유기체가 어떤 자극(s)을 받을 때 어떤 반응(r)을 일으킬 가능성을 의미
V : 자극
D : 욕구의 강도, 생물학적 결여의 크기에 따라 결정
K : 보상적 동기부여로 알려진 목표의 크기
 J : 강화가 추구되기 전까지 시간적 지연
sHr : 습관의 강도. 그 전에 일어났던 조건형성의 양에 따라 결정
sIr : 조건 억제. 이전에 강화의 부재 혹은 결여에 따른 결과
Ir : 반응 억제. 무기력 혹은 피로도로 알려짐
sOr : 무작위로 일어나는 오차에 대한 허용치
sLr : 반응 역치. 즉 학습을 일으키는 데 필요한 최소한의 강화

인간 행동에 대한 이해를 너무 쉽게 생각한 것 아닐까!  단순 1차 방정식으로 해석/예측될 수 있다니 이해가 안된다. 나도 이렇게 느끼는데 동료 심리학자들은 오죽했을까... 비판의 이유는 첫째, 이차강화물(예: 돈)에 대한 고려가 없다는 것이다. 돈은 욕구를 줄이지 못하지만 강화의 원천이며 욕구를 감소시킬 일차 강화물을 획득하는 것을 도운다. 둘째로 사람들은 때로 욕구를 감소시키지 않는 행동을 한다는 것이다. 예전에는 개인에 대한 데이터도 부족하고 연구가 어려웠을 것 같은데 빅데이터 시대가 되면서 개인에 대한 정보가 많아 졌으니 이ㅇ을를 활용하면 헐이 못했던 행동예측도 가능할 것 같다. 인공지능과 같은 기술을 통해서 말이다.




인상적인 내용

현대 사회심리학의 아버지 쿠르드 레빈 
레빈의 장이론(Field) : 사람의 행동은 환경과 개인의 특성 사이의 상호작용에 따른 것이라는 아이디어 대중화에 일조함.
리더십 유형 : 권위적 리더십, 민주적 리더십, 자유방임적 리더십으로 분류

레이먼드 캐텔(Raymond Cattell)
16가지 성격 특질
추상성(abstractedness) : 상상력이 풍부하고 추상적인가, 아니면 근거를 중요시하고 실용적인가?
염려 : 걱정하고 불안해하는가 아니면 자신감 넘치는가?
지배 : 강제적이고 단언적인가 아니면 복족정이고 종속적인가?
정서적 안정 : 차분한가 아니면 불안정하고 긴장되어있는가?
활력 : 열정적이고 자발적인가 아니면 자제하고 진지한가?
변화 수용성 : 유연하고 공개적인가 아니면 익숙한 것에 매달리는가?
완벽성 : 자제력 있고 통제력을 발휘하는가 아니면 규율이 없고 우유부단한가?
개인성 : 신중하고 빈틈없는가 아니면 공개적이고 꾸밈이 없는가?
추리 : 추상저으로 생각하고 지적인가 아니면 구체적으로 생각하고 덜 지적인가?
규칙 자각 : 양심적이고 규칙을 준수하는가 아니면 무시하는가?
자주성 : 자부심이 강하고 개인주의적인가 아니면 남에게 의존하는가?
감수성 : 다정다감하고 따뜨한 마음의 소유자인가 아닌가?
사회적 대담성 : 기가 살아 있고 모험적인가 아니면 수줍어하고 소심한가?
긴장 : 인내하지 못하고 좌절하는가 아니면 평온을 지키는가?
경계 : 의심하고 회의적인가 아니면 신뢰하고 받아들이는가?
온정 : 사람들에게 관심을 쏱는가 아니면 사람들을 서먹해 하며 거리를 두는가?


아이젱크의 3가지 특질
1. 내향성/외향성
2. 신경성/정서적 안정성
3. 정신병적 경향성


5가지 성격 특질 요소
1. 외향성 : 사교성의 수준
2. 친화성 : 다정과 애착, 신뢰, 긍정적인 사회적 행동 수준
3. 성실성 : 조직화와 사려 깊음, 충동 통제의 수준
4. 신경성 : 정서적 안정의 수준
5. 개방성 : 상상력과 창의성, 관심의 폭


가용성 휴리스틱, 대표성 휴리스틱
앵커링과 조정

반응형
반응형

빅데이터는 답을 알고 있다 - 문석현

 

데이터는 답을 알고 있다

작가
문석현
출판
휴먼앤북스
발매
2014.05.09.

리뷰보기

 

 

작가가 데이터 분석에 대한 업무를 진행해 오면서 격은 내용을 책으로 만든 것이다.

 

작가는 게임회사와 인터넷 쇼핑회사에 근무하면서 진행했던 데이터와 관련된 프로젝트와 생각에 대해서 기술하고 있다.

데이터 분석이라는 업무를 추진하면서 격게되는 내용을 이야기 형식으로 죽~ 풀어서 쓴것 같다. 그래서 그런지 내용의 이해는 쉽고, 반대로 뭔가 빈것 같은 느낌도 든다.

 

 제갈공명이 적벽대전에서 바람의 방향이 바뀌는 것을 미리알고 적당한 시기에 하늘에 제사를 지내는 중에 바람이 바뀌어 화공을 펼침으로서 조조군을 물리친 사례가 있다. 여기서 우리가 사회생활을 하면서 고려해야 여러가지를 찾아 볼 수 있다.

 먼저, 공명이 어떻게 바람이 바뀔줄 알았을까? 책을 읽어서? 하늘과 별의 움직임을 배워서? 동내 어르신(지역 전문가)에게 들어서?, 하여간 여기서 중요한 것은 공명은 바람이 바뀔줄 알고 있었다는 것이다. 결론은 많이 알고 있어야 한다는 것이다. 책을 읽던, 경험을 하던, 전문가에게 사사를 받던, 방법이 뭐든지 간에......

 다른 중요한 것은 바로 제사를 지냈다는 것이다. 자신이 (데이터 분석을 했건 공부를 했건 간에) 어떠한 이유로 건 알게된 사실을 그대로 전부 들어 내 놓고 다른 사람들을 설득 하지 않았다는 것이다. 만약 이러한 분석결과를 가지고 설득하려고 했다면 과연 화공을 펼칠 수 있었을까?. 이것은 전략적 사고와 행동이다. 이것은 쉽게 배워서 되지는 않는다. 안되지는 않겠지만 매우 어려울 것 같다. 물론 타고난 사람도 있다(사실 타고났다기 보다는 어려서 부터 훈련됬다고 본다). 주변 사람중에 알고있는 것 보다 말을 더 잘하거나, 센스있게 행동하는 사람을 본적이 있을 것이다. 처세술이 뛰어난 사람들이다. 이것은 사고능력과 함께 행동능력이 중요하다. 지속적이고 장기간의 훈련을 통해 습득 될 수 있을 것이다.

 하나는 공명의 위치이다. 군사는 유비 다음의 서열인 넘버2 다. 넘버2가 어떤일을 강력한 어조로 추진해야한다고 이야기하면 넘버1도 무조건 막기는 힘들다. 당연히 공명도 이러한 역학관계를 이해하고 필요하다면 강하게 주장했을 것이다. 이는 지식/지혜와 전략적 사고/행동 능력이 있으면 자연스럽게 얻게 되는 부분이다. 어린 나이에도 불구하고 공명이 유비의 군사/책사가 된 이유가 무엇이었던가?! 바로 해박한 지식과 실전 활용 능력(전략적 사고/행동)인 것이다.

 이처럼 하나의 일을 성공적으로 완료하기 위해서는 많은 지식/지혜를 기반으로한 의사결정과 전략적인 사고/행동이 필요하다. 단순히 지식만 있거나 지위가 높다고 무슨일이든 하면 성공하는 것은 아닌 것이다. 오해하지 말기 바란다. 지식이 필요없다는게 아니라 지식을 포함한 훨씬 더 많은 지혜와 역학관계 그리고 타이밍이 필요하다.

 제갈공명은 적벽대전 전투의 판세가 승리로 기울어 지기 시작하자 배를 타고 전쟁터를 빠저나간다. 다음에 발생할 일을 예측하고 있었으므로......



시공존

CAC : Customer Aqusition Cost

LTV : Life Time Value (보통 고객의 2년치 매출)

2012년 오바마 대선 캠프 CTO 하퍼 리드 : " 기술은 화력 증강자 역할"

전방조직/후방조직 특성

주변인 죽음시 심리적 수용 단계 : 부정-분노-타협-우울-수용

모금활동 표어 : 필리핀 500만 어린이의 생명을 구해주세요 --> 필리핀 길동이를 구해주세요

데이터는 문제 인식에 실마리를 제공

반응형
반응형

빅 데이터 어떻게 활용할 것인가-오랄리미디어 

 

빅 데이터 어떻게 활용할 것인가

작가
오라일리 미디어
출판
제이펍
발매
2013.07.31.

 

13년 스트라타 컨퍼런스의 내용을 정리한 책입니다. 벌써 오래(?)전 내용이라서 그냥 죽 훌터 보았습니다

그런데 번역이 너무 고급(?) 스러워서 이해하기 어려웠습니다. 단어의 뜻에 충실하게 직역한 것 같은 느낌이 들었습니다. 물론 비즈니스 영역이 넓고 다양한 얘기를 하다보니 어렵겠지만... 그래도 조금 실망 스러웠습니다.

그래도 아래와 같은 인상적인 내용도 있었습니다.

 

 

 

인상적인 내용

 

빅제이터 영역

1. 기업 BI 2.0 : 관리의 BI -> 미지의 미지 BI

2. 토목 공학 (사회와 정부) : 도시 데이터 활용

3. 고객 관계 최적화 (마케팅) : 온라인 -> 오프라인, 월스트리트 -> 메인 스트리트(일반화)

 

정보의 역설

자전거 보관소 효과(파킨슨의 사소함의 법칙)

통계적 방법이 발전할 수록

1. 회의적인 비판은 줄어들고 (잘 모르므로)

2. 분석가가 수학을 방패로 사용하는 경우가 늘어나며 (복잡하므로)

3. 통계 결과가 진실을 반영한다고 사람들이 속게 된다.

 

Custom 시대(개발툴 + DBMS)  -> Package시대(SAS, ORACLE 등)  -> Big Data 시대

 

니즈의 비합리

정크푸드를 쌓아 놓고 즐기는 식사가 집에서 편하게 앉아 조리한 음식을 먹는 것 보다 더 좋다는 경험을 할 수도 있다. 건강에 좋지도, 더 저렴하지도 않지만, 그리고 한 시간 뒤면 또 다시 배가 고프겠지만, 그래도 우리는 패스트 푸드를 즐긴다.

 

평생고객가치 적용 효과(필요이유)

- 불필요한 비용지출 절감 : 사지 않을 고객에게 SMS/DM 발솔 불필요

- Communication 리소스 비용 지출 절감 : 모든 고객을 대상으로 홈페이지에 동일한 기능/내용을 게시 및 적용하여 서버 비용을 올릴 필요 없음

- 고객 경험(Customer Experience) 저하 방지 : 필요 없는 제품 추천 방지, SMS 스팸으로 인식 방지

  > 기분 좋은 놀라움을 안겨줄 제품 추천이 가능해 진다.

  > 미처 구매하겠다고 마음을 정하지 못했거나 다른 곳에서 구매할 수도 있었던 제품에 대해 고객 마음을 휘어 잡는 할인/이벤트 제공 가능

  > 고객 관계 관리 강화 가능 : 이용불편 문의 또는 피드백에 대한 감사 등을 목적으로 고객에게 전화 할수 있다.

 

모델러의 세부 모습

- 고객이 좋아할 제품(CF, AR, RF)

- 가격 탄력성 (얼마면 구매할까?)

- 추천 없이 구매될 확률 (KS통계량??)

- 구매 연속성 인과 모델 (반지의 제왕 1,2,3)

- 구매 모델 (구매확률)

 

반응형
반응형

 

이것이 빅데이터 기업이다

작가
함유근
출판
삼성경제연구소
발매
2015.03.20.

 



2012년 <빅데이터, 경영을 바꾸다>의 후속편?

 

빅데이터의 기술과 파급의 영향도가 넓어진 상황에서 이를 (기술과 유행 및 효용성)을 이용해서 성공한 많은 기업들이 나오고 있다.

작가는 이러한 기업의 유형(비즈니스 모델)을 다섯가지로 분류하고 각각의 특성과 주요 사례 및 동향을 설명하고 있다.

2012년 중반 해리서 머피(Harris H. Murphy) 등이 데이터 과학자 대상의 설문 조사를 통해 데이터 과학자들의 기술, 경력, 경험, 과업들을 분석해서 데이터 비즈니스맨, 데이터 창출자, 데이터 대리인(data developer), 데이터 연구가(data researchers) 4가지로 구분했다. 여기에 작가는 빅데이터 응용가라는 구분을 추가한다. 빅데이터 응용가는 빅데이터 과학자들 중 하나의 응용 분야에 집중하는 것이 빅데이터 응용가 비즈니스 모델이라고 정의한다. 앞의 4가지 구분은 다른 책에서도 많이 소개되는 내용이다.

넓고 다양한 기업의 사례를 제공하고 있어서 빅데이터 사업/비즈니스 모델을 고민하는 사람이라면 반드시 읽어봐야할 좋은 책이다. 책을 읽고 흥미있는 사례를 찾아서 좀더 연구하면 재미있는 결과가 예상된다.

시공존​

​데이터 비즈니스맨

상업적 활용이 가능한 데이터가 많은 기업에서 데이터를 가공/분석하기 보다는 활용 방안을 찾는 전문가(사업과 도메인 데이터의 활용을 연결하는 역할)​

루미나, NTT도코모 인사이트, JR동일본​

데이터 창출자

데이터를 분석해서 새로운 정보/지식을 만들어내는 기술 전문가로 고차원의 수학/통계학/컨퓨터공학/물리학 등의 이론과 기법을 분석에 적용하는 사람

액시엄(Acxiom), 팩추얼(Factual​), 맵마이런(MapMyRun), 매직밴드(MagicBand)

데이터 대리인(Data Developer)

데이터 관리를 전문으로하는 사람. 업무 과정에서 많은 데이터가 발생하는 기업들에선 데이터를 분류, 정리, 저장, 유지 하는 일

뉴턴(Knewton), 넘버파이어(NumberFire), 산산(Sansan), 소크라타(Socrata): 공공기관이 오픈 데이터를 이용해 대국민/시민 서비스를 제공할 때 필요한 데이터 저장과 접근, 시스템 연결 인터페이스 개발 및 성능 관리를 위해 보안과 시스템의 확장성을 갖춘 플랫폼을 제공​

데이터 연구가

분석기법보다는 특정 분야나 산업의 지식에 정통해 자신의 전문 분야에 데이터를 활용하는 사람​

데이터 응용가

데이터 비즈니스맨이 기존 사업에서 파생되어 축적된 데이터가 비즈니스의 핵심 자산인 모델이라면 빅데이터 응용가는 데이터로 기존 서비스를 혁신한 스마트한 서비스가 핵심인 모델

당신보다 당신을 더 잘 알지도...액시엄

​액시엄의 개인정보 내용

  • 개인정보 : 취미, 관심사, 친구, 가족 관계
  • 기본 데이터 : 이름, 주소, 성별, 인종, 직업, 교육수준, 결혼 여부, 자녀숫자, 자녀의 나이/성별
  • 삶의 변화 계기 : 결혼, 주택 구입, 이사, 임신 및 출산, 자녀의 대학 진학 여부
  • 재무 정보 : 상품 구매 정보, 월급, 자산(부동산, 차랴8ㅇ) 상황, 장기 주택담보대출 등의 상황
  • 공공기록 : 파산 신청, 이혼 신청, 범죄 기록 혹은 법정 기록, 교통사고 기록

개인 데이터의 종류

자료: The Sogeti trendlab VINT (2013). No More Secrets with Big Data Analytics

[개인 데이터]

관련 데이터 : 이름, 주소, 전화번호, 이메일 주소, 성별, 교육수준, 직업, 선호 정당, 인종, 사용언어, 나이, 생년월일 등

데이터 수집 : 인종 코드, 사용언어는 성이나 설문조사를 통해 유추. 생년월일은 생명보험 마케팅 같이 특별한 목적을 가진 경우에만 수집하고, 보통 나이나 태어난 연도 혹은 연월 정도만 수집

[가구의 인구통계학적 데이터]

관련 데이터: 어른의 나이 범위, 자녀들의 나이 범위, 어른 및 자녀들의 수, 결혼 상태

[가구의 관심 사항]

관련 데이터 : 독서, 음식/요리, 음악, 여향, 운동, 건강, 자기계발, 취미, 애완동물, 스포츠, 수집, 투자, 컴퓨터/전자제품, 집수리/개선, 게임, 사진 등

데이터 수집 : 설문조사, 가구원들이 관심을 표명하거나 구입한 물건, 서비스 등으로 유추. 한가구의 관심사는 여러가지일 수 있음

[가구 구매 행태]

​관련 데이터 : 구매 빈도 및 종류 지표, 소매 및 우편 주문 구매 지표, 기부 지표, 지역사회 참여도, 미디어 채널 사용 지표, 구매 채널 선호도, 평균 우편 구매 금액 및 빈도 지표, 구매 점포 유형 지표(구매 종류 지표에는 옷, 집수리/개선, 책, 컴퓨터/전k제품, 소형 도구 등이 포함. 구매점포 유형에는 일반 소매점, 전문점, 고급 백화점 등이 있다.

[가구의 라이프 이벤트]

관련 데이터: 새로 부모가 된 사람들, 부모가 될 것으로 예상되는 사람들, 새로 운전면허를 취득한 십대, 대학 졸업자, 자녀는 떠나고 부부만 사는 사람들(Empy Nester), 이사한 사람들, 최근 주택 구입자, 최근 장기주택담보 대출자, 최근 결혼한 사람들, 이혼한 사람들, 독립한 자식들, 새 차를 구입한 사람들.

데이터 수집 : 설문조사나 공공 기록을 통해 수집

[가구 생애 단계(Life Stage)그룹(퍼소닉스에 따른 분류)]

​관련 데이터: 액시업의 퍼소닉스(Personicx)는 가구의 종류를 구분하는 싯템으로, 미국의 가구들을 특정 고객이나 인구통계학적 특성에 따라 70개 그룹 중 하나로 분류. 이런 분류 그룹으로는 '꼭대기 거주자(Summit Estates)', '커리어 중시 싱글(Career-Centered Singles)', '농촌 선호(County Ways)', '어린아이와 장남감, 축구와 SUV, 도시 생활 즐기기, 애플파이 가조그 롤링스톤 등

[가구 재산 지표]

관련 데이터: 신용카드 유형 지표, 가구의 수입범위, 수익을 내는 자산 지표, 가능성 있는 투자자 상태(Likely Investor Status), tnswktks qjadnl.

데이터 수집 : 신용카드 유형 지표는 카드 종류(은행카드, 여행카드, 백화점카드 등)정보에 한정된다. 특정 신용카드 데이터를 보유하는 것은 아니다. 재산과 관련된 모든 지표는 구체적 수준이 아닌 요약된 범위(range)로 표현되며, 부의 구체적 수준을 드러내지 않는 데이터 소스로부터 도출된다.

[가구 부동산 데이터]

관련 데이터 : 주택 소유자/세임자, 거주 기간, 주택 구입연월, 주택 건축 연월, 주거 유형, 주거지의 넓이, 부동산의 특징, 주택 대출 규모, 주택의 시장가치 , 주택의 평가각치, 주택 대출액 대비 가치 비율.

데이터 수집 : 부동산 기록과 평가기관으로부터 수집된다.

[가구 차량 데이터]

관련 데이터 : 연식, 제조업체, 차량 가치, 차량 라이프 스타일 지표, 선호 모델 및 브랜드, 중고 자동차 선호도 지표.

데이터 수집 :​ 자동차 판매점, 자동차 서비스업체/수리점, 차량 보증 기간 연장 등에서 행한 설문조사로부터 수집된다.

[가구 건강 관심사]

관련 데이터; 알르레기, 장애 여부, 당뇨, 관절염, 거동 여부, 콜레스테롤, 동종요법(homeopathic) 정형외과 병력이나 고령에 따른 도움 필요 여부, 선호하는 우편 주문약, 브랜드 선호도, 질병이나 처방약ㅇ 대한 온라인 검색 경향.

데이터 수집 : 설문조사, 구매 데이터로부터 얻어진다.

[가구 소셜미디어 지표]

관련 데이터 : 고객의 소셜미디어에 대한 일반적인 관심과 이용 정도, 이용하는 사이트 소셜미디어 내에서의 활동성 수준.

데이터 수집 : 개인이 포스팅한 글의 내용이나 친구 목록, 기타 공공 정보가 아닌 것은 수집하지 않는다. 소셜미디어 정보는 데이터 수집이 허용된 소셜미디어 사이트의 공개된 정보에 한정된다.

EMC의 빌 슈마르조(Bill Schmarzo)는 데이터가 돈이되는 경우를 3가지로 정리

1. 자신이 보유한 데이터(분석한 결과와 함께)를 잘 포장해 다른 기관에 판매하는것

2. 자신의 상품이나 서비스에 분석 기법을 적용해 인텔리전트한 제품을 창출하는 것이다.

3. 유용한 정보를 추천해 고객과의 관계를 긴밀히 하고 고객의 경험을 높은 수준으로 재구현하는 것

빅데이터를 이용한 로켓퓨얼의 실시간 광고 매칭 과정

자료: Rocket Fuel Advertising That Learns (2013.10)

슈퍼컴퓨터로 경영컨설팅에 도전하다 - IBM의 왓슨(Watson)

​왓슨의 5가지 능력

  • 일상적인 사람들의 언어 표현을 이해하는 능력
  • 동시에 여러 개의 답을 찾고 이들의 신뢰성을 평가하는 능력
  • 담의 정확도를 높이기 위해 계속 반복해서 질문하고 답하는 능력
  • 다양한 비정형 데이터를 다루는 능력
  • 자기학습능력

왓슨이 질문에 답하는 과정

  1. 질문
  2. 질문 분석
  3. 가설 설정
  4. 답변의 근거 수집 및 평가
  5. 답변의 최종 신뢰도를 결정하기 위한 가중치 부여 및 통합

IBM Watson: Beyond playing Jeopardy p18

http://www.lanl.gov/conferences/salishan/salishan2012/Frase.pdf

스포티파이 사용자 프로파일링(Profiling)

​소리의 특성, 청취자의 특성, 청취 형태 3가지를 결합하여 사용자 프로파일 생성

  • 음향적 특성(acousticness) : 노래의 음향적 특성을 점수화
  • 음악가 친밀도(artist affinity) : 특정 음악가에게 느끼는 친말도
  • 음악가 인기도(artist hottness) : 음악가의 최근 온라인 활동 정도
  • 춤추기 용이성(danceability) : 노래가 얼마나 춤추기에 적합한가의 정도 (그러면 얼마나 마음을 편하게 하는가, 얼나마 잠들기 좋은가 등도 가능할까?)
  • 지속도(duration) : 초 단위로 측정한 노래 길이
  • 에너지 : 노래의 전반적인 에너지
  • 라이브 수준 : 노래가 라이브로 녹음되었는지 여부
  • 소리 크기 : 노래의 전반적인 볼륨
  • 노래 인기도 : 최근 온라인상에서 노래의 인기도
  • 말의 양 : 노래 가사의 양
  • 템포 : 노래의 분당 비트(BPM)

 

​스포티파이는 취향 프로파일링 기술을 이용해 사용자가 음알을 즐기는 특징을 포착해 개인의 취향 및 선호를 파악하는데, 아래 5가지의 특성을 반영한다.

  • 모험심 : 평소 편안하게 듣는 범주 밖의 음악을 얼마나 자주 듣는가
  • 다양성 : 청취자의 선호 스타일과 음악 장르가 얼마나 다양한가
  • 참신성 : 옛날 음악 대비 새로운 최신 음악에 대한 청취자의 선호도는 어떠한가.
  • 지역성 : 청취자가 선호하는 음악가의 출신 지역이 전 세계적으로 얼마나 광범위한가
  • 주류성 : 무명 음악가 대비 유명 음악가에 대한 청취자의 친밀도는 어떠한가

 

​청취 형태

  • 평소에 듣는 음악가
  • 평소 듣는 노래
  • 좋아하는 음악
  • 싫어하는 음악
  • 음악에 대한 평가
  • 듣다가 건너 뛰는 음악

이런 프로파일을 통해

  1. 1. 각 사용자가 스포티파이가 제공하는 서비스에 얼마나 가치를 두는지 평가하고 예측하며,
  2. 2. 고가치 청취자 그룹에 맞춤화된 고객 경험을 제공하는 서비스들의 음악적 특성을 찾아내고,
  3. 3. 타킷 광고를 위한 고가치 청취자 그룹의 수익 창출에 도음이 되는 이들의 심리적 특징을 파악한다.​

​또한 단순이 음악이 아니라 음악적 정보에 대한 고객의 갈증을 해소하는데 도움이 되는 정보를 맞춤 제공. 검색과 웹 피드를 통해 음악가와 관련성이 큰 최신 정보를 실시간 제공, 음악가의 최근 활동, 이미지,포스팅 글 등...

​제스트파이센스

7만개의 변수로 신용평가 후 대출 서비스

기계학습을 통해 신용을 산출하고 사람이 보정처리하여 업무에 사용

개인 파산에 대해서도 기계학습으로 만든 모델이 파산 후 경과 연수를 산출하고, 전문가가 그동안 가계의 개선 현황을 분석해 반영한다. 그래서 개인의 파산 경력을 기존 평가 알고리즘처럼 단순히 부정적으로만 보지 않고 유통성 있게 해석한다. 이렇게 해서 모든 대출자에 대한 상세하고 정확한 위험도 프로파일이 작성된다.(대출 신청서 작성시 대문자로만 작성하는 사람이 대소문자를 함께 쓰는 사람 보다, 그리고​ 대소분자를 정확히 사용하는 사람보다 연체 가능성이 높다고 한다.

기존 신용평가 방식에 비해 거의 60%개선, 대출상환율도 기존 방식에 비해 90% 높았다.​

​312 페이지

​불완전한 데이터를 이해하는 위상수학

위상수학 : 사물의 모양이나 상태를 말하는 형상의 본질(즉, 수학적 특성)에 대해 연구하는 수학의 한 분야다. 어떤 형체를 측정하고, 그 형체를 압축된 수학적 결합 공식으로 표현하며, 그 표현의 진실성을 검증하는 것이 위상수학의 주된 주제다. 위상수학에서의 형상이란​ 데이터 포인트들과 이들 관계의 집합을 의미하는 것으로 ......즉, 수많은 데이터를 위상수학을 통해 압축하고 단순하게 표현하면서 그 속에서 의미(즉, 본질)를 찾을 수 있게 된 것이다.

 

 

 

 

목차

Prologue | 미래기업의 현재를 읽다

Chapter 1 미래기업의 열쇠, 빅데이터
Intro : 사람도, 기술도, 비즈니스도… 이제 변했다!
01 | 새로운 산업 지형, 빅데이터 생태계
02 | 빅데이터 비즈니스 모델이 만드는 미래기업
03 | 빅데이터 비즈니스 모델의 5가지 유형

Chapter 2 빅데이터 비즈니스맨
Intro : 축적된 데이터를 사업화하라!
01 | 구직·구인 정보로 노동 시장을 예측하다 : 몬스터 거버먼트 솔루션스
02 | 스페인어 방송사에서 히스패닉 마케팅 전문가로 : 루미나
03 | 교통카드 사용 내역도 쌓이면 돈이 된다?! : JR동일본
04 | 통신사가 인구 통계를? : NTT 도코모

Chapter 3 빅데이터 창출자
Intro : 가치를 창출하는 데이터를 찾아라!
01 | 당신보다 당신을 더 잘 알지도… : 액시엄
02 | 맛, 데이터로 증명하라! : 푸드 지니어스
03 | 감성 대신 논리로 패션을 보다 : 에디트
04 | 팩트를 잡아라! : 팩추얼
05 | 자산이 된 신체 정보 : 아이웨어랩
06 | 사물인터넷의 미래를 제시하다 : 웨이즈
07 | 사람들을 달리게 하라! : 맵마이런

Chapter 4 빅데이터 대리인
Intro : 스마트한 대리인이 되라!
01 | 유전체 연구의 대중화를 선도하다 : 넥스트바이오
02 | 공공 데이터는 공개되어야 한다! : 소크라타
03 | 광고 산업의 미래로 날아가다 : 로켓퓨얼
04 | 판타지 스포츠 경기의 승리자 : 넘버파이어
05 | SNS 데이터 속에 모든 답이 있다! : 데이터시프트
06 | 데이터로 교통을 지배하다 : 인릭스
07 | 디지털 맞춤 교육의 시대는 이미 시작되었다! : 뉴턴
08 | 기업을 대신해 위험에 대처하라! : 리슨로직
09 | 잘 관리된 명함은 고객관리의 원천이다 : 산산

Chapter 5 빅데이터 연구자
Intro : 연구 자체를 사업화하라!
01 | 농식물 빅데이터에 전문지식을 더하다 : 에보젠
02 | 인간 유전체의 비밀을 해독하라 : BGI
03 | 비즈니스 노하우를 빅데이터 사업으로 : 히타치글로벌센터
04 | 슈퍼컴퓨터로 경영컨설팅에 도전하다 : IBM의 왓슨

Chapter 6 빅데이터 응용가
Intro : 고객의 속까지 알고 서비스하라!
01 | 스티브 잡스를 울린 음원 유통 시장의 파괴자 : 스포티파이
02 | 7만 개의 변수로 신용을 평가하다 : 제스트파이낸스
03 | 날씨 데이터로 보험을 설계하다 : 클라이미트 코퍼레이션
04 | 중고차 가격의 불신을 해소하다 : 카센서 넷
05 | 불확실한 미래에 도전하는 법 : 이토큐에몬

Epilogue | 국내 빅데이터 비즈니스 모델 기업은 어디쯤 와 있는가?
참고문헌

반응형

+ Recent posts