반응형

[책]경영/비즈

통계본문 기타 기능
스티브 잡스가 하늘나라에 가서 하느님과 대화하는
가상의 내용으로 이책은 시작합니다.
(줄여서 말하면 아래와 같은 내용의 대화입니다.)

살아서 사용자 경험을 좋게 만들었던 잡스에게
하느님은
하늘나라에 올라오는 경험을
'좋은 경험'으로 만들어보아라!
라는 명을 내리셨습니다.

이에 잡스는 고민을해서
레오나르도 다빈치(디자이너), 손자(전략가), 존 듀이(철학자)
를 불러 주세요
라고 요청한다는 이야기입니다.

저자가 지어낸 이야기이지만 '좋은 경험'을 위해서
무엇이 필요한지를 잊지않게 해주는 재미있는 이야기 입니다.
디자인, 전략, 그리고 인간에 대한 이해...


드디어 모든 퍼즐이 맞추어진 것 같습니다.

앞서 포스팅했던 Lean 관련 내용을 정리하면서
계속 뭔가 부족하다는 느낌이 있었습니다.

실제 사업을 할때는 어떻게 아이템을 잡고 시작하지?
라는 질문이 계속 맴돌았기 때문입니다.
러닝 린/린 분석/린 UX 등 스타트 업을 위한 방법론 임에도 불구하고
이러한 질문에는 답을 얻을 수 없었습니다.
(물론, 보통은 창업자가 아이디어를 가지고 구체화하면서 사업화를 결정하지요.)
그런데 이 책(경험 디자인)에서 그 고민의 실마리를 찾을 수 있었습니다.

https://blog.naver.com/iwodus/221144572462


린(Lean) 고객개발(Customer Development) - 신디 앨버레즈 지음 -박주훈,이광호
린(Lean) 고객개발(Customer Development) - 신디 앨버레즈-박주훈,이광호 린 고객개발 (Lean Custome...
blog.naver.com

앞서 포스팅한 린 고객개발에서는
사업에 대한 아이디어가 있을때
구체적으로 어떻게 고객을 찾고 구체적 문제점을 찾아서
제품이나 서비스, 고객을 개발해야하는지에 대해서 자세히 나와 있습니다.
즉, 인터뷰 방법은 잘 정리되어 있습니다.
그러나 가치를 제대로 전달하기위한 Ideation 방법 및
검토하는 프레임, 즉 경험 설계 부분은 안보입니다.

이 책(경험 디자인)에서는 좋은 경험을 만들기 위한
학문적이고 체계적인 상위 레벨의 실행 방법을 설명하고 있습니다.
예를 들면 경험의 관점을
감각적 경험, 판단적 경험, 구성적 경험으로 나누어서 설명합니다.

경험에 대한 관점뿐만 아니라
경험 조절 요인(경험의 3차원 모형 : 실제감, 기인력, 관계 응집도),
경험 고리(생동감/상호작용성, 유희성/기능성/사용자주도성/시스템주도성 등)
사용 경험 요인(생동감: 서사성/구체성/매체의 풍요성 등)
디자인 요소(서사성: 메타포 기반의 인터페이스/인터랙션, 서사를 이용한 정보구조 등)
등을 설명합니다.



이러한 내용들이 Case 별로 자세한 예시와 함께 설명됩니다.

전반적인 경험 디자인 절차도 설명합니다.
경험 디자인의 4단계는
1단계 : 제품/서비스를 사용하면서 얻는 경험 (감각적, 판단적, 구성적)
2단계 : 환경 영향 이해 (사회적, 경제적, 기술적)
3단계 : 제품/서비스의 특징 (표현, 행동, 구조 := 인터페이스, 인터랙션, 정보구조)
4단계 : 사람의 경험 요소와 환경 요소 사이에서 균형점 찾기
입니다.

예시적 절차로는
경험의 현황을 이해하고,(인터뷰, 자료 조사 등) - 미시적
경험과 영향을 주고 받는 환경에 대하여 이해하고, - 거시적
경험에서 균형점을 찾고,
균형점을 이루기 위한 경험 요인을 찾고, (경험 조절요인, 경험 고리 등)
혁신적 경험을 제공하는 디자인 요소를 찾아서
설계하라고 합니다.

이같은 사항을 고려해서 경험이 잘 설계되야만
진정한 경험을 제공하는 혁신적인 제품/서비스가 나오겠습니다.


한권이지만 넓은 범위의 내용이 체계적으로 정리 되어서
이해하고 적용하기에 좋습니다.
다만, 뒷 부분에 적용과 조직 예시 또한 상위 레벨에서 간단히 소개하다보니
구체적으로 이해되지 않을 수 있습니다.
하지만
구체화하는 것은 독자의 몫일 수도 있겠다는 생각을 했습니다.
(직접 부딧치거나 다른 책을 참고해야겠지요. ^^)
(그런 내용을 담고 있는 책을 나중에 읽었습니다.
그 책의 포스팅 링크 입니다. ^^)
https://blog.naver.com/iwodus/221173171455


스토리텔링으로 풀어보는 UX디자인
앞선 경험 디자인 포스팅에서 조금 아쉬운점으로 실용적이고 구체적인 내용이 부족하다고 했는데요. 바로 ...
blog.naver.com

애플 매장 : 경험 디자인
- 아이폰 : 감각적 경험(센스있는 디자인) - 실제감을 통해 조절 가능 (생동감과 상호작용성)
> 골프존 (생동감 상, 상호작용성 상), 라운지음악 피아노 (하, 하)
- 두뇌 : 판단적 경험(가치있는 디자인) - 기인점을 통해 조절 가능(결과적 기인점과 절차적 기인점)
> 결과적 (유희성, 기능성), 절차적 (자율성, 자동성)
- 블럭 : 구성적 경험(조화로운 디자인) - 관계 응집도를 통해 조절 가능(시간적/사회적/구조적 관계 응집도로 나뉨)
> 밀도, 중심성


이하는 인상적인 주요 내용 입니다.

비트루비우스 : 건축물이 사람들에게 진정한 경험을 주기 위한 세가지 조건 (견고성, 유
용성, 심미성)

SET : Socio-cultural, Economic, Technology) 사회문화적, 경제적, 기술적 환경
사회문화적 환경요인
- 라이프 스타일(가족, 업무 패턴, 건강), 인구통계학적 요인(연령, 성별, 급여) 법률의 변화, 윤리적 쟁점, 문화적 관습 등
경제적 환경 요인
- 가정의 경제 상황, 트렌드, 인플레이션, 비즈니스 순환(탄생/소멸), 고용률, 소비자 지수, 세금, 계절/날씨, 이자, 환율 등
기술적 환경 요인
- 기술 발전의 경쟁, 연구 자금, 관련/의존적 기술, 대체 기술/해결책, 기술 성숙도/수용도, 기술 법규/정책, 특허 등

지배적 디자인은 기술수명주기론을 설명하는데 매우 중요한 개념
(결국엔 바뀐다는.....)
순환
-> 보존 : 점진적 변화의 시대 (지배적 디자인의 수호/유지 구조적 혁신)
-> 변화 : 기술적 불연속성 (경쟁 강화, 경쟁 파괴)
-> 경쟁 : 혼전의 시대 (대체품, 디자인 경쟁, 커뮤니티 주도, 기술적 변화)
-> 선택 : 지배적 디자인
-> 순환

서양 미술로 본 실제감의 변화 :
비잔틴 양식(낮음) -> 르네상스(높음) -> 후기인상파(낮음)

자동차로 본 기인점의 변화 :
1세대(외재적) 귀족, 운전사 -> 2세대(내재적) 직접운전 취향(미니쿠퍼, 비틀 등) -> 3세대(외재적) 목적중시, 배출 가스 규제(잔고장 없고 효율적인 일제 자동차 유행)

서양 음악사로 본 관계 응집도의 변화
16세기 말~17세기 초(높음) 오페라와 함께 성장한 실내악
-> 19세기 초 (낮음) 베토벤, 교향악의 발전
-> 19세기 (높음) 바그너, 브람스, 브루크너 국민국가주의

변화가 부른 인지 부조화
사회문화, 경제, 기술의 변화에 따라 점차 인지 부조화가 발생
(감각 측면 : 불편, 짜증 발생,
판단측면 : 정말 필요한 서비스인지 생각하게됨,
구성적 측면 : 구입경로나 절차에 의심을 하게 됨)

* 지속적 혁신
실제감 측면 :
3D HD TV -> 곡면 UHD TV,
다마고치/닌텐도DS -> 오큘러스리프트
판단적 측면 :
유나이티드헬스 -> 핏비트Fitbit,
전자식네비 -> 아이패스용 Tmap
구성적 측면 :
각종 프로그램 및 서비스(MS) -> 구글의 통합 서비스,
싸이월드 미니홈피 -> 모바일 페이스북

* 파괴적 혁신
실제감 측면 :
넷북 <- 노트북,
미니멀리즘 디자인(애플imac27) <- 사실성 짙은 디자인(Acer Aspire X1700)
판단적 측면 :
사용자 제작 콘텐츠(유튜브) <- 방송사 제작 콘텐츠(YTN, MBC, KBS,SBS)
스마트 전구 (필립스 휴) <- 일반전구
구성적 측면 :
웨어러블 디바이스(핏비트) < - 스마트폰
한계형 SNS(스냅챗, 돈톡) <- 일반적 SNS(페이스북, 트위터)

갈망적 차이를 이해한 기업은 새로운 지배적 디자인을 만드는데, 이것을 파괴적 혁신이라고 한다.

5 센스있는 경험을 위한 디자인 (실제감)
골프존

6 가치있는 경험을 위한 디자인 (기인점)
전자정부
유희적 가치(내재적 결과) 기능적 가치(외재적 결과)
사용자 주도성(내재적 절차) RC카 이지택시
시스템 주도성(외재적 절차) 필립스 휴 민원24

절차적 기인점은 제품이나 서비스를 사용하는 과정을 사용자가 얼마나 제어할 수 있다고 판단하는지와 관련
결과적 기인점은 제품이나 서비스를 사용한 뒤 사용자가 어떤 점에서 가치 있다고 판단하는지와 관련
절차적 기인점은 자동화 수준에 영향을 받는다. 자동화 수준이 높을 수록 절차적 기인점이 외재적이고, 낮을 수록 내재적임.
결과적 기인점은 유희적 가치와 기능적 가치에 영향을 받음. 유희적 가치가 높을 수록 결과적 기인점에 내재적이고, 기능적 가치가 높을 수록 외재적임
(뜻밖의 즐거움, 오락성 제공 시 유희적 가치 높아짐, 기능적 가치를 높이기 위해서는 호환성과 일관성이 높은 경험제공, 사용자 주도성을 높이려면 특화성과 도전성 제공, 시스템 주도성을 높이려면 에이전트 인지성이 명확하고, 적응성이 높은 경험 제공)

7 조화로운 경험을 위한 디자인(관계 응집성)
인천국제공항
N스트린과 호텔 컨시어지 서비스의 중심성 비교
연계적 속성과 분포적 속성( 밀도와 중심성)
- 밀도는 사용자와 다른 경험 요소들 간의 연결 수준을 나타내며, 연결이 촘촘할수록 관계의 응집도도 높아진다.
- 중심성은 사용자가 다른 경험 요소들 간의 관계에서 구조적 공백을 메우는 자리에 가까이 위치하는 수준을 나타내며, 중심성이 높을 수록 관계의 응딥도도 높아진다.

높은 중심성
높은 밀도 : 인천국제공항 (호혜성 제공 : 편제형 정보제공, 팝업알림, 실시간I/F)
낮은 밀도 : 재새시장 단골가게(현저성: 탁월함 제공 : 스큐어모피즘 다지인 - 메타포를 활용한 디자인)
낮은 중심성
높은 밀도 : 페이스북(복잡성 낮춤: 허브형태의 정보제공, 대시보드)
낮은 밀도 : 11번가(유사성 높임 :일관된 레이아웃, 맞춤형 필터링)


8 우리들의 경험을 위한 디자인
경험 디자인의 4단계는
1단계 : 제품/서비스를 사용하면서 얻는 경험 (감각적, 판단적, 구성적)
2단계 : 환경 영향 이해 (사회적, 경제적, 기술적)
3단계 : 제품/서비스의 특징 (표현, 행동, 구조 := 인터페이스, 인터랙션, 정보구조)
4단계 : 사람의 경험 요소와 환경 요소 사이에서 균형점 찾기
입니다.

예시적 절차로
경험의 현황을 이해하고,(인터뷰, 자료 조사 등) - 미시적
경험과 영향을 주고 받는 환경에 대하여 이해하고, - 거시적
경험에서 균형점을 찾고,
균형점을 이루기 위한 경험 요인을 찾고, (경험 조절요인, 경험 고리 등)
혁신적 경험을 제공하는 디자인 요소를 찾아서
설계하라고

* 실재감 (경험조절요인)
- 생동감 (경험고리)
> 서사성 (사용경험요인) : (디자인 요소)
- 메타포 기반의 인터페이스 - 메타포 기반의 인터랙션 - 서사를 이용한 정보구조
> 구체성 : - 포스 피드백 인터랙션 - 마이트로 피드백 인터랙션
> 매체의 풍요성 : - 감각 정보의 작업과 맵핑 - 증강 정보
- 상호작용성
> 제어성 : 선택적 인터페이스 - 감각적 인터페이스
> 의미교환성 : 참여형 인터페이스 - 보조 정보
> 동시정 : 타이밍 정보 알림 기능 - 진행 상태 알림 기능

* 기인점
- 유희성
> 뜻밖의 즐거움 : 맥락 기반의 우연한 정보 구조, 팝업 인터페이스
> 오락성 : 실감형 인터랙션 공유 기반의 인터랙션
- 기능성
> 호환성 : 표준 디자인 채택,, 사람과 닮은 인터랙션
> 일관성 : 유사한 그래픽의 인터페이스, 유사한 행동과 결과의 인터랙션, 친숙한 정보 디자인
- 사용자 주도성
> 특화성 : 미리보기, 작업관리자
> 도전성 : 개인화된 난이도 인터랙션, 목표 지향적 정보구조
- 시스템 주도성
> 에이전트 인지 :상황 기반의 시스템 주도 인터랙션, 반응형 인터페이스
> 적응성 : 적응형 인터페이스, 역동적 맥락 의식 컴퓨팅 인터랙션

* 관계 응집도 (상기 7장 참고)



반응형
반응형


데이터 괴학자,데이터 사이언티스트가 어떤 일을 하는지, 어떠한 가치를 줄수 있는지 모르고 있는 경우가 많습니다.
그냥 남들도 하니까, 좋타고하니까, 유행하는 핫한 직무니까 등의 이유로 무턱대고 시작하는 경우가 종종 있는것 같습니다.
이보다는 이런 직무의 내용을 잘 알아보고 본인의 성향과 잘 맞는지 확인하보고 시작해도 늦지 않습니다.
이러한 직무의 특징과 가치, 사례를 잘 설명해주는 글이 있어서 소개하고자 합니다.

Data Scientist
Problem Solving as Data Scientist: a Case Study   ; Pan Wu, LinkedIn

https://towardsdatascience.com/problem-solving-as-data-scientist-a-case-study-49296d8cd7b7

Problem Solving as Data Scientist: a Case Study

My thoughts on how data scientists solve problems, along with sharing a case study using one favorite project in my first job

towardsdatascience.com




Problem Solving as Data Scientist: a Case Study
My thoughts on how data scientists solve problems, along with sharing a case study using one favorite project in my first job


바로 링크드인 데이터 과학자로 일하고있는 Pan의 글입니다.

데이터 사이언티스트(Data Scientist)가 하는 일을 실제 사례를 들면서 알기쉽게 설명해주고 있습니다.

간단하게는 문제해결을 위해 아래의 4단계를 말하고 있고, 마인드셋으로 3가지를 말하고 있습니다.

재미있는 설명과 단순히 문제해결에서 끝내지않고 한발더 나아갔다는 것이 신선했습니다.  분석과 발표에서 끝나는 것이 아니라 서비스와 운영까지 실제로 데이터 싸이언티스트가 해야할 일들을 잘 말해주고 있는것 같습니다.


Stage 1 (problem identification) is to help you focus on the key question and not loose track while diving deep into data​

Stage 2 (first logical solution) is to get you a quick win and keep the momentum to build trust with business partners

Stage 3 (iterative improvement) is to help you move the solution further ahead and be the owner of the area

Stage 4 (operational excellence) is to help you remove tech debt, to set you free from mundane maintenance works going forward

​​

데이터 사이언티스트 마인드셋 (data scientist has the right mindsets)

* Business-driven, not algorithm-driven.

* Owning the problem, not just taking orders.

* Open-minded, and always be learning.


물론 사례로 말한 기업이 IPO 기업공개 전이었기 때문에 가능했다고 생각합니다. 다시말해 작은 규모에, (합리적으로 일처리하는?) 외국 기업 이어서 가능했던 사례가 아닌가 싶습니다.

중견규모 이상의 기업에서는 긴호흡에서의 성과와 사내 조직의 지원과 방해 정도 그리고 리더십을 통한 이러한 문제해결 등에 따라서 데이터 과학자의 결과물이 사장되거나 실제 운용에 적용되기도 합니다.
따라서 결과에 따라 허탈하고 무의미한 활동으로 인식되어 조직내에서 인정받지 못하는 경우도 종종 있습니다.
그럼에도 불구하고 데이터 과학자가 제시한 다양한 방법들이 기업의 혁신 활동으로 이어져서 고객에게 사랑받고 기업의 이윤을 높이는 사례가 더 많이 있습니다.

계속해서 더 많은 사례와 방법을 공유 드리겠습니다.



반응형
반응형

어떻게 하면 고객의 성향을 알수 있을까?

가장 확실한 방법은 MBTI 테스트를 고객 별로 실행하고 결과를 확인하는 것이다. 이보다 확실 할 수는 없다.
그러나 실제 고객 분석 시 실현 가능성이 매우 낮다. 왜냐하면 많은 비용과 시간이 들 뿐만 아니라 고객이 이를 원하지 않을 수도 있기 때문이다.
고객 성향을 예측하는 방법으로는 여러가지가 있을 수 있겠지만 간단한 방법중 하나가 워드 클라우드(Word Cloud) 또는 태그 클라우드(Tag Cloud)가 아닌가 싶다.
특정 텍스트 즉, 말뭉치(Corpus)에서 단어의 출현 빈도수에 비례하여 단어의 크기, 색상 등이 표시되는 이미지를 생성하는 방법이다.
(상세 내용은 아래의 Wiki 페이지를 참고하기 바란다.)
https://ko.wikipedia.org/wiki/%ED%83%9C%EA%B7%B8_%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C

 

태그 클라우드 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 태그 클라우드(영어: tag cloud) 또는 워드 클라우드(word cloud)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓

ko.wikipedia.org

고객이 생성한 텍스트 말뭉치를 분석해서 고객의 특성을 파악하는데 사용할 수 있다. 이를 통해 고객이 얼마나 다양한 단어를 사용하는지, 어떤 단어를 더 자주 사용하는지 알 수 있다. 이러한 정보를 확대해서 해석하면 고객이 얼마나 관심분야가 넓은지, 어떤 분야에 더 관심이 있는지 등을 알 수 있으며 이러한 분석을 정기적으로 실행할 경우 이러한 특성의 변화 추이도 알아낼 수 있다.
이러한 분석의 진행은 크게 3단계로 나눌 수 있으며, 고객 데이터 확보, 워드 클라우드 생성, 생성된 워드 클라우드 해석/분석의 단계를 거친다.
고객 데이터 확보는 '개인정보 보호법', '정보통신망 이용 촉진 및 정보 보호 등에 관한 법률' 등 관련 법에서 정한 절차와 고객 동의 등을 통해서 확보 및 관리되어야 한다.
워드 클라우드를 생성하는 방법은 여러 프로그래밍 언어에서 여러 종류의 관련 패키지 프로그램이 제공되기 때문에 여러 가지 방법으로 만들 수 있고 만들기도 쉬운 편이다. 본 글에서는 가장 찾기 쉽고 만들기 쉽도록 파이썬(Python) 프로그램 언어에 wordcloud 라는 패키지를 이용하겠다. 여기서 패키지란 재사용을 위해 특정 기능을 위해 미리 개발해서 묶어 놓은 프로그램이라고 생각하자. 이러한 프로그램의 설치 및 이용을 위해서는 다음과 같은 절차 단계가 필요하다.

  1. 파이썬 설치
  2. wordcloud 패키지 설치
  3. 프로그램 작성 또는 다운로드
  4. 실행 및 해석

아래에서 하나씩 차근차근 따라하기만 하면 된다.
(나중에 복잡한 기능을 추가하여 분석하고자 할 경우에는 하나씩 따라하고, 개발이나 분석보다는 활용과 빠른 결과에 관심이 많은 분들은 제일 아래의 기타 워드 클라우드 서비스 내용을 참고하기 바란다. 그래도 한번 읽어보기를 권장한다.)

  1. 파이썬 설치

아래의 링크를 클릭하여 파이썬 홈페이지에 접속한다.
https://www.python.org/downloads/

 

Download Python

The official home of the Python Programming Language

www.python.org

접속하면 아래와 같은 화면이 보이고 왼쪽에 있는

를 클릭한다.

그러면 접속한 시스템의 운영 소프트웨어에 맞는 최신 버전의 파이썬 프로그램이 자동으로 다운로드 된다.
다운로드된 파일을 클릭하여 파이썬 프로그램을 컴퓨터에 설치한다.
윈도우즈에서는 cmd 창, 맥OS에서는 터미널을 실행하여 창을 연다.
터미널에 python을 입력하고 엔터(enter)를 누르면 파이썬 프로그램이 실행된다.
>>> 이 표시되면 정상적으로 설치되고 실행된 것이다.
실행한 파이썬 프로그램을 종료는 방법은 >>> 상태에서 exit()을 입력하고 엔터를 누른다.



2. wordcloud 패키지 설치
이제 두번째 단계인 wordcloud 패키지를 설치해보자.
터미널에서 아래와 같이 입력한다.

$ pip install wordcloud

그러면 패키지 설치가 자동으로 실행되면서 마지막에 성공 또는 실패에 대한 메시지가 나온다.



3. 프로그램 작성 또는 다운로드
참고한 페이지 정보: https://amueller.github.io/word_cloud/auto_examples/simple.html

 

Minimal Example — wordcloud 1.8.1 documentation

© Copyright 2020, Andreas Mueller

amueller.github.io

위의 페이지를 참고하여 미리 간단한 내용을 실행할 수 있도록 일부 프로그램을 수정해서 아래의 코드 저장소(Code Repository)에 저장해 놓았다. https://github.com/replayh/wordcloud_simple_example.git
따라서, 코드 저장소 내용을 다운 받으면 워드 클라우드 프로그램을 작성한 것과 동일하게 이용할 수 있다.
다운로드 방법은 cmd 또는 터미널 창에 아래와 같이 입력하면 된다.

$ git clone https://github.com/replayh/wordcloud_simple_example.git



4. 실행 및 해석
자~! 이제 프로그램을 실행해 보자!!!
먼저 실행시킬 프로그램이 있는 폴더로 이동하기 위해 아래와 같이 입력한다.

$ cd wordcloud_simple_example

아래와 같은 실행 명령어와 엔터를 입력한다.

$ python simple_wordcloud.py 

모든 내용이 정상적으로 진행되었다면 아래와 같은 이미지의 워드 클라우드를 볼 수 있을 것이다.

앞서서 연재한 '[연재] 고객분석 1- 고객 구매 행동 모델 및 성격유형' 글의 내용으로 만든 워드 클라우드 이미지

워드 클라우드를 해석해보면 해당글에서 많이 언급된 단어는 고객, 구매, 행동, 성격, AIDA 등이 있다는 것을 알 수 있다.
제목을 모르더라도 글의 주요 내용이 많이 언급된 단어의 내용과 크게 다르지 안음을 알 수 있다.
다운로드 받은 프로그램 파일중에서 sample.txt 라는 파일이 있다. 메모장이나 텍스트 편집기를 이용하여 이 파일의 내용을 변경하고 저장한뒤에 다시 실행시키면 변경된 내용을 활용하여 분석된 결과를 볼 수 있다.


기타 워드 클라우드 서비스
개발이나 분석보다는 활용과 빠른 결과에 관심이 많은 분들의 경우 아래의 링크를 클릭하여 프로그램 설치 없이 온라인에서 워드 클라우드를 만들어 볼 수 있다.
http://bit.ly/YellowLionKing
또는 http://wordcloud.kr

 

워드클라우드

워드클라우드 워클생성기 워클 단어구름 한글 워드클라우드 구름단어 글자구름 구름글자 태그클라우드 워드클라우드 태그구름 랜덤이미지 블로그이미지 페이스북이미지

wordcloud.kr

 



워드 클라우드의 장점과 단점

이처럼 워드 클라우드는 텍스트 데이터의 전반적인 내용을 쉽고 빠르게 분석할 수 있는 유용한 도구이다.
그러나 작은 양의 텍스트 데이터를 가지고 분석했을 경우 해석 시 의미의 왜곡을 일으킬 수 있기 때문에 어느 정도 규모 이상의 빅데이터를 가지고 분석해야 왜곡을 줄일 수 있다. 또한 시간의 변화에 따른 의미를 제공해주지 못한다는 한계가 있다. 이를 해결하는 방법으로 일별/주별/월별 워드 카운트 숫자를 지속적으로 관리하여 꺽은 선 그래프를 만들어서 보완할 수 있다.
제시된 프로그램은 간단한 내용을 빠르게 분석하는 예를 보여주기 위한 것이다. 실제로 서비스에 활용하기 위해서는 단어를 잘 찾고 불필요한 단어 제거를 위해 사전을 사용하도록 개선하거나, 문맥을 잘 이해하고 단어를 분리해 내는 방법의 개선 등이 이루어져야 한다. 물론 최근의 인공지능/기계학습 기술과 알고리즘의 발전으로 이전보다 쉽고 정확하게 실행할 수 있다.

 


정리

이번 시간에는 고객의 성향 분석 및 판단을 위해 워드 클라우드를 만들고 해석하는 방법에 대하여 이야기해 보았다. 파이썬 언어로 작성된 간단한 프로그램을 다운받아 실행시켜 보거나 온라인에서 워드 클라우드를 만들어 보고 결과를 분석 및 해석해 보았다.
다음에는 간단한 분류기를 만들어 보자.

 

워드 클라우드의 알고리즘에 해당하는 BoW(Bag of Words) 관련해서는 아래를 참고해 주세요.

https://bigdatamaster.tistory.com/159

 

BoW : Bag of Words

BoW: Bag of Words BoW는 자연어 즉, 텍스트(text)를 처리하는 방법 중에 하나로 간단하고 이해하기 쉬운 방법중 하나입니다. 짧게 말하면 단어가방(Bag of Words)를 가지고 문장을 표현하는 방법 입니다.

bigdatamaster.tistory.com

 

반응형
반응형


쓰레기 집하장에서 1등 로또 찾기

데이터 분석 업무의 직설적인 설명이다.
예전에는 데이터 마이닝 이라고 했다.
흙모래 속에서 금을 찾는 것 처럼 데이터 속에서도 금 같은 가치를 찾고자 해서 이름 불려진게 아닌가 싶다.

요즘은 오픈소스 소프트 워어와 여러 패키지 들이 이미 개발되어 있기 때문에 데이터 분석이 많이 쉬워 졌기는 하지만 아직도 마이닝 수준의 노동과 노력이 필요한 것 같다

문제에 대한 창의적인 어프로치, 다양한 실험 능력과 결과 분석능력, 그리고 우직한 체력이 데이터 분석가 에게는 필수적이다.

아~ 오늘은 일단 자자

반응형

'기타' 카테고리의 다른 글

구글 밋 카메라 정지 움직임 없음 문제 해결 방법  (0) 2022.06.11
행복 그림 찾기 2  (0) 2017.03.17
행복 그림 찾기 - 1  (0) 2017.03.07
(1) 4차 산업혁명에 대하여  (0) 2017.02.26

+ Recent posts