스마트폰의 보급 이후 우리는 일상의 작은 일도 트위터와 같은 사회관계망서비스(SNS)에 실시간으로 공유한다. 이 디지털 일기를 추적해보면 사람들의 하루 일과는 물론 감정의 변화도 읽을 수 있다. 

지난 한 해 동안 생성된 트위터 15억건을 살펴보면 트위터 이용자들은 "커피 마시다"라는 내용의 트윗을 주로 오전 9시와 오후 1시 그리고 5시에 남겼다. 그런데 이 세 잔의 커피는 모두 조금씩 다르다. 
 
오전 9시에 마시는 커피는 출근 후 사무실 탕비실에서 타먹는 '모닝 믹스 커피'가 많다. 그리고 오후 1시 커피는 점심 식사 후 사무실로 들어가는 길에 들른 '테이크아웃' 커피점에서 산다. 또 오후 4~6시 사이는 주로 카페에서 마시는 커피다. 
 
   
▲ 2012년 한 해 동안 올라온 트위터로 분석한 트위터 이용자의 하루 일상 ⓒ다음소프트
 
빅데이터를 보면 사람들의 일상을 알 수 있다. 생각보다 사람들은 비슷한 일상을 살고 있다. 데이터 마이닝 회사 다음소프트가 분석한 트위터 자료에 따르면 한국 사람들은 보통 새벽 6시부터 일상을 시작한다. 
 
오전 6시 "출근길에 잠을 보충"하고, 오전 10시 "점심 식사를 고민한다". 오후 2시엔 화장실에서 휴대폰을 들여다보고, 오후 6시엔 "상사가 언제 들어갈지 기미를 살핀다". 또 귀가 후 밤 10시엔 "나에 대한 보상으로 옷을 지르"는 여성이 많고, 0시엔 "잠이 안와 TV를 보는" 사람들도 상당하다. 물론 이들은 항상 스마트폰을 끼고 트위터에 자신의 상태를 남기는 중이다. 
 
이런 빅데이터 분석 자료가 모든 사람의 삶을 정확히 보여주진 않는다. 그러나 일종의 패턴과 성향의 변화를 알려줄 수는 있다. 항상 소비자의 심리와 일상에 주목하는 기업 입장에선 믿을 수 있는 마케팅 자료 중 하나다. 
 
   
▲ 2012년 한 해 동안 올라온 트위터로 분석한 트위터 이용자의 하루 일상 ⓒ다음소프트
 
8일 서울 한국과학기술회관에서 열린 '한국경영정보학회 추계학술대회'에서 권미경 다음소프트 이사는 빅데이터 마이닝(분석)을 통해 얻을 수 있는 정보와 활용 분야를 소개했다. 권 이사는 IT(정보통신)의 발전으로 데이터가 훨씬 더 늘어날 것이며, 분석도 용이해질 것이라고 말했다. 
 
다음소프트는 주로 소셜미디어 마이닝을 한다. 트위터나 블로그 혹은 커뮤니티 등의 텍스트를 모두 모아서 의미있는 정보를 추출하는 행위다. 고객사의 요청에 따라서 분석 대상은 달라진다. 화장품 등에 대한 소비자 심리 분석이 필요할 땐 '82쿡닷컴' 등 여성 커뮤니티의 게시물을 분석하고, 남성 상품일 경우엔 'SLR클럽', 'MLB파크'을 찾는다.  
 
권 이사는 "빅데이터를 이용하면 사람들의 욕망을 읽을 수 있다"고 설명했다. 예를 들어 트위터에서 사람들이 가장 많이 언급하는 패션 브랜드는 자라, 샤넬, 나이키 등이다. 이 중 샤넬은 '가장 사고 싶은 브랜드'로 뽑히는 동시에 '가장 많이 사는 브랜드'로도 선정됐다. 권 이사는 "실제 샤넬을 가장 많이 사기 보다는 구매 후 가장 자랑을 하는 브랜드이기 때문"이라고 말했다. 
 
   
▲ 2009년~2012년 블로그에 올라온 단어 '불황'의 연관어 추이 ⓒ다음소프트
 
요일별 마케팅도 용이해진다. 트위터나 블로그에 올라오는 문장을 해석하면, 엄마와 전화통화는 화요일부터 금요일까지 주로 한다. 술 생각은 화요일부터 나고, 실제 마시는 건 금, 토요일이 많다. 그래서인지 몸살 관련 언급은 일, 월요일에 잦다. 권 이사는 "책은 화요일에 많이 읽는다"며 "사람들의 글을 통해 일주일 패턴을 읽을 수 있다"고 말했다. 
 
불황에 대한 인식도 흥미롭다. 다음소프트가 2009년부터 4년간 블로그 게시물을 분석한 결과에 따르면 불황 연관어에서 "힘들다"라는 단어는 줄어든 반면, "익숙하다"는 단어가 많아졌다. 물론 "위축된다", "어렵다"는 단어는 꾸준히 상위권을 유지해 실상 큰 변화는 없을 수도 있다. 결국 단순한 분석보다 더 중요한 건 '어떻게 해석하느냐'라는 얘기다. 
 
또한 소셜미디어 마이닝에도 한계는 있다. 블로그, 트위터 등 인터넷 이용자들을 대상으로 하기 때문에 대상이 젊은 계층으로 집중된다. 상대적으로 IT 기기를 덜 쓰는 노년층의 심리나 소비패턴을 읽기 힘들다. 권 이사는 "그런 측면이 있는 건 맞지만, 기존의 다른 조사에 비해 가장 신뢰감을 줄 수 있다"고 말했다. 그는 "한국에서 하루에 생성되는 트윗이 500만건이다. 어디서도 이런 양의 데이터를 구할 수 없다. 우린 양이 질을 압도한다고 본다"고 말했다. 
저작권자 © 미디어오늘 무단전재 및 재배포 금지