2013년 10월 8일 화요일

[책추천 #21] 통계의 힘 - 나사우치 히로무 지음

빅데이터, 빅데이터 라는 말을 저도 자주 언급했지만 뉴스나 신문지상에 나오는 키워드로 많이 듣고 있습니다. 추천드리는 이 책도 제목의 시작으로 빅데이터를 지해하는 이라는 말을 붙이기는 했습니다만 책의 전반적인 내용은 통계학이 가지고 있는 장점들이 주요 내용이고 이러한 장점들이 빅데이터 시대를 맞이 하여 그 활용 가치가 극대화 될것이라는 내용입니다. 

최근의 신문이나 방송에 나오는 많은 서비스들은 예측되어 나오는 것이거나 한 사람에게 개인화 되어 있는 것들이 대부분 입니다. 사람들의 소비패턴을 분석한다든가 하는 세상의 많은 것들 ( 그러니깐 과거에는 분석할 엄두를 또는 분석할 가치를 느끼지 못했던 것들)에 대한 새로운 관점의 분석을 요구하게 되어 있습니다. 그러한 분석을 위한 전문인력을 키우려고 하고 또 보유하려는 노력을 기울이고 있습니다. 이러한 흐름은 우리나라 뿐 아니고 이미 세계적으로도 동일한 흐름이라고 이해 하시면 됩니다. 그래서 이러한 분석을 위해서 기반이 되는 통계적 사고법은 우리가 글을 읽고/쓰는 능력 만큼 기본적인 능력이 될것입니다. 

디지털 시대라고 하는 이전과 현재의 시대에는 정보를 얼마나 빨리 정확하게 수집하느냐가 세계를 다스리는 시대라면 현재와 미래에는 수집된 정보를 활용하는 통계학적 사고법을 가진자가 세계를 다스리는 시대가 될것 입니다. (윤종록 - 미래창조과학부 제2차관 ) 

우리는 많은 분야 많은 부분에 대해서 단순 비교법을 주로 활용합니다. 전체 중 평균적인 값이라든지 집계된 합계 값이라든지.. 극단적인 비교이긴 하지만. 책의 내용 중에 인과관계에 대한 비교의 중요성에 대한 부분을 첨가 합니다. 

적절한 비교를 거치지 않은 단순집계가 얼마나 문제인지 알기 쉬운 사례를 들어 설명하겠다. 
다음 음식을 금지해야 마땅한지 생각해보자 
* 심근경색으로 사망한 일본인의 95% 이상이 이 음식을 먹었다. 
* 강도, 살인범의 70% 이상이 범행전 24시간 내 이 음식을 먹었다. 
* 일본인에게 섭취를 금지하면 정신적 스트레스를 조장한다. 
* 에도시대 이후 일본에서 발생한 폭동의 대부분은 이 음식이 원인이다. 

이 음식은 다름 아닌 밥이다. 이렇게 한쪽의 단순집계만을 보면 "쌀밥 먹는 것을 금지해야 한다" 같은 어처구니 없는 결론이 내려질 위험도 있다. 이러한 무의미한 "분석"이 부지기수로 많다. 해외의 일류 비즈니스 스쿨에서 널리 읽히는 전문서에조차 이처럼 무의미한 해석과 근거로 "그 캠페인이 성공했다"고 주장하는 사례가 실려 있기도 하다 

하지만 "충분한 데이터"를 바탕으로 "적절한 비교"를 하는 통계적 인과추론의 기초만 몸에 배어 있으면 경험이나 감을 뛰어넘어 비즈니스를 단숨에 한 단계 업그레이드 시키는 비결을 손쉽게 찾아 낼 수 있다. 

-- 페이지 82 ~ 83 

이쯤 되면 그래서 어떻게 해야 하는데 하는 의문이 드실 수 있습니다. 그런 분들께 이 책을 추천드립니다. 기존의 의사결정에서 좀더 데이터적 분석과 의사결정이 필요 하신 분들께 추천 드립니다. 이 책은 통계학에 대한 세부 알고리즘을 설명하기 보다는 기본적인 통계학 개념이 어떤 분야에 사용되어지고 간략한 예제는 어떤것이 있다고 까지만 설명하고 있습니다. 전체를 좀 훌터보면서 읽어 보시는 것을 추천드리고 이에 각 분야 또는 업무에 활용 할 수 있는 통계학적 지식이 있다면 추가로 전문적인 문서를 좀더 읽어 보시기를 권장 합니다. 

"To Err is Human - 누구나 실수 할 수 있다" 또는 "Why to Err is Human - 무엇이 우리 판단을 조작하는가?"  책을 읽어 보면 실수는 사람의 일이라고 이해 하는것이 더 적절한 표현이라는 생각이 듭니다. 우리는 앞으로 수없이 많은 실수를 범하게 될것 입니다. 그리고 이미 지금도 그 많은 실수를 하고 있겠지요. 그것이 뇌가 하고 있는 습관과 경험의 관점에서는 비합리적인 의사결정이라고 하더라도 인간이 좀더 다양한 관점과 좀더 다양한 분석을 통한 최선을 다 할 때 해결책이 구해지는 것은 인간에게 허락된 대단히 고마운 용서라고 생각합니다.


이 책에서 다루는 내용은 다음 목차를 통해서 공유합니다. 


제1장 빅데이터, 통계학에서부터 시작하라
   01 _ 실생활과 밀접한 통계 리터러시 
   02 _ 답을 알려주는 실용적인 학문, 통계학
   03 _ 통계학은 모든 과학적 분석 방법의 기본 
   04 _ IT와 통계학의 기막힌 결혼 

제2장 정보비용을 대폭 줄여주는 통계 
   05 _ 통계가가 본 빅데이터 광상곡 
   06 _ 뉴딜정책을 뒷받침한 통계가들
   07 _ 의미 있는 오차범위와 비용

제3장 오차와 인과관계가 통계학의 핵심이다
   08 _ 나이팅게일식 통계의 한계 
   09 _ 인과관계를 생각하지 않는 통계해석은 의미가 없다
   10 _ ‘60억 엔을 버는 비결’이 담긴 리포트 
   11 _ 오바마가 선거에서 승리한 이유 
   12 _ 그것은 이익에 직결되는가? 
   13 _ ‘인과관계의 방향’을 밝혀내어야 한다

제4장 ‘임의화’라는 최강의 무기 활용하기 
   14 _ 우유가 먼저인가, 홍차가 먼저인가? 
   15 _ 임의화 비교실험이 사회과학을 가능하게 했다 
   16 _ ‘재봉틀 두 대 사면 10% 할인’으로 매출이 오를까 
   17 _ 임의화의 세 가지 한계 

제5장 통계학은 계속 발전하고 있다 
   18 _ 역학의 발전이 증명한 담배의 위험 
   19 _ ‘평범으로의 회귀’를 분석하는 회귀분석 
   20 _ 천재 피셔의 또 다른 업적 
   21 _ 통계학의 이해도를 높여주는 단 한 장의 도표8
   22 _ 다중회귀분석과 로지스틱 회귀 
   23 _ 통계학자가 극대화한 인과의 추론 

제6장 통계학의 여섯 가지 활용 분야
   24 _ 사회조사법 대 역학과 생물통계학
   25 _ IQ를 탄생시킨 심리통계학 
   26 _ 마케팅 현장에서 생겨난 데이터마이닝 
   27 _ 문장을 분석하는 텍스트마이닝
   28 _ ‘연역’의 계량경제학과 ‘귀납’의 통계학 
   29 _ 베이즈파와 빈도론파의 확률을 둘러싼 대립 

제7장 에비던스 활용하기 
   30 _ 거인의 어깨 위에 서는 방법
   31 _ 에비던스, 어떻게 찾을 것인가 

 

언제 부터 였던가 생각해보니 아르바이트 겸 외부 컨설팅을 의뢰 받고 맥북 프로를 처음 써봤을 때 부터 였던 것 같다. 지금은 거의 대부분의 작업을 맥으로 작업을 하다 보니 윈도우에서만 실행되는 일부 프로그램들 때문과 회사 내부 ERP프로그램이 윈도우 ...