들어가며―
등장인물 소개
1일째
통계학의 세계로
오신 것을 환영합니다
1교시 통계학은 어떤 학문일까?
지난 100년간 크게 발전한 학문
통계학은 어디서 쓰일까?
의학과 심리학에도 이용된다
통계학은 쉽지 않다!
데이터 리터러시를 높여라!
통계학에는 두 종류가 있다
신흥세력 ‘베이즈 통계학’이란?
2교시 통계학에는 다양한 분석기법이 있다
대표적 분석기법① 중회귀 분석
대표적 분석기법② 로지스틱회귀 분석
대표적 분석기법③ 주성분 분석
3교시 빅데이터의 환상에 넘어가지 마라!
빅데이터는 만능 해결사?
데이터에 기반한 경영의 어려움
이 책으로 데이터 리터러시 높이자!
? 1일째 수업 정리
2일째
‘무늬만 조사’에 휘둘리지 않는
무작위 추출법
1교시 조사의 신뢰성은 ‘무작위 추출법’으로 결정된다!
‘무늬만 조사’에 속지 마라!
신뢰할 수 있는 조사를 하고 싶다면 ‘무작위 추출법’을!
다카하시 선생님이 숫자를 해석하는 법/ 원형 차트는 신중하게 사용하자
2교시 4가지 무작위 추출법을 이해하자!
모든 대상으로부터 무작위로 추출하는 ‘단순 무작위 추출법’
층으로 나눠서 추출하는 층별 추출법
2단계로 추출하는 ‘2단 추출법’
층별+2단 조합 기술인 ‘층별 2단 추출법’
진실을 아는 것은 모집단뿐
무작위 할당이라니?
리뷰 경제의 위기
? 2일째 수업 정리
3일째
데이터의 분위기를 파악하자!
수량 데이터 편
1교시 데이터는 먼저 분위기를 파악해야 한다!
데이터를 다루는 법의 기본을 배우자
데이터의 분위기를 파악하다니?
데이터는 두 종류로 나뉜다
2교시 ‘데이터가 흩어진 정도’를 수치화해 보자
‘평균’이란 ‘평평하게 고르는’ 것
제곱합, 분산, 표준편차로 ‘데이터가 흩어진 정도’를 파악하자.
평균을 기준점으로 삼은 것이 ‘제곱합’
제곱합의 약점을 해결하는 분산
분산을 루트로 나타낸 표준편차
제곱합, 분산, 표준편차는 통계학의 숨은 매니저 역할!
추리통계학에서 사용하는 ‘
통계학은 어떤 학문일까
우리가 자주 접하는 여론조사
의학과 심리학에도 이용
요즘 주목받고 있는 통계학, 문과 출신은 숫자만 봐도 어질어질한데 통계학은 더 어려울 것 같은데…. 아무튼 통계학이 어떤 학문일까? 통계학은 지난 100년간 크게 발전한 학문이다. 그런데 요즘에는 왠지 모르지만 통계학이 주목을 받고 있다. 아마 빅데이터가 회자되고 있어서가 아닐까. 기업과 공공기관은 기술 발전 덕분에 다양한 종류의 데이터를 엄청나게 많이 수집할 수 있게 되었다. 그 데이터를 묻어두는 건 아까우니 이걸 좀 활용해보자, 그러려면 통계학을 알아야 한다.
우리 주변에서 예를 들자면 여론조사가 있다. 집권 여당 지지율도 이에 해당한다. 전월 대비 몇 포인트 내렸다는 식으로 언론에 보도된 것이 모두 통계학이다. 그리고 비즈니스에서도 통계학을 이용한다. 마케팅 리서치의 예로 ‘어느 연령층이 어떤 SNS를 가장 많이 이용하는가’를 조사해서 ‘대응분석’이라는 걸 한다. 20대는 트위터, 50대는 라인을 가장 많이 이용한다는 뜻이다. 어디에 광고를 낼지 기업이 검토할 때 도움이 된다.
또 의학에도 많이 사용한다. A약을 복용한 사람과 B약을 복용한 사람의 데이터를 비교해 어느 약이 잘 듣는지 판단할 때 이용하기도 한다. 그런 목적으로 쓰이는 분석기법은 통계학 입문서에서 많이 소개하는 ‘통계적 가설검정’이다.
데이터 분석 전문가는 뭘하는 사람인가
분석의 천재가 데이터를 물끄러미 바라보다가 영감을 받아서 ‘좋아, 이 방법으로 하자!’라고 하는 모습을 상상하면 안 된다. 클라이언트와 협의해서 분석의 목적을 명확히 하거나 목적에 맞는 분석기법을 모색하거나 데이터에 비정상적인 값이 섞여 있지 않은지 분석하는 등 착실하게 꾸준히 일하는 느낌이다. 여기서 주의할 점은 외부에 데이터 분석을 맡긴다고 해서 반드시 뛰어난 결과를 얻는다는 보장은 없다. 오히려 안 좋은 의미에서 충격을 받을 수도 있다.
56개 점포로 구성된 프랜차이즈 커피점이 정밀한 중회귀식 도출을 맡겼다고 하자. 그 결과