1부 첫 번째 사례 탐구: 카드 게임의 승리 전략 탐색
1장 파이썬으로 확률을 계산하는 방법
1.1 표본 공간 분석: 방정식 없이 결과의 불확실성을 측정하는 접근법
__1.2.1 문제 1: 네 자녀를 둔 가족 분석하기
__1.2.2 문제 2: 다면체 주사위를 굴렸을 때 분석하기
__1.2.3 문제 3: 가중된 표본 공간으로 주사위를 굴렸을 때 확률 계산하기
1.2 사소한 확률 계산 문제
1.3 구간에 대한 확률 계산
__1.3.1 구간 분석법으로 극단 평가
1.4 요약
2장 맷플롯립으로 확률 그래프 그리기
2.1 맷플롯립으로 그래프 그리기
2.2 동전 뒤집기 확률 그래프 그리기
__2.2.1 여러 동전 뒤집기 확률 분포도 비교하기
2.3 요약
3장 넘파이로 무작위 시뮬레이션 수행하기
3.1 넘파이로 무작위 동전 뒤집기와 주사위 던지기 시뮬레이션하기
__3.1.1 편향된 동전 뒤집기 분석
3.2 히스토그램과 넘파이 배열로 계산하는 신뢰 구간
__3.2.1 히스토그램 내 유사한 점들을 묶기
__3.2.2 히스토그램에서 확률 구하기
__3.2.3 고신뢰 구간의 범위 줄이기
__3.2.4 넘파이로 히스토그램 계산하기
3.3 신뢰 구간으로 편향된 카드 덱 분석하기
3.4 순열로 카드 뒤섞기
3.5 요약
4장 첫 번째 사례 탐구의 솔루션
4.1 뒤섞은 카드 덱에서 빨간색 카드 예측하기
__4.1.1 전략의 성공 확률 추정하기
4.2 열 장으로 구성된 카드 덱 하나에 대한 표본 공간으로 전략 최적화하기
4.3 요약
2부 두 번째 사례 탐구: 온라인 광고 클릭의 유의성 평가하기
5장 사이파이를 사용한 기본 확률 및 통계 분석
5.1 사이파이로 데이터와 확률 간 관계 탐색하기
5.2 중심성의 척도로서 평균
__5.2.1 확률 분포의 평균 구하기
5.3 흩어진 정도를 측정하는 분산
__5.3.1 확률 분포의 분산 구하기
6장 사이파이와 중심 극한 정리로 예측하기
6.1 사이파이로 정규 분포
실제 데이터 분석가들이 다루는 프로젝트로 실전 능력을 키워보자!
“수많은 리뷰 데이터에서 가치 있는 정보를 얻으려면 어떤 분석 기법을 써야 할까요?”
우리가 데이터 분석 기초를 학습했다면 저마다 배운 개념을 토대로 다양한 텍스트 분석 기법을 제시할 것이다. 더 나아가 그 기법이 무엇인지, 어떻게 사용하는지 이론을 설명하는 건 어렵지 않을 것이다. 그럼 다음과 같은 요청을 받는다면 어떨까?
“광고 캠페인을 실행할 준비를 하고 있습니다. 더 많은 구매를 유도할 수 있도록 채널별 조회 수와 클릭 수를 비교하고 더욱 효과적인 채널을 선택해 주세요.”
이런 요청을 받는다면 어떨까? 어떤 클릭이 의미 있는 클릭이고 어떤 클릭이 순전히 무작위로 발생한 클릭일지 분석해 볼 계획을 바로 머리에 떠올릴 수 있을까? 다양한 분석 툴, 데이터 분석 과정(수집, 전처리, 분석, 시각화, 예측 등 데이터 분석에 관한 이론은 어느 정도 능숙해졌지만, 막상 이런 실전 앞에서는 머리가 하얘질 수도 있다.
하나의 케이스를 두고 데이터를 분석하는 프로젝트는 코드와 알고리즘, 데이터셋, 시각화까지 조화롭게 다룰 줄 알아야 하고, 익숙해지는 데까지는 수많은 연습이 필요하다. 이 책은 실제 데이터 분석가들이 매일 다루는 문제 중에서 5가지 케이스를 가져와 문제 파악부터 솔루션까지 전 과정을 설명한다. 복잡한 데이터나 지저분한 데이터를 정제하는 법, 예측 모델에 맞지 않는 알고리즘을 해결하는 방법 등 프로젝트를 진행하면서 마주할 수 있는 어려운 상황에서 어떻게 해결해야 할지 실용적인 솔루션까지 알려준다. 지금까지 습득한 이론을 바탕으로 실질적인 데이터 분석 프로젝트를 경험해 보고 싶다면 이 책으로 넘어가 보자!