[1부] 데이터 기초체력 기르기
01장: 통계학 이해하기
1.1 왜 통계학을 알아야 할까?
1.2 머신러닝과 전통적 통계학의 차이
1.3 통계학의 정의와 기원
1.4 기술 통계화 추론 통계
___1.4.1 기술 통계
___1.4.2 추론 통계
02장: 모집단과 표본추출
2.1 모집단과 표본, 전수조사와 표본조사
2.2 표본조사를 하는 이유와 데이터과학 적용 방법
2.3 표본추출에서 나타나는 편향의 종류
2.4 인지적 편향의 종류
___2.4.1 확증 편향(confirmation bias
___2.4.2 기준점 편향(anchoring bias
___2.4.3 선택 지원 편향(choice-supportive bias
___2.4.4 분모 편향(denominator bias
___2.4.5 생존자 편향(survivorship bias
2.5 머신러닝 모델 측면의 편향과 분산
2.6 표본 편향을 최소화하기 위한 표본 추출 방법
03장: 변수와 척도
3.1 변수의 종류
3.2 변수 관계의 종류
3.3 척도의 종류
04장: 데이터의 기술 통계적 측정
4.1 중심 성향의 측정
4.2 분산과 표준편차
4.3 산포도와 범위, 사분위수, 변동계수
4.4 왜도와 첨도
___4.4.1 왜도
___4.4.2 첨도
4.5 표준편차의 경험법칙
05장: 확률과 확률변수
5.1 확률의 기본 개념
5.2 확률의 종류
5.3 분할과 베이지안 이론
___5.3.1 분할
___5.3.2 베이지안 이론
5.4 확률변수의 개념과 종류
5.5 심슨의 역설
06장: 확률분포
6.1 확률분포의 정의와 종류
6.2 이산확률분포
___6.2.1 균등분포
___6.2.2 이항분포
___6.2.3 초기하분포
___6.2.4 포아송분포
6.3 연속확률분포
___6.3.1 정규분포
___6.3.2 지수분포
6.4 중심극한정리
07장: 가설검정
7.1 귀무가설과 대립가설
7.2 가설검정의
데이터 분석과 머신러닝의 각 업무 단계를 깊이 있게 이해하자!
이 책은 실무적인 관점에서 데이터 분석의 기초 체력이라 할 수 있는 통계학부터 머신러닝 기법까지 다룹니다. 비즈니스 문제 정의 단계부터 시작해서 탐색적 데이터 분석(EDA, 데이터 전처리와 파생변수 생성, 머신러닝 모델링 및 성능평가, 그리고 스토리텔링까지, 데이터 분석가라면 반드시 알아야 하는 모든 내용을 담고 있습니다.
실무자가 회사에서 바로 활용할 수 있도록 불필요한 수식과 이론을 최소화하고 핵심 개념을 쉽게 이해할 수 있게 구성했습니다. 데이터 분석 및 머신러닝의 전체 과정을 미니 프로젝트 기반으로 실습하면서 데이터를 올바르게 이해하고 의미 있는 비즈니스 인사이트를 얻는 방법을 배울 수 있습니다.
★ 이 책에서 다루는 내용 ★
* 데이터 분석에 필수적인 통계학의 기본 개념
* 데이터 편향과 인지적 편향
* 비즈니스 문제를 정의하고 데이터 분석의 목적을 도출하는 방법
* 데이터 분석 환경 구성
* 데이터 탐색과 시각화
* 데이터 전처리와 파생변수 생성
* 주요 머신러닝 알고리즘과 모델 성능 평가 기법
* A/B 테스트와 MAB