도서상세보기

도서명 R로 배우는 실무 데이터 과학
저자 니나 줌멜, 존 마운트
출판사 제이펍
출판일 2017-12-15
정가 30,000원
ISBN 9791188621002
수량
PART I 데이터 과학 소개
CHAPTER 1 데이터 과학 프로세스 3
1.1 데이터 과학 프로젝트에서의 역할 3
1.1.1 프로젝트에서의 역할 4
1.2 데이터 과학 프로젝트의 단계 7
1.2.1 목표 설정 8
1.2.2 데이터 수집과 관리 9
1.2.3 모델링 12
1.2.4 모델 평가와 비평 14
1.2.5 프레젠테이션과 문서화 15
1.2.6 모델 배포와 유지보수 17
1.3 기대치 설정 17
1.3.1 모델 성능 상하한선 결정 18
1.4 요약 20

CHAPTER 2 R 프로그램에 데이터 적재하기 21
2.1 파일에 있는 데이터 다루기 22
2.1.1 파일 또는 URL로부터 잘 구조화된 데이터 작업하기 22
2.1.2 덜 구조화된 데이터에 R 사용하기 25
2.2 관계형 데이터베이스를 이용하여 작업하기 28
2.2.1 실무 예제 29
2.2.2 R에 데이터베이스 데이터 입력하기 34
2.2.3 PUMS data로 작업하기 36
2.3 요약 39

CHAPTER 3 데이터 탐색하기 41
3.1 통계 요약치를 이용하여 문제 파악하기 43
3.1.1 데이터 요약을 통해 전형적인 데이터 문제 파악하기 44
3.2 그래프와 시각화를 통해 문제 제거하기 48
3.2.1 단일변수에서 시각적으로 분산 점검하기 51
3.2.2 두 변수의 관계를 시각적으로 확인하기 60
3.3 요약 71

CHAPTER 4 데이터 관리 72
4.1 데이터 정리하기 72
4.1.1 결측치 다루기 73
4.1.2 데이터 변환 78
4.2 모델링과 데이터 유효성 검증을 위한 샘플링 86
4.2.1 테스트와 트레이닝의 분할 86
4.2.2 샘플 그룹 열 만들기 87
4.2.3 레코드 그룹화 88
4.
데이터 탐색에서 모델링, 결과 전달에 이르기까지
데이터 과학의 모든 프로세스를 담았다!




비즈니스 분석가와 개발자는 점점 더 중요한 비즈니스 데이터를 수집하고, 큐레이팅하고, 분석하고 보고한다. R 언어와 관련 도구들은 이런 과중한 업무를 학문적 이론이나 고급 수학을 적용하지 않는 일상적인 데이터 과학 작업으로 처리하는 손쉬운 방법을 제공한다.



이 책은 실무 비즈니스에 사용할 수 있는 R 프로그래밍 언어와 유용한 통계 기술 적용 방법을 보여준다. 마케팅, 비즈니스 인텔리전스 및 의사 결정 예를 사용하여 A/B 테스트 같은 설계 방법, 예측 모델 작성 방법 및 모든 수준의 잠재 고객에게 결과를 제시하는 방법 등을 제대로 보여준다.



이 책이 다루는 내용

■ 비즈니스 전문가를 위한 데이터 과학

■ R 언어를 이용한 통계 분석

■ 기획에서 제품 인도까지의 프로젝트 라이프사이클

■ 즉시 응용 가능한 수많은 사례

■ 효과적인 데이터 프레젠테이션의 핵심