프롤로그 “데이터 사이언티스트는 무슨 일을 하나요?”
│1부│ 숫자와 현실을 연결하다
: 데이터 사이언티스트의 등장
1장 데이터 필수 시대
개념보다 중요한 것은 활용이다
쌓일수록 가치가 생기는 것
누구에게나 도움이 되는 데이터
데이터는 경쟁력을 좌우한다
모든 것이 데이터가 된다
2장 데이터 사이언티스트의 역할
이 시대에 꼭 필요한 전문가들
기술, 통계, 인문의 경계를 넘나든다
숫자로 설득해야 한다
숫자와 현실을 연결해야 한다
숫자와 언어 속에서 맥락을 읽어낸다
│2부│ 기술보다 먼저 익혀야 할 것들
: 데이터 사이언티스트의 역량
3장 문과생 데이터 사이언티스트의 기초체력 다지기
정도가 아닌 길을 걷는 이들에게
외국어를 배우듯 코딩을 배워라
맛있는 요리를 만들듯 통계를 대하라
통계 관련 수업은 최대한 많이 들어라
프로젝트에 대한 가치판단을 전달하라
스페셜리스트가 되려면 제너럴리스트가 되라
박쥐의 고통을 감수하라
문과생이 아닌데 데이터 사이언티스트가 되고 싶다면
4장 데이터 사이언티스트의 마인드 세팅
향상심: 지금보다 나아지고자 하는 욕구
호기심: 현상을 관찰해 문제를 파악하는 힘
사교성: 사람들이 원하는 것을 파악하는 능력
주도권: 데이터에 대한 주인 의식
경험: 기획과 변형, 해석의 바탕
에필로그 “지금 하는 일을 좋아하나요?”
│3부│ 데이터가 사람을 위해 일하게 만드는 법
: 데이터 사이언티스트 실무
5장 데이터 사이언티스트의 일
데이터에서 가치를 찾아라
감각, 기술, 소양을 갖춰라
다양한 프로젝트들
프로젝트 유형 1: 인사이트를 사람에게 전달하는 경우
프로젝트 유형 2: 데이터를 실제 IT서비스에 반영하는 경우
6장 데이터 사이언티스트의 무기
사고하고 판단할 수 있는가
나만의 관점이 있는가
분석에 대한 그림을 그릴 수 있는가
다양한 경험을 융합할 수 있는가
│4부│ ‘나’라는 데이터를 분석하는 워크숍
: 적성을 찾고 확신을 얻는 과정
인간이 하는 모든 활동이 데이터가 되는 시대
지금 이 시간에도 모든 것은 데이터가 되고 있다. 하물며 매일 들고 다니는 스마트폰에도 걸음 수와 움직인 거리가 기록되고, 무심코 들어간 웹사이트나 앱 로그 기록도 충실하게 쌓인다. 일정 기간 특정 브랜드가 몇 번 언급되었는지, 대중교통을 이용하는 인구수는 물론 특정 지역에 모여 있는 사람들의 수를 사진 분석 기술로 알아낼 수 있을 정도다. 인간이 하는 활동의 거의 모든 것을 수치화하고 데이터로 바꿀 수 있는 시대가 되었다고 해도 과언이 아닌 셈이다. 수집할 수 있는 데이터가 방대해지자 ‘서말’인 데이터를 ‘꿸’ 사람들에 대한 수요도 폭증했다. 데이터를 보유한 기업은 쌓여있는 데이터에서 새로운 가치를 만들어내기 위해 데이터를 분석, 가공할 사람이 필요해진 것이다.
데이터와 현실을 연결하는 ‘통역가’
누군가 “요즘 가장 잘 팔리는 게 뭐예요?”라고 묻는다면 그 답을 어떻게 유추할 수 있을까? 데이터 사이언티스트는 ‘요즘’부터 정의한다. 요즘이 오늘을 기준으로 3개월 전인가, 1개월 전인가, 혹은 일주일 전인가, 한 시간 전인가를 생각하는 식이다. 아이디어(분석 주제를 ‘분석 가능한 숫자’로 확인하는 습관이다. 처음에는 사람들이 궁금해 하는 것과 데이터 사이에 아무런 관계가 없다. 하지만 데이터 사이언티스트는 어떤 상품이나 서비스가 잘 팔리고 있다는 ‘현실’을 ‘데이터’로 분석해 보여주는 사람이다. 분석에만 그치지 않고 분석 결과물이 제품이나 서비스를 개발하고 있는 기업에 어떤 쓸모가 있는지, 숫자가 아닌 이해하기 쉬운 언어로 전하는 것까지가 그들의 일이다. 저자는 이 과정을 통틀어 데이터와 현실을 연결하는 ‘통역가’라고 칭한다.
열 살부터 코딩 배운 전문가와 경쟁하지 마라
좋은 데이터 사이언티스트가 되려면 3가지 역량이 필요하다. 분석하는 기술, 통계 지식, 해석하고 소통하는 인문학적 역량이다. 빅데이터를 분석하려면 기술의 힘을 빌려야 한다. SQL이나 파이선 등 기계언어를 활용해 방대한 양의 숫자와