목차
제1장 서론 1
1.1 AI Studio 소개...............................................................4
1.2 사용자 인터페이스...........................................................5
1.3 오퍼레이터 사용 방법.......................................................8
1.4 AI Studio분석 프로세스................................................. 14
1.5 데이터 분석 방법론........................................................ 24
1.6 결론............................................................................ 28
제2장 비즈니스 이해 31
2.1 서론............................................................................ 32
2.2 비즈니스 목표를 결정하라 .............................................. 33
2.3 상황을 평가하라............................................................ 37
2.4 데이터 분석 목표 결정하라 ............................................. 42
2.5 프로젝트 계획서를 작성하라 ........................................... 53
2.6 결론............................................................................ 55
제3장 데이터 이해 57
3.1 서론...................
데이터 분석이 기본 소양이 되는 시대가 되었다. 데이터를 활용하는 것은 이미 오래전부터 강조되어 왔지만, 근래에 들어 데이터 분석이 개인이나 조직의 생존과 발전을 위한 필수 사항이 되고 있다.
데이터 분석을 머신러닝과 같은 것으로 보는 사람도 있다. 그러나 이 두 분야는 서로 다른 목적으로 존재한다. 머신러닝은 추상화된 문제를 해결하는 방법, 즉 알고리즘의 개발을 주요 목적으로 하는 반면, 데이터 분석은 머신러닝을 포함한 다양한 분석 방법을 사용하여 현실의 문제를 해결하기 위한 통찰(insights을 얻는 것을 목적으로 한다. 데이터 분석의 핵심 도구로 머신러닝이 사용되기 때문에 겹치는 부분도 있지만, 머신러닝은 머신러닝만의 고유한 영역이 있고, 데이터 분석은 데이터 분석만의 영역이 있다.
데이터 분석은 누가 수행할까? 오늘날 마케팅이든, 전략이든, 생산이든 어떤 영역에 있는 사람들도 데이터 분석을 할 줄 알아야 하며, 이것이 경쟁 우위의 원천이 된다. 저자는 현업에 있는 사람들의 데이터 분석 입문을 돕기 위해 이 책을 저술하였다. 이 책은 독자들이 Altair사의 No Code 데이터 분석 소프트웨어인 RapidMiner AI Studio를 사용하여 코드를 작성하지 않고 데이터 분석을 수행하는 방법을 학습하도록 한다.
이 책의 목적은 데이터 분석을 배우는 것이다. 데이터 분석을 배우면 머신러닝과 혼동하듯이, RapidMiner AI Studio를 배우는 것이 데이터 분석이라고 혼동할 수 있다. 이 사실을 명심하고 학습하길 바란다. 데이터 분석의 전체적인 맥락을 놓치지 않도록 하기 위해 이 책은 CRISP-DM 방법론을 따라 학습하도록 내용을 구성하였다. 먼저 데이터 분석의 체계를 학습하고, 그 안에 있는 세부 내용을 학습하도록 하자.
이 책은 데이터 분석을 배우기 위한 교두보이다. 이 책에서 다루지 않은 많은 주제들이 있다. 다양한 시각화 기법도 있을 수 있고, 통계적 기법도 있다. 물론, 다양한 머신러닝 기법은 말할 것도 없다. 그러나 나는 데이터