1. R 설치 1
2. 명령문 실행하는 R 콘솔을 계산기로 써보기 8
3. 최소단위 벡터vector 그리고 구성요소 묶는 c 함수 10
4. 1:5 하면 1 간격으로 이렇게 1 2 3 4 5 12
5. 문자 벡터 구성요소에 "" 없으면 R이 객체를 찾는다 13
6. 벡터가 최소단위라서 재활용recycling 15
7. 맞다TRUE 아니다FALSE 논리 벡터 19
8. 그리고& 혹은| 아니다! 21
9. ==대신 = 쓰면 보통은 벡터가 지정된다 26
10. 벡터 구성요소 가져오는 대괄호 [] 27
11. 제곱근sqrt 절대값abs 반올림round 올림ceiling 내림floor 소수버림trunc 29
12. R에서는 은행 반올림banker’s rounding 쓴다 32
13. R 각도는 라디안radian 34
14. log 함수와 자연상수 36
15. 중심을 표현하는 함수 mean median 38
16. R 자체 함수 안 쓰고 버티기와 length 함수 39
17. 결측값NA 그리고 결측값 없애는 na.rm 함수 41
18. 규칙적 벡터 그리고 벡터 규칙적으로 정리하기 seq rep sort 42
19. 벡터 구성요소 하나 하나 한꺼번에 따지는 ifelse 함수 45
20. 중위수 미만 평균이라는 새로운 시도 47
21. 대괄호 [] 써서 중위수 미만 평균 구하기 48
22. ifelse 써서 중위수 미만 평균 구하기 49
23. subset 써서 중위수 미만 평균 구하기 50
24. 자신만의 함수 만들기 51
25. if 함수를 잘 안 쓰고 대신 ifelse 쓰는 이유 54
26. 벡터로 데이터프레임 만들기 56
27. 열 행 묶어 데이터프레임 그리고 벡터 재활용 rbind cbind 57
28. 중간에 $ 넣어서 데이터프레임에서 벡터 가져오기 60
29. 벡터를 그냥 표처럼 정리하면 메트릭스 61
30. 메트릭스 다르게 만들기 rbind cbind 63
31. 메트릭스에서 행과 열 이름 붙이기 64
3
책 속에서
서문
이 책 목차만 보아도, R과 확률통계 둘 다 이해가 꽤나 된다. 목차만 보아도 공부가 되는 것은, 그렇게 설계되었기 때문이다. 문과생 대상 수업을 통한 진화 결과물이 이 책이다.
중요한 것은 수업방식이다. 의욕이 가득한 학생들이 자유롭게 질문하고 실습하다 보면, 잡다한 것을 접고 본질로 나아간다. 그래서 기본 단위 벡터vector 그 실질적 작동을 반복적으로 다룬다. 단위가 하나 하나의 숫자나 문자가 아니기에, 벡터 계산에서 재활용recycling 현상이 일어난다.
더 쉽게도 진화가 이루어진다. R 코딩에서 함수function 이해가 중요하다. 이해하려면 이름 원래 의미를 알아야 한다. 영어 단어 뜻과 발음, 때로는 어원도 설명한다. 흔히들 영어로 쭉 적고 그대로 코딩하라는 얘기을 한다. 『영어재미붙이기: 어원과 동사』, 『어원+어원=영단어』 두 권을 추천한다. 마음에 여유가 없으면, 『어원+어원=영단어』 부록 ‘앞에 붙는 어원’을 읽어보자.
수업에서 늘 대화형 언어라는 R 특징을 활용한다. 벡터 구성요소를 매번 보여준다. 책 분량이 길어지지만, 이해는 쉬워진다. 함수 세부사항도 생략하지 않고 보여준다.
수업에서의 이런 저런 과정을 그대로 담아두는 것도, 하나의 진화이다. 모로 가도 서울만 가면 된다고 코딩하는 사람들은 이야기한다. 중위수 미만 평균 만들기 같은 수업 실습 내용을, 책에서는 그대로 담고 있다.
이 책은 혼자서 해도 재미를 붙일 수 있다. 수업에서와 마찬가지로, 하루 10분씩 교재 내용을 컴퓨터 실습하자.
책 내용 구성이 특별하다는 것을 강조하고 싶다. R 언어와 확률통계를 연결한다. 특히나 손쉬운 프로그램인 R Commander를 연결시킨다.
이런 접근으로 통찰적 이해가 가능하다. 요인factor 개념에서 이러한 점이 잘 드러난다. 백과사전식 설명을 하지 않는다. 책 전반에서 먼저 측정수준을 전체를 연결하는 고리로서 진행한다. 이런 식으로 숫자가 가지는 의미 차이에서 요인이 나온다는 것을 드러낸다. 그리고