1장 소개 1
1.1 이 책의 대상 독자 10
1.2 심층 학습의 역사적 추세 13
제1부 응용 수학과 기계 학습의 기초 29
2장 선형대수 31
2.1 스칼라, 벡터, 행렬, 텐서 32
2.2 행렬과 벡터의 곱셈 35
2.3 단위행렬과 역행렬 37
2.4 일차종속과 생성공간 38
2.5 노름 41
2.6 특별한 종류의 행렬과 벡터 43
2.7 고윳값 분해 44
2.8 특잇값 분해 47
2.9 무어-펜로즈 유사역행렬 48
2.10 대각합 연산자 49
2.11 행렬식 50
2.12 예: 주성분분석 50
3장 확률론과 정보 이론 57
3.1 확률의 필요성 58
3.2 확률변수 60
3.3 확률분포 61
3.4 주변확률 63
3.5 조건부 확률 64
3.6 조건부 확률의 연쇄법칙 64
3.7 독립과 조건부 독립 65
3.8 기댓값, 분산, 공분산 65
3.9 흔히 쓰이는 확률분포들 67
3.10 흔히 쓰이는 함수들의 유용한 성질들 74
3.11 베이즈 법칙 76
3.12 연속 변수의 특별한 세부 사항 76
3.13 정보 이론 79
3.14 구조적 확률 모형 83
4장 수치 계산 87
4.1 넘침과 아래넘침 87
4.2 나쁜 조건화 89
4.3 기울기 벡터 기반 최적화 90
4.4 제약 있는 최적화 100
4.5 예제: 선형 최소제곱 문제 104
5장 기계 학습의 기초 107
5.1 학습 알고리즘 108
5.2 수용력, 과대적합, 과소적합 121
5.3 초매개변수와 검증 집합 133
5.4 추정량, 편향, 분산 135
5.5 최대가능도 추정 145
5.6 베이즈 통계학 149
5.7 지도 학습 알고리즘
심층 학습을 위한 완벽한 참고서이자 바이블!
기계 학습의 한 형태인 심층 학습을 이용하면 컴퓨터가 개념들의 계통구조를 통해서 세계를 경험하고 이해하게 만들 수 있다. 심층 학습에서는 컴퓨터가 경험에서 지식을 수집하므로, 컴퓨터에 필요한 모든 지식을 사람(컴퓨터 운영자이 일일이 지정할 필요가 없다. 그리고 개념들의 계통구조 덕분에 컴퓨터는 간단한 개념들을 조합해서 좀 더 복잡한 개념을 배우게 된다. 그러한 계통구조의 그래프는 다수의 층으로 이루어진 ‘심층’ 구조를 가질 수 있다. 이 책은 심층 학습의 다양한 주제를 소개한다.
독자가 이 책을 읽는 데 필요한 수학적, 개념적 토대를 마련할 수 있도록, 이 책은 우선 심층 학습과 관련된 선형대수, 확률론, 정보 이론, 수치 계산, 기계 학습의 여러 주요 개념을 소개한다. 그런 다음에는 심층 순방향 신경망, 정칙화, 최적화 알고리즘, 합성곱 신경망, 순차열 모형화 등등 업계 실무자들이 사용하는 여러 심층 학습 기법들을 설명하고, 현실적인 심층 학습 실천 방법론도 소개한다. 또한 자연어 처리, 음성 인식, 컴퓨터 시각, 온라인 추천 시스템, 생물정보학, 비디오 게임을 위해 심층 학습을 응용하는 방법들도 개괄한다. 마지막으로는 연구의 관점에서 심층 학습을 살펴보는데, 이를테면 선형 인자 모형, 자동부호기, 표현 학습, 구조적 확률 모형, 몬테카를로 방법 같은 이론 연구 주제들을 소개한다.
《심층 학습》은 업계 또는 학계에서 연구자로서의 경력을 준비하는 학부생이나 대학원생은 물론이고 자신의 제품이나 플랫폼에서 심층 학습을 사용하고자 하는 소프트웨어 기술자들을 위한 책이다. 독자와 강사에게 도움이 될 보충 자료는 부록 웹사이트에 올려 두었다.