1부 ― 소개
1장 표기법과 데이터
1.1 표기법
1.2 데이터셋
2장 개요
2.1 이 책의 맥락
2.2 포트폴리오 구축: 작업의 흐름
2.3 머신러닝은 요술봉이 아니다
3장 팩터 투자와 자산 가격 결정 이상 현상
3.1 개요
3.2 이상 현상 탐지
3.2.1 도전
3.2.2 단순 포트폴리오 정렬
3.2.3 팩터들
3.2.4 파마-맥베스 회귀
3.2.5 팩터 경쟁
3.2.6 고급 기법들
3.3 팩터 혹은 특성
3.4 핫한 주제들: 모멘텀, 타이밍, ESG
3.4.1 팩터 모멘텀
3.4.2 팩터 타이밍
3.4.3 그린 팩터
3.5 머신러닝과의 연결 고리
3.5.1 최근 발표된 참고 문헌 리스트
3.5.2 자산 가격 결정 모형과의 명백한 연결
3.6 코딩 예제
4장 데이터 전처리
4.1 너의 데이터를 알라
4.2 결측 데이터
4.3 이상치 탐지
4.4 특성 공학
4.4.1 특성 선택
4.4.2 예측 인자 스케일링
4.5 레이블링
4.5.1 단순 레이블
4.5.2 범주형 레이블
4.5.3 트리플 배리어 기법
4.5.4 샘플 필터링
4.5.5 수익률의 시간적 구간
4.6 지속성 다루기
4.7 확장
4.7.1 특성 변환
4.7.2 거시경제 변수
4.7.3 능동 학습
4.8 추가 코드 및 결과
4.8.1 리스케일링 효과: 시각적 표현
4.8.2 리스케일링 효과: 토이 예시
4.9 코딩 예제
2부 ― 지도 학습 알고리듬
5장 페널티 회귀와 최소 분산 포트폴리오를 위한 희소 헤징
5.1 페널티 회귀
5.1.1 단순 회귀
5.1.2 페널티의 형태
5.1.3 실제 예시
5.2 최소 분산 포트폴리오를 위한 희소 헤징
5.2.1 표현 및 전개
5.2.2 예시
5.3 예측 회귀
5.3.1 참고 문헌 리뷰 및 원칙
5.3.2 코드 및 결과
5.4 코딩 예제
6장 트리 기반 기법
6.1 단순 트리
6.1.1 원칙
6.1.2 분류에 대한 추가적인 디테일
6
이 책의 대상 독자
이 책은 두 가지 부류의 독자를 대상으로 한다. 첫째, 투자 및 자산 운용을 목표로 계량 금융을 공부하고자 하는 대학원생이다. 두 번째 대상은 머신러닝에 기반한 자산배분 방법으로 피벗(pivot하거나 단순히 이러한 새로운 도구에 관심이 있으면서 자신의 역량을 업그레이드하고자 하는 자산 운용 업계의 전문가다. 이 책은 최근 자산 가격 결정 문제와 자산 운용에 적용 가능한 머신러닝 알고리듬에 대한 광범위한 참고 자료가 필요한 학자나 연구자에게도 도움을 줄 수 있다. 대부분 일반적인 방법을 다루고 있지만 인과 그래프(14장, 베이지안 가법성 트리(9장, 하이브리드 오토인코더(7장와 같은 좀 더 이색적인 모델을 구현하는 방법도 보여준다.
이 책은 대수학(algebra(행렬 조작, 해석학(analysis(함수 미분, 그래디언트, 최적화(optimization(1계 및 2계 조건, 이중 형태, 통계학(statistics(분포, 적률, 검정, 최우도 같은 간단한 추정 방법에 대한 기본 지식이 있는 독자를 대상으로 한다. 최소한의 금융 도메인 지식도 필요하다. 주식과 회계 수치(예를 들어, 장부가와 같은 간단한 개념은 따로 정의하지 않는다.
이 책의 구성
1부에서는 준비 자료를 수집하고 표기법과 데이터 표현(1장으로 시작해 개요(2장를 소개한다. 3장에서는 팩터 투자의 (이론적이고 실증적인 경제학적 기초를 개괄하고 관련된 최근 문헌을 간략히 요약한다. 4장에서는 데이터 준비에 대해 다룬다. 기본적인 팁을 빠르게 리뷰하고 몇 가지 주요 이슈에 대해 경고한다.
2부에서는 지도 학습의 예측 알고리듬을 다룬다. 이러한 알고리듬은 수익률, 변동성, 샤프Sharpe 비율 등 금융 수치를 예측하는 데 사용되는 가장 일반적인 도구다. 페널티가 적용된 회귀(5장부터 트리 기법(6장, 신경망(7장, 서포트 벡터 머신(8장, 베이지안 접근법(9장까지를 아우르는 다양한 알고리듬을 다룬다.
3부에서는 이러한 도구와 금융 응용 분야 간의 간극을 해소한다.