1부 l 카프카 커넥트란
1장 카프카 커넥트 입문
카프카 커넥트 기능
__플러그형 아키텍처
__확장성과 신뢰성
__선언적 파이프라인 정의
__카프카 커넥트도 아파치 카프카의 일부
사용 사례
__데이터베이스 변경사항 캡처
__카프카 클러스터 미러링
__데이터 레이크 구축
__로그 집계
__레거시 시스템 현대화
카프카 커넥트의 대안
정리
2장 아파치 카프카란
분산 이벤트 스트리밍 플랫폼
__오픈소스
__분산 시스템
__이벤트 스트리밍
__플랫폼
카프카 주요 개념
__발행-구독
__브로커와 레코드
__토픽과 파티션
__리플리케이션
__보관 주기와 컴팩션
__크래프트와 주키퍼
카프카와 상호작용하기
__프로듀서
__컨슈머
__카프카 스트림즈
카프카 시작하기
__카프카 실행
__레코드 주고받기
__카프카 스트림즈 애플리케이션 실행
정리
2부 l 카프카 커넥트로 데이터 파이프라인 구축하기
3장 카프카 커넥트 데이터 파이프라인의 구성요소
카프카 커넥트 런타임
__카프카 커넥트 실행하기
__카프카 커넥트 REST API
__플러그인 설치하기
__배포 모드
소스 커넥터와 싱크 커넥터
__커넥터와 태스크
__커넥터 구성하기
__커넥터 실행하기
컨버터
__데이터 형식과 스키마
__컨버터 구성하기
__컨버터 사용하기
트랜스포메이션과 프레디케이트
__트랜스포메이션 사용 사례
__프레디케이트
__트랜스포메이션과 프레디케이트 구성하기
__트랜스포메이션과 프레디케이트 사용하기
정리
4장 효과적인 데이터 파이프라인 설계하기
커넥터 선택하기
__파이프라인 방향
__라이선싱과 지원
__커넥터의 기능
데이터 모델 정의하기
__데이터 변환
__시스템 간 데이터 매핑하기
데이터 포매팅
__데이터 포맷
__스키마
카프카 커넥트 내부 살펴보기
__내부 토픽
__그룹 멤버십
__리밸런스 프로토콜
카프카 커넥트에서 장애 상황 다루기
__워커 장애
__커넥터/
| 이 책의 독자 대상 |
카프카 커넥트 환경과 상호작용하는 데이터 엔지니어, 사이트 신뢰성 엔지니어, 개발자
| 이 책의 구성 |
1부는 카프카와 카프카 커넥트 전반에 대한 소개 내용을 다루며, 주로 카프카 커넥트를 처음 접하거나 막 시작하는 엔지니어를 대상으로 한다.
2부는 카프카 커넥트를 사용해 데이터 파이프라인을 구축하는 방법을 설명하며, 특히 데이터 엔지니어와 관련이 있다. 3장과 4장에서는 핵심 카프카 커넥트 구성요소를 논의하고, 이들을 결합해 견고하고 효율적인 데이터 파이프라인을 설계하는 방법을 설명한다. 2부의 나머지 장에서는 가장 인기 있는 커넥터들을 자세히 살펴본다. 5장에서는 커뮤니티에서 제공하는 세 가지 커넥터인 컨플루언트 S3(Confluent S3 싱크, 컨플루언트 JDBC(Confluent JDBC 소스, 데비지움(Debezium MySQL 소스를 다룬다. 6장에서는 카프카의 미러링 도구인 미러메이커(MirrorMaker가 어떻게 작동하는지 자세히 설명한다. 여기에는 소스, 체크포인트, 하트비트 커넥터의 기능과 구성에 대한 내용이 포함된다.
3부는 카프카 커넥트 운영 측면에 초점을 맞추며, 사이트 신뢰성 엔지니어를 대상으로 한다. 7장에서는 상용 환경에서 카프카 커넥트 클러스터를 배포하고 운영하는 방법을 보여준다. 8장에서는 카프카 커넥트가 제공하는 모든 구성 설정을 다루고, 이를 조정하는 방법과 시점을 결정하는 데 도움이 되는 배경과 맥락을 제공한다. 9장은 로그와 지표를 사용해 카프카 커넥트 클러스터를 지속적으로 모니터링하는 방법을 설명한다. 마지막으로 10장에서는 쿠버네티스(Kubernetes에서 카프카 커넥트 클러스터를 실행하기 위해 필요한 핵심 고려사항을 논의한다. 여기에는 쿠버네티스에 대한 전반적인 소개와 이러한 유형의 인프라에 카프카 커넥트를 배포하는 데 사용할 수 있는 옵션에 대한 설명이 포함된다.
4부는 카프카 커넥트를 위한 커스텀 커넥터와 플러그인을 구현하는 방법을 설명하며, API에 대