[Kafka] 9장. 데이터 파이프라인 구축하기

Kafka 기초 다지기

출처 : 카프카 핵심 가이드 (O’Reilly)

목차

  1. 카프카 훑어보기
  2. 범용 메시지 큐와 비교하기
  3. 카프카 프로듀서 : 카프카에 메시지 쓰기
  4. 카프카 컨슈머 : 중요 개념
  5. 카프카 컨슈머 : 카프카에서 데이터 읽기
  6. 스키마 레지스트리
  7. 카프카 내부 메커니즘
  8. 신뢰성 있는 데이터 전달
  9. 데이터 파이프라인 구축하기


데이터 파이프라인 구축하기

1. 데이터 파이프라인 구축 시 고려사항

1) 데이터 파이프라인 (data pipeline) 이란?

2) 적시성

3) 신뢰성

4) 처리량

5) 데이터 형식

6) 변환

7) 보안 및 장애 처리

→ Kafka는 암호화된 데이터 전송을 허용하고,

SASL (Simple Authentication and Security Layer) 인증을 지원한다!

9) 결합과 민첩성


2. 카프카 커넥트와 프로듀서 컨슈머

1) 둘 중 하나를 선택해야 할 때


3. 카프카 커넥트 실행하기

1) 실행 방법

2) 커넥트 작업 프로세스의 핵심 속성


4. 카프카 커넥트의 구성 요소

1) 커넥터

2) 태스크

3) 작업 프로세스

4) 컨버터

5) 오프셋 관리


5. 카프카 커넥트의 대안

1) 다른 데이터스토어의 프레임워크

2) GUI 기반의 ETL 도구들

3) 스트림 프로세싱 프레임워크