나의 잡다한 노트 및 메모
Supervisors 란? 본문
Druid에서 "Supervisors"란?
"Supervisors" 탭은 실시간 데이터 스트리밍(Streaming Ingestion)을 관리하는 역할을 합니다.
즉, Kafka 또는 Kinesis와 같은 실시간 데이터 소스에서 데이터를 지속적으로 수집하는 작업을 관리하는 기능입니다.
Supervisors의 역할
Druid에서 Kafka / Kinesis 같은 스트리밍 데이터를 지속적으로 가져오기 위해 Supervisor를 사용합니다.
데이터 스트림을 모니터링하고 자동으로 Task를 실행 및 관리
새로운 데이터가 들어오면 실시간으로 적재
Task 실패 시 자동 복구 (Fault Tolerance 지원)
데이터 적재 속도를 조절하며 리소스 최적화
실시간 데이터 처리를 위한 필수 기능
Supervisors의 작동 방식
Supervisors는 **실시간 인제스천(Streaming Ingestion)**을 위해 Indexing Task를 생성하고 관리합니다.
Kafka/Kinesis에서 새로운 데이터 스트림 감지
Druid에서 Indexing Task를 자동으로 생성
데이터를 수집하고 Datasources에 저장
Task가 종료되면 새로운 Task를 자동으로 생성하여 연속적으로 실행
오류 발생 시 Supervisor가 자동으로 복구
즉, Supervisors는 지속적으로 데이터 수집을 유지하는 역할을 합니다.
3. Supervisors에서 확인할 수 있는 정보
항목설명
ID | Supervisor의 고유 ID |
Datasource | 이 Supervisor가 데이터를 수집하는 대상 Datasource |
State | Supervisor의 현재 상태 (RUNNING, FAILED 등) |
Type | Kafka 또는 Kinesis와 같은 스트리밍 소스 유형 |
Active Tasks | 현재 실행 중인 Indexing Task 수 |
Pending Tasks | 대기 중인 Task 수 |
Recent Errors | 최근 오류 로그 (문제 발생 시 확인 가능) |
'데이터엔지니어 > Druid' 카테고리의 다른 글
Datasources 단계 (0) | 2025.03.02 |
---|---|
Druid에서 Tune parameters 단계 (0) | 2025.03.02 |
Druid에서 Filter 단계 (0) | 2025.03.02 |
Druid에서 Parser의 역할 (0) | 2025.03.02 |
Druid 아키텍처 중 주요 컴포넌트의 역할 (0) | 2025.03.01 |