데이터엔지니어/Druid
Supervisors 란?
peanutwalnut
2025. 3. 2. 23:37
Druid에서 "Supervisors"란?
"Supervisors" 탭은 실시간 데이터 스트리밍(Streaming Ingestion)을 관리하는 역할을 합니다.
즉, Kafka 또는 Kinesis와 같은 실시간 데이터 소스에서 데이터를 지속적으로 수집하는 작업을 관리하는 기능입니다.
Supervisors의 역할
Druid에서 Kafka / Kinesis 같은 스트리밍 데이터를 지속적으로 가져오기 위해 Supervisor를 사용합니다.
데이터 스트림을 모니터링하고 자동으로 Task를 실행 및 관리
새로운 데이터가 들어오면 실시간으로 적재
Task 실패 시 자동 복구 (Fault Tolerance 지원)
데이터 적재 속도를 조절하며 리소스 최적화
실시간 데이터 처리를 위한 필수 기능
Supervisors의 작동 방식
Supervisors는 **실시간 인제스천(Streaming Ingestion)**을 위해 Indexing Task를 생성하고 관리합니다.
Kafka/Kinesis에서 새로운 데이터 스트림 감지
Druid에서 Indexing Task를 자동으로 생성
데이터를 수집하고 Datasources에 저장
Task가 종료되면 새로운 Task를 자동으로 생성하여 연속적으로 실행
오류 발생 시 Supervisor가 자동으로 복구
즉, Supervisors는 지속적으로 데이터 수집을 유지하는 역할을 합니다.
3. Supervisors에서 확인할 수 있는 정보
항목설명
ID | Supervisor의 고유 ID |
Datasource | 이 Supervisor가 데이터를 수집하는 대상 Datasource |
State | Supervisor의 현재 상태 (RUNNING, FAILED 등) |
Type | Kafka 또는 Kinesis와 같은 스트리밍 소스 유형 |
Active Tasks | 현재 실행 중인 Indexing Task 수 |
Pending Tasks | 대기 중인 Task 수 |
Recent Errors | 최근 오류 로그 (문제 발생 시 확인 가능) |