나의 잡다한 노트 및 메모

Supervisors 란? 본문

데이터엔지니어/Druid

Supervisors 란?

peanutwalnut 2025. 3. 2. 23:37

Druid에서 "Supervisors"란?

"Supervisors" 탭은 실시간 데이터 스트리밍(Streaming Ingestion)을 관리하는 역할을 합니다.

즉, Kafka 또는 Kinesis와 같은 실시간 데이터 소스에서 데이터를 지속적으로 수집하는 작업을 관리하는 기능입니다.

 

Supervisors의 역할

Druid에서 Kafka / Kinesis 같은 스트리밍 데이터를 지속적으로 가져오기 위해 Supervisor를 사용합니다.

데이터 스트림을 모니터링하고 자동으로 Task를 실행 및 관리
새로운 데이터가 들어오면 실시간으로 적재
Task 실패 시 자동 복구 (Fault Tolerance 지원)
데이터 적재 속도를 조절하며 리소스 최적화
실시간 데이터 처리를 위한 필수 기능

 

 

Supervisors의 작동 방식

Supervisors는 **실시간 인제스천(Streaming Ingestion)**을 위해 Indexing Task를 생성하고 관리합니다.

Kafka/Kinesis에서 새로운 데이터 스트림 감지
Druid에서 Indexing Task를 자동으로 생성
데이터를 수집하고 Datasources에 저장
Task가 종료되면 새로운 Task를 자동으로 생성하여 연속적으로 실행
오류 발생 시 Supervisor가 자동으로 복구

즉, Supervisors는 지속적으로 데이터 수집을 유지하는 역할을 합니다.

 

 

3. Supervisors에서 확인할 수 있는 정보

항목설명

ID Supervisor의 고유 ID
Datasource 이 Supervisor가 데이터를 수집하는 대상 Datasource
State Supervisor의 현재 상태 (RUNNING, FAILED 등)
Type Kafka 또는 Kinesis와 같은 스트리밍 소스 유형
Active Tasks 현재 실행 중인 Indexing Task 수
Pending Tasks 대기 중인 Task 수
Recent Errors 최근 오류 로그 (문제 발생 시 확인 가능)

 

 

 

'데이터엔지니어 > Druid' 카테고리의 다른 글

Datasources 단계  (0) 2025.03.02
Druid에서 Tune parameters 단계  (0) 2025.03.02
Druid에서 Filter 단계  (0) 2025.03.02
Druid에서 Parser의 역할  (0) 2025.03.02
Druid 아키텍처 중 주요 컴포넌트의 역할  (0) 2025.03.01