내 잡다한 노트
트러블 슈팅을 잘 하기 위한 단계 본문
1. 문제 정의
문제가 무엇인지, 그리고 어떤 영향을 미치는지 명확히 정의한다.
무엇이 작동하지 않는지(증상), 언제부터 발생했는지(타이밍), 어디에서 발생했는지(위치), 어떤 서비스와 사용자가
영향을 받았는지, 최근 어떤 변경사항이 있었는지를 확인하며 문제를 정확하게 파악한다.
모든 트러블 슈팅 과정에서 이 부분은 공통적으로 포함되고 중요한 부분인 것 같다.
찾아보니 이런 것을 5 Whys 기법이라고 한다.
증상, 타이밍, 위치, 범위, 변경사항 등을 체크해가며 왜 이런 문제가 발생했는지를 반복적으로 질문하며 근본적인 원인을 찾는다고 한다.
또한, 문제가 재현 가능하다면 동일한 조건에서 다시 발생시키고, 어떤 요소가 문제를 유발하는지 확인한다.
문제와 관련이 있는 fact와 관련이 없는 fact를 분리하고 정리를 한다면 더욱 도움이 될 것 같다.
2. 문제 범위 좁히기
문제를 세분화하여 원인을 좁혀나간다.
네트워크에 문제가 있다면 병목 현상을 찾기 위해 라우터, 스위치, 서버 를 차례대로 조사해가며 좁혀나간다.
이때, 모니터링 도구나 traceroute 같은 tool들을 사용할 수 있겠다.
3. 효과적인 커뮤니케이션을 하기
일을 하다보며 느끼는 거지만 나 혼자 할 수 있는 일은 없는 것 같다.
문제를 팀원들과 명확히 공유하여 팀원들과 협동하면 더욱 빠르게 문제를 해결할 수 있다.
예시 :
- 문제가 발생한 시스템과 범위
- 예상되는 영향 ( 중요성, 우선순위 )
- 현재 진행 상황과 다음 단계
또한 엔지니어라면 추측 대신 데이터를 기반으로 이야기를 해야한다.
이 부분도 예전에 피드백 받았었는데,,,, 어느 샌가 잊고 있었던 것 같다. 습관이 되야 할 필요가 있다.
'일을 잘하기 위한 고민' 카테고리의 다른 글
작업에 대한 리뷰 절차 (0) | 2024.12.04 |
---|