kubernetes troubleshooting에 대한 visual flowchart가 그려져 있는 재미있는 글을 발견해서 그대로 옮겨와 본다. 한번에 보면 큼직해서 다소 혼란이 올 수 있지만 (...) 언제나 본질은 쉽다. 가장 쉽고 커다란 부분부터 점검하는 것이다.
문제 상황은 kubenetes(이하 k8s) deployment에 어떠한 이유로 서비스를 접근할 수 없는 경우에 발생할 것이다. 상당히 고도화된 플랫폼이니만큼 문제가 생기면 어디부터 점검해야 할지 패닉에 빠질 수 있지만... 언제나 그렇듯이 쉬운 부분부터 보면 된다.
글쓴이는 크게 아래의 기준으로 확인하기를 원하는 것으로 보인다.
- PENDING된 Pod가 있는가? 그렇다면 Quota나 node limit 등을 확인해 봐야.
- Pod가 살아 있는가? 살아 있다면 문제를 k8s가 어플리케이션으로 좁힘.
문제가 베이스 이미지, 더 나아가서 k8s 자체에서 발생한 거면 찾기가 꽤 골치가 아파질 것이다 (...) - PORT-FORWARDING을 통해 Pod에 접근할 수 있는가? 안 된다면 역시 문제는 k8s 어플리케이션으로.
- 접근할 수 있다면, 적어도 Pod는 정상이다!
여기에서는 k8s의 endpoint, ingress, 필요하다면 외부 라우팅 및 DNS 등 확인해 볼 필요가 있다.
참고
'개발 > Engineering' 카테고리의 다른 글
분산 시스템에서 메시지를 중복으로 받을 수밖에 없는 이유 (0) | 2022.05.28 |
---|---|
Design patterns at a glance (0) | 2022.05.27 |
Unique ID Generator의 설계 (0) | 2022.05.06 |
컨테이너 기반 가상화 기술, 그리고 AWS Lambda (0) | 2022.05.06 |
Borg로 알아보는 클라우드 환경에서의 컨테이너 매니징 (0) | 2022.05.06 |