DevOps Troubleshooting Practice
AI와 함께 푸는
인프라 트러블슈팅 챌린지
무거운 서버 구성 없이, 실무 수준의 인프라 장애 시나리오를 마주하고
해결 능력을 키워보세요.
문제 목록
CI/CD
전체 보기 (13) →CI/CD
#001
GitHub Actions 빌드 실패 로그 분석
github-actionsnpmdependency
CI/CD
#002
GitHub Actions 작업 무한 대기로 인한 러너 점유
github-actionstimeoutrunner
CI/CD
#003
이전 배포 이미지를 식별할 수 없는 원인 분석
dockerimage-tagcommit-sha
CI/CD
#004
일시적 오류로 인한 배포 파이프라인 반복 실패
github-actionsretrytransient-error
CI/CD
#005
배포 검증 전에 프로덕션 반영이 진행되는 원인 분석
github-actionsenvironmentapproval
CI/CD
#006
병렬 실행되는 CI 작업 간 의존성 누락
github-actionsneedsjob-dependency
K8s
전체 보기 (33) →K8s
#001
Pod CrashLoopBackOff 상태 디버깅
podcrashloopbackofflogs
K8s
#002
Pod가 ImagePullBackOff 상태에 빠졌을 때 원인 찾기
podimagepullbackoffdocker
K8s
#003
Namespace가 존재하지 않아 배포 실패
namespacedeploymentkubectl
K8s
#004
Job이 계속 실패하며 완료되지 않는 문제
jobbackofflimitcommand
K8s
#005
ConfigMap 설정을 Pod에 마운트하지 못하는 원인 분석
configmapvolumemount
K8s
#006
Pod가 Running이지만 트래픽을 받지 못하는 문제
readiness-probeserviceendpoint
Linux
전체 보기 (31) →Monitoring
Monitoring
#001
Prometheus 타겟 수집 실패 디버깅
prometheustargetscrape
Monitoring
#002
Alertmanager 알림이 Slack에 전달되지 않는 문제
alertmanagerslackalert
Monitoring
#003
Grafana 대시보드 No Data 해결하기
grafanaprometheusdatasource
Monitoring
#004
Node Exporter 디스크 메트릭 누락 원인 분석
node-exporterprometheusdisk
Monitoring
#005
Prometheus 메모리 부족으로 인한 반복 재시작 해결
prometheusoomtsdb
Network
전체 보기 (11) →Network
#001
컨테이너 간 통신 불가 원인 분석
dockeriptablesnetwork
Network
#002
고속 HTTP 요청으로 인한 포트 고갈 장애
port-exhaustionsysctltcp
Network
#003
iptables를 이용한 포트 포워딩 설정
iptablesport-forwardingredirect
Network
#004
tcpdump를 이용한 HTTP 트래픽 캡처 및 분석
tcpdumppcaphttp
Network
#005
네트워크 구간별 패킷 손실 원인 진단
pingpacket-lossgateway
Network
#006
비인가 서비스가 점유한 고포트 정리
ssportsecurity