장애

장애 대응 – 모니터링 서비스의 구성

금오사이 운영팀에는 적지 않은 운영진이 함께하고 있지만 그렇다고 매일 24시간을 서버만 바라보고 있을 수는 없는 노릇입니다. (게다가 학생이구요.. 강의는 들어야하지 않겠습니까.. 밥도 먹어야하고) 그래서 금오사이는 언제든지 서비스 장애 알림을 받아 볼 수 있는 다양한 경로를 구축 해 놓았는데 그에대한 이야기를 나누고자 합니다. 먼저 현재의 알림 시스템을 구축하기 전에 어떠한 경험을 해왔는지에 대해 이야기를 해보겠습니다. 관제 솔루션 경험 사례 Mumin 리소스 모니터링 초기에는 munin 이라는 리소스 모니터링 도구를 사용했었습니다. 투박한 디자인에… Read More »장애 대응 – 모니터링 서비스의 구성