질문&답변
클라우드/리눅스에 관한 질문과 답변을 주고 받는 곳입니다.
리눅스 분류

시스템 다운 관련 질문사항

작성자 정보

  • 전양백 작성
  • 작성일

컨텐츠 정보

본문

고수님들..

제가 관리하는 서버가 있습니다.

os버전은 Linux version 2.4.18-3smp / Red Hat Linux release 7.3 을 사용하고 있으며

vendor_id       : GenuineIntel
cpu family      : 15
model           : 2
model name      : Intel(R) Xeon(TM) CPU 2.80GHz
stepping        : 5
cpu MHz         : 2791.078
cache size      : 512 KB

위의 것과 같은  cpu가 4개 있는 서버입니다.

서버 사용목적은 데이터 전송이 목적으로 java 및 톰캣, 오라클, psftp, 아파치를 주로 사용하고 있습니다.

가끔씩 서버가 다운되어서

rrdtool을 사용하여 rrdbelt로 확인하고 있는데 전혀 문제 없다가

어느 순간 시스템이 다운되고 있습니다. (핑은 나가는데 나머지 포트들이 다 막히더라고요)

sar를 확인해보니

          CPU     %user     %nice   %system     %idle
               all      5.21      0.00      0.95     93.85
        all      0.77      0.00      0.41     98.82
               all      5.09      0.00      0.87     94.04
           all      0.85      0.00      0.44     98.71
               all      5.22      0.00      0.89     93.89
           all      0.87      0.00      0.44     98.69
               all      5.20      0.00      0.92     93.88
           all    120.12    120.51    120.21      0.00
               all      0.73      0.00      0.14     99.13
           all      5.13      0.00      0.59     94.28
               all      0.76      0.00      0.17     99.07
           all      5.12      0.00      0.61     94.27
               all      0.73      0.00      0.16     99.11
Average:          all    120.04    120.43    120.13      0.00

으로 cpu부하가 순간 120이상이 되어버린거 같네요..

/var/log  밑에 있는 모든 로그 와 아파치 로그를 보아도 아무런 기록도 없고

혹시 해킹됐나 해서

chkrootkit으로 확인해도 아무 흔적도 없습니다.

고수님들...어떤 걸 더 확인해야하는지..아님 짐작가시는 부분이라도 있습니다.

답변 부탁드립니다...ㅜㅜ (서버가 한달에 한 두번꼴로 이렇게 가버리네요..음..)

관련자료

댓글 3

전양백님의 댓글

  • 전양백
  • 작성일
답변감사합니다.
근데 이 서버가 IDC에 있는 거라....그리고 서비스가 돌아가는 것이라서 바로 리부팅을 하고 그러고 있거든요... 다른 방법은 없을 까요?? 아님...쉘스크립트를 짜야되나요?..음...

배준성님의 댓글

  • 배준성
  • 작성일
서비스 중이시라면 모니터링밖에 없을 겁니다. 우선 sar가 설치 되어 있다고 하시면
점유율이 언제쯤 높아지는지 알수 있을 겁니다. 그것이 규칙적인지 아니면 불규칙인지 그리고 그때 어떤 프로세서가 있는지 봐야 할 것 같습니다. 그리고 저렇게 하는 것보다는 서버의 부하를 줄이기위해서 DB서버/AP서버 따로 놓는게 좋을 듯 싶습니다. 정확한 데이터가 없으니 머라 말씀드리기가 어렵네요..그리고 회사에서 메신져를 다 막아놔서 메신져도 못하니..ㅠ.ㅠ 서버는 리부팅이 최소한이여 하는데 리부팅을 하기전에 머가 문제인지 봐야하는데 ..머 쉘로 짜도 되기는한데..검사해보세요 한달에2번정도라하면 규칙적일텐데..에고 메신져도 안되고 이렇게 쓰니 저도 답답하네요

공지사항


뉴스광장


  • 현재 회원수 :  60,150 명
  • 현재 강좌수 :  36,412 개
  • 현재 접속자 :  258 명