1系統(tǒng)信息
系統(tǒng)全稱 | ××系統(tǒng) |
甲方單位 | ×× |
乙方單位 | ×× |
系統(tǒng)管理部門 | 軟件開發(fā)部 |
系統(tǒng)運行環(huán)境 | 系統(tǒng)訪問地址:http://10.128.13.252:7001/jmsc/ 應用服務器IP:10.128.13.252 應用服務器操作系統(tǒng):windows 2003 服務中間件類型:weblogic 8.1.3 數(shù)據(jù)庫服務器IP:10.128.13.252 數(shù)據(jù)庫服務器操作系統(tǒng):windows 2003 數(shù)據(jù)庫類型:oracle9.2 數(shù)據(jù)庫名稱:JMSC 其它注意事項:(短信服務、FTP服務、自動備份等情況說明) ·252服務器是應用服務、數(shù)據(jù)庫兩個放在一起的; ·應用服務啟動后還要啟動短信平臺服務; ·252服務器上每天對JMSC進行備份(保留7天文件); ·250服務器上每天對JMSC進行異機備份(保留1天文件); ? |
2系統(tǒng)負責人
? | 所屬部門 | 姓名 | 聯(lián)系方式 |
直接負責人 | 軟件開發(fā)部 | ×× | 辦公座機:×× 手機:×× |
間接負責人 | 軟件開發(fā)部 | ×× | 辦公座機:×× 手機:×× |
部門負責人 | 軟件開發(fā)部 | ×× | 辦公座機:×× 手機:×× |
×× | 辦公座機:×× 手機:×× |
?
3名詞解釋
3.1系統(tǒng)運行環(huán)境:包括系統(tǒng)應用服務、系統(tǒng)服務中間件、數(shù)據(jù)庫系統(tǒng)、服務器硬件資源、網(wǎng)絡環(huán)境等。
3.2系統(tǒng)故障:指系統(tǒng)運行環(huán)境發(fā)生異常或遭受非法入侵,導致系統(tǒng)不能正常使用或數(shù)據(jù)丟失等情況。
3.3移動存儲設備:指移動硬盤、U盤等可攜帶的存儲設備。
3.4網(wǎng)絡管理部門:指應用系統(tǒng)所在單位內(nèi)專門負責網(wǎng)絡環(huán)境及硬件資源管理工作的部門。
3.5服務器管理部門:指應用系統(tǒng)所在單位內(nèi)專門負責管理和維護服務器及相關(guān)附屬硬件資源的部門。
3.6異機備份:指在另一臺電腦中通過數(shù)據(jù)庫鏈接對數(shù)據(jù)庫服務器中的數(shù)據(jù)庫進行備份,備份文件留在該電腦中,以防止數(shù)據(jù)庫服務器發(fā)生損壞導致數(shù)據(jù)丟失。
4系統(tǒng)故障分類
故障分類 | 故障描述 |
應用服務故障 | 應用服務中間件(Weblogic、Tomcat等)的應用服務發(fā)生故障,導致應用服務自動關(guān)閉、系統(tǒng)登錄頁面無法訪問、程序部署文件異常、服務日志內(nèi)容異常時,統(tǒng)稱為“應用服務故障”。 |
數(shù)據(jù)庫故障 | 數(shù)據(jù)庫管理系統(tǒng)軟件(Oracle、SQL Server)或數(shù)據(jù)庫本身發(fā)生故障,導致數(shù)據(jù)庫中業(yè)務數(shù)據(jù)無法訪問、數(shù)據(jù)庫日志異常等情況發(fā)生,統(tǒng)稱為“數(shù)據(jù)庫故障”。 |
網(wǎng)絡故障 | 本地局域網(wǎng)絡發(fā)生故障導致局域網(wǎng)不通、系統(tǒng)無法訪問、系統(tǒng)訪問報錯等情況,統(tǒng)稱為“網(wǎng)絡故障”。 |
服務器硬件故障 | 應用服務器、數(shù)據(jù)庫服務器發(fā)生硬件故障,導致服務器關(guān)閉或損壞、應用服務或數(shù)據(jù)庫無法訪問等情況發(fā)生,統(tǒng)稱為“服務器硬件故障”。 |
非法入侵系統(tǒng)或服務器 | 應用服務遭到未授權(quán)入侵、應用服務器或數(shù)據(jù)庫服務器遭到未授權(quán)訪問,導致應用服務無法訪問、數(shù)據(jù)庫無法訪問、數(shù)據(jù)丟失或泄密等情況,統(tǒng)稱為“非法入侵系統(tǒng)或服務器”。 |
5系統(tǒng)預防措施
5.1應用程序備份
直接負責人負責應用系統(tǒng)的程序備份工作,要求在部門SVN配置庫中保持系統(tǒng)程序最新版本。在進行程序修改和更新過程中必須保證服務器端和SVN配置庫中的程序版本一致。
間接負責人有責任及權(quán)利監(jiān)督檢查直接負責人的應用系統(tǒng)程序備份工作。
5.2數(shù)據(jù)庫備份
直接負責人負責設置數(shù)據(jù)庫自動備份策略,并要求每天對備份文件進行檢查。備份基本原則:一是要求在數(shù)據(jù)庫服務器和異機同時備份數(shù)據(jù)庫;二是要求數(shù)據(jù)庫進行每天備份;三是要求定期刪除過期備份文件,以保證硬盤空間足夠產(chǎn)生新備份文件。
間接負責人有責任及權(quán)利監(jiān)督檢查直接負責人的數(shù)據(jù)庫備份工作。
5.3服務器操作系統(tǒng)賬號、密碼管理
直接負責人負責服務器端操作系統(tǒng)登錄賬號、密碼的管理工作,要求賬號和密碼要具有一定復雜度(字母、數(shù)字、符號混合使用),并定期進行更改,賬號和密碼未經(jīng)上級領導授權(quán)不得隨意告訴他人使用。
間接負責人有責任及權(quán)利監(jiān)督檢查直接負責人的賬號、密碼管理工作。
5.4應用系統(tǒng)管理員賬號、密碼管理
直接負責人負責應用系統(tǒng)(包括權(quán)限平臺、工作流平臺等軟件)管理員登錄賬號、密碼的管理工作,要求賬號和密碼要具有一定復雜度(字母、數(shù)字、符號混合使用),并定期進行更改,賬號和密碼未經(jīng)上級領導授權(quán)不得隨意告訴他人使用。
間接負責人有責任及權(quán)利監(jiān)督檢查間接負責人的賬號、密碼管理工作。
6系統(tǒng)應急處理措施
6.1當系統(tǒng)發(fā)生故障時,系統(tǒng)直接負責人應立即通知部門經(jīng)理,并即刻前往故障現(xiàn)場,如因特殊情況無法及時趕到,應立即通知間接負責人代替前往。
6.2系統(tǒng)負責人到達故障現(xiàn)場后,應首先判斷故障的類型和嚴重性,根據(jù)結(jié)論決定是否需要其他相關(guān)人等(部門經(jīng)理、另一系統(tǒng)負責人、其他相關(guān)部門負責人等)也立刻趕往現(xiàn)場協(xié)助排障,如有需要則立即電話通知。
6.3在故障現(xiàn)場,系統(tǒng)負責人全權(quán)指揮系統(tǒng)的應急處理過程,根據(jù)故障類型安排相關(guān)人等的應急處理工作。
6.4當發(fā)生應用服務故障時,應按如下步驟依次嘗試排障:
6.4.1嘗試重新啟動應用服務,并檢查故障是否恢復;
6.4.2應用服務啟動后,檢查其所占CPU和內(nèi)存大小,排查是否所占資源異常;
6.4.3檢查應用服務相關(guān)日志文件,尋找故障發(fā)生原因;
6.4.4檢查操作系統(tǒng)相關(guān)日志文件,尋找故障發(fā)生原因,如有必要可重新啟動操作系統(tǒng);
6.4.5檢查數(shù)據(jù)庫中的系統(tǒng)登錄記錄表,排查是否有異常登錄發(fā)生;
6.4.6檢查應用程序部署文件,排查是否有文件異常上傳或改變;
6.4.7檢查應用服務控制臺,排查是否有異常文件被部署并發(fā)布;
6.5當發(fā)生數(shù)據(jù)庫故障時,應按如下步驟依次嘗試排障:
6.5.1不要重啟數(shù)據(jù)庫或數(shù)據(jù)庫應用服務器;
6.5.2先檢查數(shù)據(jù)庫最近一次備份文件是否存在,如存在則先拷貝至移動存儲設備中一份,嘗試手動備份當前數(shù)據(jù)庫數(shù)據(jù),并將備份文件拷貝至移動存儲設備中;
6.5.3如數(shù)據(jù)庫無法訪問,先登錄應用服務控制臺,排查數(shù)據(jù)庫鏈接是否異常;
6.5.4使用PLSQL Developer嘗試連接數(shù)據(jù)庫,排查數(shù)據(jù)庫是否運行正常;
6.5.5檢查數(shù)據(jù)庫相關(guān)日志文件,排查數(shù)據(jù)庫是否運行正常;
6.5.6檢查數(shù)據(jù)庫中系統(tǒng)登錄記錄表,排查是否有異常登錄發(fā)生;
6.5.7嘗試重啟數(shù)據(jù)庫或數(shù)據(jù)庫應用服務器,并檢查故障是否恢復;
6.5.8如有必要可重新安裝數(shù)據(jù)庫系統(tǒng),并利用備份文件將原有業(yè)務數(shù)據(jù)恢復最新版本;
6.6當發(fā)生網(wǎng)絡故障時,應按如下步驟依次嘗試排障:
6.6.1檢查服務器網(wǎng)卡、交換機等網(wǎng)絡設備,排查是否硬件損壞或松動;
6.6.2如確認是網(wǎng)絡故障,應立即聯(lián)系網(wǎng)絡管理部門到達現(xiàn)場進行排障;
6.6.3網(wǎng)絡排障后,應立即檢查應用服務和數(shù)據(jù)庫訪問是否正常,并檢查數(shù)據(jù)庫備份文件是否缺失,如有上述情況發(fā)生應立即予以補救;
6.7當發(fā)生服務器硬件故障時,應按如下步驟依次嘗試排障:
6.7.1當發(fā)生服務器硬件故障時,如果服務器已經(jīng)關(guān)閉,不要擅自開機,以免因短路等原因?qū)Ψ掌髟斐稍俅蝹Γ?/h3>6.7.2立即聯(lián)系服務器管理部門,要求其立刻派人到達故障現(xiàn)場對服務器及相關(guān)附屬硬件資源進行排查;
6.7.3故障排除后,應立即對服務器上與應用系統(tǒng)相關(guān)的重要文件、數(shù)據(jù)、程序等進行備份,備份應采用移動存儲設備或網(wǎng)絡異機拷貝方式進行,以免硬件損壞導致信息丟失;
6.7.4備份工作完成后,應對服務器上的應用服務運行環(huán)境進行一次全面檢查,目的是排查硬件故障是否導致系統(tǒng)運行環(huán)境發(fā)生異常變化,如發(fā)生異常變化應及時修復或調(diào)整;
6.8當發(fā)生系統(tǒng)或服務器遭受非法入侵時,應按如下步驟依次嘗試排障:
6.8.1發(fā)現(xiàn)系統(tǒng)或服務器遭受非法入侵后,應立即斷開網(wǎng)絡、關(guān)閉應用服務,以防止被繼續(xù)入侵產(chǎn)生更大損失;
6.8.2檢查應用系統(tǒng)運行環(huán)境和服務器,排查非法入侵的途徑和方式,認真檢查應用系統(tǒng)、數(shù)據(jù)庫、服務器中是否留有病毒、木馬、人為存放的惡意后門程序等;
6.8.3緊急更改應用系統(tǒng)、服務器操作系統(tǒng)等相關(guān)登錄賬號和密碼,防止再次遭受非法入侵;
6.8.4如有必要可暫時停止應用服務的使用,尋找問題解決辦法,對所有管轄下的服務器進行緊急安全補救,確保其它服務器不發(fā)生同樣的非法入侵情況;
6.8.5對非法入侵的后果進行評估,如實向上匯報非法入侵情況和解決方案;
6.9系統(tǒng)故障排除后,現(xiàn)場系統(tǒng)負責人需填報一張“系統(tǒng)故障排除記錄表”,將本次故障情況、排障經(jīng)過、排障結(jié)果等情況如實填寫記錄在案,該表由系統(tǒng)負責人和部門經(jīng)理簽字確認,然后正式歸檔以備今后查閱對比使用。
7簽字頁
我已閱讀了本預案中各部分的內(nèi)容,并充分了解了我所擁有的權(quán)利和責任。我保證在本系統(tǒng)發(fā)生故障時,將嚴格按照應急處理預案中的內(nèi)容進行排障,并在排障過程中盡到我所應盡到的責任和義務。 ? 系統(tǒng)負責人(簽字):????????????????????? 部門經(jīng)理(簽字): ? ? ? 簽字日期:?????????????????????????????? 簽字日期: ? |
系統(tǒng)故障排除記錄表
系統(tǒng)名稱 | ? |
故障發(fā)生日期 | ? | 故障排除日期 | ? |
故障處理人 | ? | 協(xié)助人員 | ? |
故障描述 | ? ? ? ? |
排障經(jīng)過描述 | ? ? ? ? ? |
排障結(jié)果 | ? ? |
系統(tǒng)負責人簽字: ? ? 簽字日期: | 部門經(jīng)理簽字: ? ? 簽字日期: |
?