你的位置:首頁 > 測試測量 > 正文

工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?

發(fā)布時間:2021-03-29 責任編輯:lina

【導讀】服務(wù)器支撐著整個企業(yè)的信息數(shù)據(jù),在日常運轉(zhuǎn)過程中,服務(wù)器也會因為其復雜的硬件結(jié)構(gòu)、繁瑣的運行原理而出現(xiàn)一些大大小小的故障,而如如何快速排查診斷并修復服務(wù)器的故障事關(guān)整個公司業(yè)務(wù)正常開展與運作。

服務(wù)器支撐著整個企業(yè)的信息數(shù)據(jù),在日常運轉(zhuǎn)過程中,服務(wù)器也會因為其復雜的硬件結(jié)構(gòu)、繁瑣的運行原理而出現(xiàn)一些大大小小的故障,而如如何快速排查診斷并修復服務(wù)器的故障事關(guān)整個公司業(yè)務(wù)正常開展與運作。

今天分享一篇讀者來稿,一起來看看他是如何排除和應(yīng)對工控服務(wù)器磁盤陣列常見故障問題的?

工控服務(wù)器磁盤陣列故障排除法

我們生產(chǎn)線有兩個服務(wù)器機房,由于一年四季運行,出現(xiàn)服務(wù)器宕機問題也是常有的事,不過我們生產(chǎn)線服務(wù)器都是雙備份冗余配置,一臺出現(xiàn)問題對生產(chǎn)影響不是太大。這么多年來就遇到的問題和排查方法及注意事項個人做了一些記錄和匯總,正好看到威剛工控舉辦相關(guān)主題征文,在此與大家一起分享。
 
工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?
(點擊查看大圖)
 
硬盤每時每刻都在讀取數(shù)據(jù),不間斷的工作使得出現(xiàn)故障的可能性也比較大,而硬盤發(fā)生故障的時候,通常會有一系列表現(xiàn):
 
1、故障提示:這是最直接的一種故障表現(xiàn)方式,硬盤也具備自我監(jiān)測的能力,當硬盤中的部件與我們設(shè)置的正常范圍值不同時,就會自動發(fā)出提示信息。我們就可以根據(jù)這個提示信息,進行相應(yīng)的維護。整理一下服務(wù)器,檢查內(nèi)部安裝和接口,再觀察一段時間,仍然出現(xiàn)故障提示,更換硬件。雖然有可能是背板或者主板問題引起一般,但這種情況不太多。
 
2、運行報錯:硬盤運行出錯表現(xiàn)在掃描時自身出現(xiàn)錯誤,顯示壞道等情況,這個時候表示硬盤部件出現(xiàn)問題,需要將其修復或隔離。我們發(fā)現(xiàn)此類錯誤一般都是更換硬盤,因為即使修復隔離也說明硬盤帶病工作,很容易罷工,對生產(chǎn)線產(chǎn)品和質(zhì)量會造成損失。
 
3、硬盤無法讀取或識別: 啟動服務(wù)器時,硬盤無法正常被讀取,或者被識別后,系統(tǒng)仍然無法顯示硬盤,這就證明硬盤出現(xiàn)錯誤。更換硬盤至原先可以正常檢測到的槽位,根據(jù)現(xiàn)象排查故障,如果故障現(xiàn)象一樣,再繼續(xù)排查一下硬盤背板是不是故障,最后硬盤更換一般都是原廠備件更換,避免硬件出現(xiàn)兼容性不匹配問題,運行不穩(wěn)定。這個現(xiàn)象我們也遇到過,著實讓工程師們頭疼。
 
4、初始化死機: 一旦初始化就出現(xiàn)死機,雖然也有可能是內(nèi)存、病毒感染等問題,但最可能的還是硬盤故障,出現(xiàn)這種情況時,先通過清除CMOS,恢復資源初始配置,擴展第三方I/O卡屬于該機型兼容列表TPL,仍然不行考慮更換硬盤。
 
5、藍屏、頻繁重啟:內(nèi)存和主板是導致硬件藍屏的主要原因,可對內(nèi)存進行校驗排查,其他的還有殺毒軟件、驅(qū)動問題等。分析日志記錄排查故障是工程師朋友常用的方法。
 
6、外設(shè)故障引發(fā)故障:鍵盤會導致開機報錯、顯示器會導致黑屏…
 
學會利用狀態(tài)指示燈,高端服務(wù)器一般都有狀態(tài)指示燈,不同的機器指示燈含義不同,通過指示燈的顏色、閃爍、亮滅排查故障結(jié)合本身日志記錄確定問題,是工程師人員基本要求。
 
總的來說,在服務(wù)器安全運行管理中,可能造成服務(wù)器安全運行的威脅因素遠不止以上幾個方面,要保障服務(wù)器安全運行,工程師人員要有一定的技術(shù)能力和維護經(jīng)驗,給企業(yè)營造一個安全穩(wěn)定的運行平臺。
 
工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?
 
如何避免服務(wù)器出現(xiàn)上述的存儲故障,選對合適耐用的存儲產(chǎn)品很關(guān)鍵。對此,威剛科技推出一系列高品質(zhì)、高性能存儲解決方案。
 
工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?
 
PCIe M.2 2280固態(tài)硬盤
 
●  PCIe超高速界面,短時間內(nèi)處理海量數(shù)據(jù),充分滿足IoT物聯(lián)網(wǎng)/云計算/邊緣運算的需求;
●  總擦寫次數(shù)(P/E cycles)達 3K次,耐用可靠;
●  LDPC ECC糾錯機制,確保數(shù)據(jù)傳輸準確穩(wěn)定。
 
工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?
(點擊查看大圖)
 
DDR4 2666/3200超高速內(nèi)存
 
●  高效能、低延遲,充分滿足IoT物聯(lián)網(wǎng)/云計算/邊緣運算的需求;
●  高達32GB的大容量,輕松存儲海量數(shù)據(jù);
●  嚴選原廠顆粒,質(zhì)量優(yōu)異,耐用可靠。
 
工程師筆記|我是如何排除服務(wù)器磁盤陣列故障的?
(點擊查看大圖)
 
免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請電話或者郵箱聯(lián)系小編進行侵刪。
 
 
推薦閱讀:
車聯(lián)網(wǎng)時代,如何確保充電樁的穩(wěn)定運營?
節(jié)能型四通道低邊智能電源開關(guān)的應(yīng)用設(shè)計
創(chuàng)新在線、富士康等特邀嘉賓將在CITE2021的《2021IC供應(yīng)鏈安全論壇》發(fā)表重要演講
汽車無鑰匙進入系統(tǒng)是如何被攻擊的
【當代材料電學測試】系列之四:寬禁帶材料測試
要采購硬件結(jié)構(gòu)么,點這里了解一下價格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉