這天早晨,我帶兒子在公園裡溜達,迎着冬日朝陽沐浴在晨輝下,感覺身心美滋滋。
正閉眼享受惬意時光的當下,口袋突然震了起來。
7點剛過誰打我電話?這日子還能不能過了
?
拿起手機一看,咦
~某遊戲公司的運維經理王總?那麼早找我幹嘛?出于專(qiong)業(bi)的職業素養和精神,接了再說!客戶滿意度第一!
我: 喂,早呀!王總, 那麼早就起來啦? 早飯吃了麼?
王:沒吃!吃不下!你上午有空來次我們公司麼?有些事情我要了解下!
我:啊!? 關于什麼事情?需要我準備什麼資料麼?
王:就兩個月前我們買的200多台服務器的事情! 不用準備,你來就可以了!
我:啊啊?? 怎麼了?出故障了麼?
嘟嘟嘟…….
撂下電話,我火速抓住撒歡的兒子一路狂奔到家,背上雙肩包,坐上地鐵殺向客戶公司……
見面後我開門見山:那200多台服務器不是你們另一個項目組A的麼?
王總:這半年來我們項目組的在線玩家數量和收入增長都不錯,而且接下來會上新版本,所以我們就和采購提了200台擴容需求。 而暑假期間項目組A的遊戲流量隻有預期的一半,于是大老闆就把兩個月前買的那260台服務器轉給我們了。
我:這不挺好的麼?這樣一來你們項目組差不多有800台服務器了吧?
王總:問題是這260台服務器目前的BIOSRAID配置和預裝的系統是按照A項目組的要求做的,和我們要求不一樣啊。你也知道我們組算上我才3個人。以往需求都是你們出廠預設好,我上架就能用的,現在怎麼辦?總監要求3天内就上線。你有啥辦法不? 愁死我了……
我:……就這事啊?(我還差點就坐火箭來了!)對戴爾易安信服務器來說,這都不叫事好嗎!
批量重新配置神器——OME
對戴爾易安信服務器全生命周期管理來說,批量重新配置及部署是默認的标準功能~
首先我來介紹批量部署及監控的神器—— OME(OpenManage Essentials)
OpenManage Essentials 是戴爾營銷硬件管理應用程序,能夠對企業網絡中的系統、設備和組件提供全面的監控、部署及資源清冊。用戶可在設置并允許的網段内,通過SNMP協議管理及監控最多可達8000台服務器,前面王總說的260台服務器重新配置,完全可以靠OME實現。
在OME的部署門戶頁面,用戶可以執行初始服務器及操作系統部署。通過該門戶用戶創建服務器配置模闆,針對服務器有iDRAC、BIOS、RAID 和 NIC 的設置,以及針對刀片機箱有CMC 的設置。這些配置模闆随後可以部署到多個服務器或機箱以進行初始配置,然後再從預定義的可引導 ISO 映像啟動操作系統部署流程。通過設定多個模闆,用戶可快速切換現有服務器的設置,極大地簡化了日常運維工作。
關鍵這個軟件是免費的!!!
王總:哇塞!這麼好的東西你怎麼現在才告訴我,這個還能監控和預警?我不用派人天天去機房巡檢了?
我: SNMP、WMI、WS-MAN可管理并監控服務器、交換機、超融合存儲、防火牆等設備,具體内容請看OME界面。
▲上圖,即為OME的操作界面,主要分為4個模塊:
○ 模塊1是頂部導航欄,模塊2為菜單欄和搜索框;
○ 主要看模塊3,這裡是控制台區域,清晰地顯示了設備狀态及報警餅圖,界面右側排列了一系列報警日志,對應的時間、報警級别、設備IP地址一目了然;
○ 模塊4顯示了具體的報警内容。
如果向OME管理服務器開放外網訪問戴爾易安信官方源的話,OME還可提供對服務器的BIOS、固件、驅動的更新,并在第一時間通知用戶高優先級補丁的更新情況。
另外,OME還可以幫助用戶盤點資産并生成資源清冊報告哦!
OME另一高招——資源清冊報告
王總:資産報告?OME統計地全面和準确麼?我們現在是用表格手動做資産管理系統,經常出錯。報修換了主闆或者網卡後,表格裡的mac地址也經常不準。
我: OME做服務器資産盤點的效果可是杠杠的!它能對所有受管設備生成非常全面及詳盡的資源清冊報告,如下就是對于所有設備的NIC信息做出的統計,其中IP、MAC、Vendor信息都清晰可見。
此外,清冊報告裡還包括如下内容▼:
服務器資源清冊類别
說明
服務器概覽
提供關于服務器的信息,例如:系統名稱、服務器上安裝的操作系統、處理器和内存
硬盤驅動器信息
确定硬盤驅動器的序列号、修訂版、制造商、總線類型和自加密功能。
内存信息
提供有關DIMM 的詳情,并确定特定
DIMM 在服務器中占用的插槽。
PCI 設備信息
确定每台服務器中的型号、制造商
以及PCI 和PCIe 控制器的插槽。
存儲控制器信息
确定服務器上的存儲控制器,并提供控制器名稱、供應商、控制器類型和控制器狀态。
虛拟磁盤信息
提供有關虛拟磁盤的信息,如大小、布局,條帶大小等等。
服務器組件和版本
标識所有查找到的和進行資源清冊的服務器上的BIOS、驅動程序和固件版本
設備配置合規性
向關聯的設備配置模闆提供與服務器或機箱的合規性有關的信息
我:利用這些OME功能,就算你們團隊隻有3人,管理好800多台服務器也不在話下!
服務器成精了?不,是SA
王總: OME的監控、管理和部署确實非常不錯!不過每次保修還是很麻煩,要聽很久電腦語音,還要抓日志!
不過剛才我聽你說服務器能主動報修,還能主動換備件?難道服務器成精了嗎?如果這樣,那我們就省力了。哈哈~
我:哈哈,服務器當然不會成精。主動式報修和更換部件是通過SA實現的。
SA全稱SupportAssist Enterprise,是一款可自動為 Dell 服務器、存儲、網絡設備提供技術支持的軟件程序。在設置 SA 并正确配置待監測設備後,任何受監測設備發生硬件事件,SA便會收到警報,并通過使用各種策略對收到的警報進行篩選,以确定警報是否符合報修條件。符合報修條件的警報被安全地發送給 SA 服務器,創建或更新報修案例後,售後部門使用報警信息對問題進行故障排除,并提供适當的解決方案。具體可參考下表▼:
SA 功能
說明
主動檢測硬件故障
SA 接收受監測設備中發生的硬件事件的警報,并主動确定警報是否表明發生了硬件故障
預測性檢測硬件故障
對從受監測設備收集的系統信息進行智能分析,從而預測将來可能發生的硬件故障
自動收集系統信息
自動從設備收集對問題進行故障排除所需的系統信息,并将其安全地發送至戴爾
自動創建支持案例
在主動檢測到或預測性檢測到硬件故障時,系統自動向技術支持部門創建服務請求
自動電子郵件通知
将關于支持案例或問題的電子郵件通知自動發送到貴公司的主要和第二 SA聯系人
主動部件派發
如需要更換部件才能解決問題,SA中配置的派送首選項向您派發更換部件
技術支持部門主動回應
技術支持代理将就該支持案例主動與您聯系,并幫助您解決此問題
部分地區故障發生後4小時,我們的售後工程師就可以帶着備件上門更換了。上次在一個部署了OME SA的客戶那裡,我們的售後工程師都帶着備件上門了,他的機房駐場工程師才發現原來一台服務器的硬盤壞了一塊。
由此,SA的專業性可窺一斑。
綜上,OME SA雙劍合璧,可打造一個集部署、故障監控、資産清冊、自動報障、自動維修為一體的自動化運維平台,保障您運維無憂!
點擊“了解更多”查看數字化轉型方案詳情
,