AIOps實際上是将來自不同IT(和非IT)來源的數據關聯到一個龐大的數據存儲庫,使它們可以相互連接,從而進行分析和趨勢判斷。
AIOps系統可處理多種共享的數據結構(如下圖所示),而無需額外進行二次開發或改進:
timestamp:各種事件、日志和測量方法中都包含了時間點的特征,這些數據可以集中在一起,以按時間順序進行因果分析。
Properties:一些與日志或測量相關的信息關鍵值對如“key:value),像Status,Source,Ruby,Triver,等等,可以用來創建不同數據集之間的關系模型。
曆史記錄:已過去的數據,可用于預測未來績效或阈值,例如飽和度(saturation)和退化(degradation)。
效果:一天、一周、一個月等時間序列數據顯示的趨勢或規律,可以用來關聯多個數據集,或者預測對可伸縮性的資源要求。
ApplicationServices和BusinessModels:如果您能夠定期進行發現和配置管理實踐,那麼可以使用它們來向AIOps平台中不同資産的分組、關聯、依賴以及數據去重。
總而言之,AIOps通過建立良好的時間序列數據,可以運用各種業務監測和管理工具進行關聯、分析和預測各種時間數據,然後實現:
把IT和非IT類的數據集中起來,如:用戶的數量 績效表現,延時時間 轉化率;
并且可以增加數據的“粒度”,例如:從頻率為5分鐘到1分鐘;
對數據流進行應用級分析,例如:實現“實時”或對一個特定曆史時期的查詢。
人為捕捉的事件通常是非結構化的;而大部分設備所獲得的IT事件blob(翻譯:binarylargeobject,二進制大對象)也隻能達到半結構化。
其特征是:格式不一緻、不夠完整、大量重複。所以,AIOps應該提供關于這些IT事件屬性的模式轉換,以便進行更深入的分析。
當前的工作流程分析。
到目前為止,我認為您的AIOps方案分析工作已經就緒。這裡的分析并不是來自IT工具,而是您經常或者不定期地進行,它旨在改善過程、降低成本、改善性能。
通過手工分析AIOps方案,您可以以一種持續叠代的方式解決自動化過程中出現的問題,從而減少花費在分析方面的人工工作量,增加分析的頻率和範圍。
很明顯,AIOps的目标是:減少你花在手工上的時間和精力,通過提高速度與頻率來自動地對數據集進行實時分析。
着手實現自動化。
的确,每個人都知道自動化的價值,但對自動化的認識卻各不相同。伴随着DevOps帶來的持續集成和交付(CI/CD),IT運營的自動化之路也随之産生。
ITOps:重點關注任務自動實現并協調各個步驟。這些措施包括:實現服務台工作自動化,服務器自動打補丁,通過監視工具自動糾正系統錯誤。各工種的難點在于各工種之間的協作和相互聯系。
DevOps:關注于自動完成自己的開發任務和業務流程,從而避免了瀑布式開發中的階段審查過程、獨立測試、行為遵從性,以及運營和上線連接等造成的瓶頸和滞後。
很明顯,DevOps的應用團隊的目标是加速集成和交付的速度和頻率,這是通過創新服務(比如雲應用)實現的。
對IT運營團隊來說,需要“全自動化”,他們不僅要協調CI/CD,還要配合整個“鍊條”。
若用戶不知道服務何時從測試轉移到生産環境,也不知道誰擁有源代碼将對産生環境有什麼影響,也不知道如何衡量業務開發人員積壓的工作,那麼就無法真正有效地管理自己的自動化環境。
所以,IT操作需要跟上DevOps團隊的速度和靈活性,綜合使用各種工具來發現信息,分享信息,并且通過與DevOps進行交流,“刷出自己的存在”。
雲呐統一運維管理平台,通過對網絡設備管理、服務器管理、存儲設備管理、業務應用管理、無線管理、日志分析、辦公設備/聯網設備、動環系統等本地和異地網絡的實時監控、自動巡檢,精準采集、分析故障信息,判斷重要數據性能指标,實現大規模數據中心的集中統一管理。
,