◎超實用網管工具-Observium

週二參加了教育局開的網路課,課程內容教了大家prtg免費版的工具,這套工具與Catcti一樣,在我手上都只有短暫存活幾天就放生了,今天測試使用的是另一套Observium。安裝方式不難,官網都有提供各版本安裝說明,底層OS我選擇學校虛擬機既有的iso檔-Ubuntu 20.04版。

學校常見的網路設備品牌不論國產或舶來品都抓得到,除交換器之外,伺服器、網路印表機、無線網路控制器、防火牆…均能納入監測,並提供相當詳細豐富的資料與圖表。設備列表後若出現紅底白字方塊則表示設備有錯誤情形發生。

一、儀表板

一進入設備儀表板就提供相當豐富的資訊,第一個區塊提供設備製造商、韌體版本、IP位址、序號、上線時間、流量等資訊。

另一個區塊呈現系統健康資訊,包含事件記錄、處理器、記憶體、儲存容量、電源與風扇模組、溫度與電力感測器。有異常發生的模組,儀表板會出現紅色fail就要特別注意,例如下圖Power Supply2出現了紅色fail表示交換器有支援雙電源(備援),但目前可能只有插上一條電源線或是電源模組真的故障了,就需要到場確認是否需要處理。

如果點進個別port(24)也能顯示此埠連線品質是否達到1G與這個通訊埠當前流量。

二、硬體健康資訊

檢視單一設備特定元件

SNMP監測工具要能擷取硬體設備各項健康狀況,例如10.226.132.1的交換器副控裏頭,堆疊的兩台交換器基本的電力、風扇與網路配置。

Observium還能另外將處理器、記憶體、儲存、狀態、溫度、電壓、功率…等資訊逐一繪製成圖表檢視。

檢視所有設備特定元件

除了個別檢視設備各項數據之外,Observium還能專門針對處理器、記憶體、儲存、溫度、事件、風扇、電壓、功率等條件篩選出所有設備的硬體健康狀態,對於環境中的設備健康狀況可一目瞭然快速掌握與排除異常有非常大的幫助。

處理器

記憶體

儲存空間

溫度感測器

其他事件與狀態

風扇轉速

電壓

功率

三、網路環境資訊

vlan table

Observium針對網路環境的偵測具備相當強大的功能,其中包含可以直接呈現整體網路環境中所有使用的vlan,這邊主要會以VLAN ID為依據,VLAN NAME可能會出現預期之外的名稱,這其實也正常,交換器數量一多,每台switch上的vlan名稱有的是預設值沒改,有的有修正為新北慣用的名稱,但唯一不會變的就是vlan id。

不過在上圖突然瞄到了一個陌生的vlan id 21,點進去vlan name一看發現是出現在一台CISCO交換器上,而且未設定任何tag/untag標籤,猜想可能是當時華電工程師手速太快不小心誤植的,無意間就被observium給找了出來。

可顯示的vlan資訊還包含每個埠的vlan config

vlan interface ip也能秀出來!!!

交換器串接資訊

這是在Observium的Port/Neighbours會顯示出來的資訊,也是非常實用的功能,第一欄是本地設備的IP位址,然後Local Port是指本地交換器的埠號,然後這個埠號是連接到遠端的哪個IP的設備上,同時會顯示出遠地端設備的連接埠號或port name。例如第一列資訊表示10.226.132.254的第20埠接到10.226.132.219的第42埠。

透過所有通訊埠這項功能可以列出當下全校交換器上所有通訊埠的流量,也能看到每個通訊埠的網路速度是否有達到1Gbps。

也可以針對條件篩選出全校網速未達1Gbps的線路位置,例如最近新北市網路更新案即將入校施作,此案包含既有線路修復工作,透過observium就能快速列出本次施作交換器更新的副控中,有哪些網點是未達1Gbps需要廠商進行修復的。

點選特定交換器也能逐一檢視各埠對應的端點之後所連接的設備名稱,例如10.226.132.1這台switch的第1埠(eth1/0/1)是接到R101班級教室的LevelOne 5埠交換器(7705PR101)。

另外,也有map功能可以快速顯示這台交換器連接另一端對應的設備。

重要的ARP Table(ip address table)與FDB Table(mac adress table)也有詳細記錄,有了這兩份資訊,日後再次遇到上級通報的資安事件時,就可以方便地從這兩份表中找出問題的來源,不然每次上級給設備名稱與ip或mac資訊時,要大海撈針找出發生事件的設備還真是不容易。

FDB Table

AP數量與用戶

在進到 AP Controller之後如果切換到WiFi標籤可以一覽無遺所有AP的名稱、mac、ip與設備位置,這邊也是花了許多功夫在controller修改過後才能顯示出下圖整齊劃一的內容。原本華電建置時的名稱是使用AP+mac,每一台設備的名稱是長這樣AP7488.bbe8.7e20,為了好辨識所以我調整命名規則為AP+model+教室編號,也逐一確認過每顆AP的位置,所以這邊在observium裡頭就能呈現比較完美的資訊樣貌。

控制器的Clients設備數與AP數也有精美的圖表能顯示

如果想再細部查詢每顆AP的上線人數(設備數)也做得到,只是可惜似乎無法產出能相對應每顆AP上線人數的清單,只能逐一進到AP裡頭檢視個別基地台上線設備數的資訊,不過資訊欄能夠區分2.4G(802.11a/b/g/n)或5G (802.11a/n/ac) 也是很厲害的一項功能了。

PoE switch供電狀態

校內主要用來推動智慧學習用的PoE switch總供電瓦數約370W,由於供電狀況會隨時間拉長而出現衰退現象,所以每台交換器能接的CISCO AP總數就建議在12顆以下,透過Observium可一目瞭然switch上各埠供電狀況,這也是非常實用的功能。

印表機/影印機

Observium針對具備網路列印功能的事務機也有支援

儀表板能顯示個別事務機的碳粉使用情形、廢墨盒用量、蓋板狀態、列印張數等資訊

也可以透過計數器顯示所有事務機的列印張數

拓樸圖

這實在太犯規了,Observium提供整個網路介接架構的拓樸圖,免費的做成這樣叫商用的怎麼活?而且滑鼠游標一道線上還能浮出圖表呈現資訊。

這個也是犯規,而且在畫面上動來動去…

Observium能提供的資訊實在太豐富了,除了每台交換器的即時流量之外,另外能提供超過30種圖表資訊。這時只能感嘆能力有限,很多圖表只能單純欣賞用,實在看不懂也無法說明了…

設備可用度(Device Availability)、裝置上線時間( Device Uptime)、mac table使用率(FDB usage)

IP 統計數據(IP Statistics)

單一交換器網路資訊(圖表二)

單一交換器網路資訊(圖表三)

單一交換器網路資訊(圖表四)

心得:
這次接觸到Observium實在是驚艷這東西太強大了,而且竟然免費!!!也從節省哥網誌介紹才知道LibreNMS原來也是他的分支。在學校擔任網管且大部分設備都納管的情況下,常常會對自己學校設備的資訊以及掌握度遠遠感到不足,能透過一些工具快速掌握現場狀況對教師兼網管的我們會有相當大的助益,遇到狀況時可以減少如無頭蒼蠅的不知所措,也能快速進行整體檢視硬體是否有異常發生,但心痛的是我必須要立刻含淚將他移除,不然萬一不小心從D升級到C就不好笑了~

發佈留言