PDF Tlačiť E-mail
Napísal Administrator   
17.12.2007 14:13

Na Slovensku velmi rapidne vznika a zanika velke mnozstvo lokalnych pocitacovych sieti - tieto siete sa casto dostanu do stadia kedy je potrebne monitorovat ich vlastnosti vratane rychlosti, prenesenych dat a predovsetkym dostupnost sluzieb ktore siet ponuka (http, pop, imap, smtp, sip...)

Komunita predovsetkym okolo operacneho systemu Linux a inych UNIX-like OS vyvija mnozstvo softveru ktory je urceny pre monitoring sieti a ktore pouziva aj OZ blava.net vo svojej infrastrukture a pomaha nasadzat dalsim mensim aj vacsim sietam. V tomto clanku predstavim riesenia, ktore su casto pouzivane na uplnu kontrolu a sledovanie sietovych infrastruktur.

Pre zaciatok musim podotknut, ze nasledovne riesenia nie su vhodne pokial mate siet kde neposkytujete kriticke sluzby koncovym zakaznikom - problem implementacie je, ze pokial nenapasujete konfiguraciu presne pre vase poziadavky tak sa moze lahko stat, ze vas denno-denne budu zahlcovat maily s chybnymi hlaskami, ktore budete po case veselo ignorovat a urcite sa skor ci neskor stane, ze prehliadnete dolezity mail a cely kontrolny system strati zmysel. Toto je velmi dolezie uvedomit si - kontrola a monitoring sluzieb, hostov a sietovej infrastruktury je efektivny len ak monitoruje len to co je potrebne a predovsetkym tak, aby ste dostavali len kriticke hlasky.

Nagios je ultimatny nastroj na kontrolu sluzieb a dostupnosti hostov na sieti. Pokial mate vacsinu siete postavenu na otvorenych rieseniach (Linux) dokazete monitorovat prakticky cokolvek (pripadne pokial nemate v sieti prilis vela proprietarnych zatvorenych nestandardnych rieseni) - pokial to nie je sluzba dostupna z inych casti siete, dokazete si skontrolovat sluzbu (volne miesto na disku) cez SSH, pripadne dokazete monitorovat zariadenia, ktore su za NAT, alebo inac priamo nedostupne pre monitorovaci server. Tento nastroj negeneruje grafy, ale ma pekne uzivatelske rozhranie cez Perl, resp. CGI-Apache rozhranie, teda mozete si vyhradit v ofise jeden monitor na ktorom sa bude zobrazovat aktualny stav sluzieb v sieti. Nagios nie je uplne trivialny na implementaciu, ale raz ked sa vimplementuje do siete je to genialny nastroj - pokial to niekto mysli vazne s monitoringom sluzieb a sieti tak Nagios je jednoznacne nieco co sa musi naucit. Tento nastroj sa da prirovnat k HP OmniView v odlahcenej verzii. Musim poznamenat, ze Nagios pouziva aj British Telecom pre monitorovanie sluzieb urcenych pre ich koncovych zakaznikov - tuto vedomost som vytiahol z reprezentana BT na jedenej z ich prezentacii budovania WiFi infrastruktur v Britanii. Nagios im bezi na 5 dedikovanych serveroch a monitoruju s nim okolo 12000 sluzieb. Na konfiguraciu a implementaciu Nagiosu do malej siete si vyclente aspon 1-2 dni cisteho casu - tak aby ste vedeli co robite! Nagios sa da nasadit na kontrolu tych najkritickejsich sluzieb. Citajte Dokumentaciu - Nagios ma vybornu dokumentaciu!

Smokeping - Smokeping je jednoduchy nastroj na monitorovanie latencie v sieti. Zadefinovanie a konfiguracia nastroja je trivialna a jeho ucel je tiez velmi priamy - monitoruje RTT (round trip time), teda letenciu Pingov k zadefinovanemu hostu. Efektivne pre monitorovanie RTT - toto vie robit aj Nagios, ale Smokeping vyraba aj grafy, teda je mozne efektivne monitorovat dlhodoby priebeh a dostupnost vzdialeneho hostu. Pokial nemate na sieti ziadne ine sluzby, len poskytujete infrastrukturu pre klientov tak toto je velmi dobry nastroj ako zacat monitorovat svoju siet. Nasadenie cez balickovaci system Debianu (Ubuntu) odhadujem pre stredne vzdelaneho cloveka v unixoch okolo 30 minut az 2 hodiny - podla toho kolko hostov budete monitorovat.

Munin, Cacti - Munin je odlahceny monitorovaci nastroj od komplexnejsieho Cacti - oba vytvaraju grafy a su primarne urcene na ziskavanie udajov o zariadeniach cez SNMP. Grafy su velmi pekne a daju cloveku predstavu o vyuzivatelnosti jednodlivych sluzieb, CPU, pamate a inych zakladnych parametrov stroja. Pokial nasadzate Smokeping, tak je fajn mat este jeden nastroj a tym je prave Munin (pokial ste lenivi), alebo Cacti.

MRTG - MRTG je azda najcastejsie pouzivany nastroj na monitorovanie sietovych rozhrani (nie len) cez SNMP s peknymi grafmi - systemom Plug-N-Play podporuje vacsinu zariadeni ktore podporuju SNMP protokol - jeho primarny ucel je monitorovat vyuzivanost sietovych rozhrani, takze mate predstavu ako vyuzivane vase linky su pocas urciteho casoveho obdobia. Da sa pouzit aj na monitorovanie inych paramterov cez vlastne skripty. My okrem vytazenosti liniek monitorujeme cez MRTG aj teplotu v racku so servermi (aby sme sa neskor kochali grafmi). MRTG v kombinacii o Smokeping-om je dobry zaciatok ked uz je clovek tak lenivy, ze sa mu nechce parat ani s Munin-om.

pmacct - pmacct je nastroj pracujuci s kniznicou libpcap a je urceny na monitoring jednotlivych packetov prechadzajucich (Linux...) routrom. Nema graficke rozhranie! Pracuje tak, ze na zaklade zadefinovanych parametrov (syntax tcpdump) vklada do databazy (MySQL, flat-file...) kazdych X sekund aktualne namerane udaje. Vyborny nastroj na pocitanie prenesenych dat konkretnou IPckou. blava.net cez tento nastroj monitoruje kazdu IP adresu zvlast a vytvara tabulky dl/ul dat cez nase vlastne PHP rozhranie (kedze udaje sa skladuju v SQL databaze je databaza dostupna teoreticky odkialkolvek, pricom ani nemusi bezat na rovnakom stroji ako pmacct daemon). Je to vylepsena obdoba bandwidthd, ktory sa uz nevyvija - pmacct ma excelentnu podporu jeho developerov - opravili sme spolu niekolko chyb v kode - uzasne ako dokaze otvorena komunita pracovat na tak uzasne jednoduchom a briliantnom nastroji. Dobry zaklad na bytvorenie vlastneho user-managementu.

SMS - Vsetky spomenute aplikacie vedia posielat emaily ked nieco nie je v poriadku - ked sa stane to, ze mailserver je dole, tak sa mail neposle - taktiez to vacsinou chvilku trva pokial si niekto z kompetentnych precita email - blava.net ma v rukave riesenie na posielanie SMS sprav - zariadenie pripojene cez seriove rozhranie k monitorovaciemu serveru - pokial sa nezacne riesit problem do urciteho casu tak sa posle cez toto zaraidenie SMS na jeden alebo viac GSM cisiel - takze pokial nepadne cely monitorovaci server tak sa notifikacia dostane k adminovi cez mobil. Pokial padne hlavny monitorovaci server tak tento je taktiez monitorovany vzdialenym backup-monitorovacim serverom ktory posle SMS okamzite ako nieco nie je v poriadku s primarnym monitoringom. Sekundarny monitoring monitoruje len primarny monitoring :) Tento SMS system je uplne nezavisly na akejkolvek IP sietovej infrastruktury, takze aj ked je kompletne cela siet down tak sa hlasky posielaju.

Vsetky tieto riesenia maju add-ony, takze rozsiruju pouzitelnost softveru (napr. grafy pre Nagios) - je to na kazdom z nas co preferujeme - ja osobne nemam rad taketo zlepence, kedze tym sa stava system a kazdy jeden kus softveru komplexnejsi a menej zrozumitelny pre externistov predovsetkym v implementaciach kde sa o jeden system stara viac adminov - nehovoriac o upgradoch hlavnych balikov.

Tot vsetko - ak mate akekolvek otazky ohladne kritickom monitoringu sluzieb v oblasti IS som k dispozicii na Táto e-mailová schránka má aktivovaný spam filter, na prezretie je potrebný aktivovaný Javascript.

 

Pre OZ blava.net

Marcel Hecko, MDes

PS: Vsetok softver je pouzivany na sieti blava.net - blava.net NEPOUZIVA ziadne proprietarne Linux riesenia (MikroTik, StarOS...), takze s tymito rieseniami Vam nevieme poradit, ale vieme poradit pokial sa rozhodnete pracovat seriozne na serioznych rieseniach (vanilla GNU/Linux, CISCO...) a mysliet orvorene - tak, aby sa administracia stara prijemnou a aby ste sa aj nieco naucili. Na druhej strane - naucte nieco vy nas z Vasich rieseni - my naucime nieco vas z nasich :)

Posledná zmena ( 17.12.2007 15:53 )