Managementul evenimentelor pentru
WAN/LAN gestionat
Introducere
Scopul acestei prezentări este de a oferi un nivel înaltview a procesului în care un eveniment declanșează crearea unui bilet de incident proactiv.
Este un over genericview și, prin urmare, excepțiile, precum și aranjamentele personalizate nu sunt acoperite.
Vă rugăm să consultați anexa de la sfârșitul prezentării pentru o explicație a termenilor.
Ce este managementul evenimentelor
Definiția managementului evenimentelor
Un eveniment poate fi definit ca orice eveniment detectabil care are semnificație pentru furnizarea de servicii IT. Evenimentele sunt de obicei notificări create de un serviciu IT, un element de configurare (Cl) sau un instrument de monitorizare.
Managementul evenimentelor de către Verizon
Verizon folosește SMARTS ca instrument de monitorizare a evenimentelor pentru WAN/LAN gestionat împreună cu M3 pentru dispozitivele Meraki. SMARTS folosește două metode pentru a detecta întreruperile serviciului:
- Monitorizare activă: sondajele de pe SMARTS sunt configurate pentru a interoga dispozitivele gestionate (SNMP și ICMP) la fiecare 3 minute.
- Monitorizare pasivă: dispozitivele gestionate sunt configurate să trimită o alertă (capcană SNMP) de fiecare dată când apar anumite erori.
Monitorizare activa

Sondaj: SMARTS este configurat să interogheze dispozitivul (echipamentul) la fiecare 3 minute. 1
Detectarea defecțiunilor: Când SMARTS nu primește un răspuns de la dispozitivul interogat, SMARTS marchează dispozitivul ca „JOS”. SMARTS pornește al doilea ciclu de interogare (ciclu de netezire) de 3 minute și 35 de secunde pentru a confirma că dispozitivul nu răspunde. Timpul extins a fost implementat pentru a aștepta recuperarea automată a rețelei. 2
Eveniment trimis către Automation (IMPACT): Dacă SMARTS nu primește un răspuns de la al doilea sondaj, SMARTS trimite alerta de eroare către IMPACT. 3
IMPACT: La primirea unei alerte, IMPACT interogează ESP (Managed Device Inventory Database) cu numele entității pentru a prelua informații precum: ID circuit, numele clientului, produs, birou de service, NOC etc. Aceste informații sunt folosite pentru a popula alarma și pentru a crea biletul în cadrul sistemului Enterprise Ticket Management System (ETMS) al Verizon. 4
Crearea Alarmei
Cât durează crearea unei alarme?
- Primul ciclu de interogare detectează defecțiunea în 3 minute
- Al doilea ciclu de „netezire” confirmă defecțiunea în 3 minute și 35 de secunde
- IMPACT primește alerta și colectează informații suplimentare pentru a crea alarma în câteva secunde
Timpul total este: 3min + 3min 35sec + câteva secunde ~ 7 minute
Criterii suplimentare de alarmă:
- Procesul de creare a alarmei (din mecanismul de interogare) poate fi întrerupt în orice moment dacă dispozitivul începe să răspundă la interogare.
Monitorizare pasivă

Capcane SNMP: Capcanele sunt trimise de dispozitive către SMARTS de fiecare dată când apar anumite evenimente. 1
Următoarele capcane implicite sunt configurate în dispozitivele sediului clientului:
- Interfață sus/jos (o capcană este trimisă de fiecare dată când starea unei interfețe se schimbă)
- Pornire la rece/caldă (se trimite o capcană de fiecare dată când un dispozitiv pornește, ceea ce înseamnă că SMARTS știe când un dispozitiv se repornește (adică resetarea manuală sau pierderea alimentării)
IMPACT: La apariția repetitivă a unor capcane specifice (de exampdacă un dispozitiv trimite o capcană sus/jos de 4 ori în 4 ore) IMPACT creează alarme „instabile”. Pentru alarmele instabile ale interfeței, depinde de fiecare centru de management dacă acest lucru va duce automat la un bilet de incident proactiv. 2
Meraki
Gestionarea dispozitivelor Meraki nu este realizată de SMARTS, ci de un sistem de monitorizare dezvoltat intern Verizon, numit M3. Acest sistem interogează controlerul Cloud (adică tabloul de bord) la intervale de 3 minute, captează disponibilitatea și datele aferente și comunică condițiile de alarmă către IMPACT.
Controlerul Meraki Cloud sondajează CPE la fiecare 5 minute.
M3 interacționează cu cloud-ul Meraki într-unul din două moduri – SNMP sau un API REST. În versiunea inițială a lui M3, API-ul a fost folosit pentru aprovizionare, iar SNMP a fost folosit pentru monitorizare. Această abordare a fost înlocuită cu una care utilizează exclusiv API-ul și pentru noi activări nu este utilizat SNMP.

De la eveniment la bilet de incident

Un bilet este creat la 9-13 minute după evenimentul inițial de rețea.
Depanarea automată începe imediat după crearea biletului de incident proactiv. Aceasta este așa-numita fază de „triaj” și este publicată pe portalul VEC și prin eBonding.
Triage Depanarea automată permite o rezoluție mai rapidă, deoarece biletul este transferat automat către NOC dacă tehnicienii solicită diagnosticări suplimentare. Tehnicienii NOC pot folosi, de asemenea, ieșirea Triage pentru a diagnostica datele.

Lista de alarme și praguri
| Produs | Tip incident | Prioritate | Descriere |
| MS WAN | Serviciu BGP întrerupt | 1 | Serviciul BGP și toate sesiunile BGP asociate cu acest serviciu sunt oprite |
| MS 'WAN | Obsession Down M-am deconectat | 1 | Sesiunea BGP nu este stabilită fără o cauză rădăcină cunoscută |
| MS WAN | Host I Card I Node Down | 1¹ | Dispozitivul nu răspunde la sondarea SNMP |
| MS WAN | Interfață în jos | 1¹ | Interfața este oprită |
| MS WAN | Interfață instabilă | 1¹ | Au fost primite 5 capcane de conectare/lookdown într-o fereastră de rulare de 10 minute: |
| MS WAN | Conexiune la rețea întreruptă | 1 | Conexiunea la rețea este întreruptă |
| MS WAN | Conexiune la rețea instabilă | 1 | Au fost primite 5 capcane de conectare/linkdown într-o fereastră de rulare de 10 minute |
| MS WAN | Router I Firewall I Comut în jos | 1¹ | Dispozitivul nu răspunde la sondarea SNMP |
| MS WAN | Firewall I Router I Switch I Host I swatch Unstable | 2 | În ultimele 2 de ore au fost primite cel puțin 24 capcane de tartă Warms |
| MS WAN | Interfață cronică instabilă | 2 | Interfața a scăzut de cel puțin 16 ori într-o perioadă de 4 ore .1 |
| MS WAN | OSPF Network Auth Typervilismatch I Auth Hemistich | 2 | Simptome de configurare greșită există pe această rețea OSPF |
| MS WAN | OSPF Network DRElectionFailure | 2 | Routerul desemnat nu a fost ales |
| MS WAN | Interfața OSPF în jos | 2 | Două sau mai multe relații de vecinătate OSPF există pe interfață și toate sunt inactiv |
| MS WAN | OSPFNeighborRelationship Down | 2 | Legătura OSPF între punctele finale învecinate este întreruptă |
| MS WAN | OSPFNeighborRelationship NeighborStateAlarrn | 2 | Conectivitatea dintre vecinii OSPF a fost afectată de erori de conectivitate în nivelul 2 sau 3 |
Note:
- În funcție de centrul de management și de anumite criterii, acestea pot fi deschise ca Pri 2
- Alarma se stinge când 10 minute fără linkup'linkdown e-ent
- Alarma se șterge când 24 de ore fără evenimente Coldstart'Warmstart
- Alarma se șterge atunci când 4 ore fără capcane de conectare/link down
Fiecare tip de produs are un set diferit de alarme, grupul de produse este afișat în prima coloană.
| Produs | Tip incident | Prioritate | Descriere |
| MS WAN | Punct final protocol BGP dezactivat | 4 | Interfața este inactivă din punct de vedere administrativ și sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare |
| MS WAN | Protocol BGP Endpoint Remote ASMismatch I IBGP Peer Lipsește | 4 | Sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare |
| MS WAN | BGP Protocol Endpoint Remote System nu rulează BGP I Difuzor la distanță nu este configurat | 4 | Sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare |
| MS WAN | Interfață dezactivată | 4 | Interfața este oprită din punct de vedere administrativ (dezactivată manual) |
| MS WAN | Interfața OSPF este dezactivată | 4 | Interfața este defectă din punct de vedere administrativ și cel puțin o adiacență OSPF raportează o stare necorespunzătoare |
| MS WAN | OSPF Neighbour End Point Necunoscut Nbma Neighbour | 4 | Vecinul NBMA pentru acest punct final OSPF vecin nu este prezent în topologie |
| MS WAN | Rețea OSPF Toate prioritățile routerului Zero | 4 | Routerele de rețea OSPF nu pot fi prioritizate |
| MS WAN | Nepotrivirea rețelei OSPF I Router duplicat lD | 4 | Simptome de configurare greșită există pe această rețea OSPF |
| MS WAN | OSPF Virtual Neighbor Endpoint Unknow Virtual Neighbor | 4 | Simptome de configurare greșită există pe această rețea OSPF |
| MS WAN – lite | Firewall 1 Router instabil | 2 | 2 evenimente ColdstartMarmstart au fost înregistrate în 24 de ore 2′ |
| MS WAN – lite | Gazda I Nodul jos | 2 | Dispozitivul nu răspunde la sondarea SNMP |
| MS WAN – lite | Interfață în jos | 2 | Interfața este oprită |
| MS WAN – lite | Conexiune la rețea întreruptă | 2 | Conexiunea la rețea este întreruptă |
| MS WAN – lite | Router I Firewall jos | 2 | Routerul sau Firewall-ul nu răspunde la sondajul St'lfsiP a |
Note:
- În funcție de centrul de management și de anumite criterii, acestea pot fi deschise ca Pri 2
- Alarma se stinge când 10 minute fără evenimente de conectare/lookdown
- Alarma se stinge când 24 de ore fără evenimente Colds Tart/Warms Tart
- Alarma se stinge când 4 ore fără capcane de conectare/lookdown
Lista de alarme Meraki
| Produs | Tip incident | Prioritate | Descriere |
| MS WLAN | Aparat în jos | 1 | Dispozitivul controlat prin cloud este inaccesibil din Meraki Dashboard |
| Doamna WEAN | Eșec de autentificare | 1 | Aceasta indică o defecțiune între M3 și tabloul de bord Meraki (tvleraki.com) |
| MS WLAN | Tabloul de bord în jos | 1 | S-a pierdut comunicarea cu Cisco Meraki Cloud Controller |
| MS WLAN | Expirarea licenței | 1,2,4 | Licența expiră sau a expirat așa cum este indicat în textul de alarmă Prioritățile biletelor sunt următoarele 60 de zile = P4. 30 de zile = P2. 0 zile = P2. -30 zile = P1 |
| MS WLAN | AP I comuta în jos | 2 | Dispozitivul controlat prin cloud este inaccesibil din Meraki Dashboard |
| MS WLAN | Interfață în jos | 2 | O interfață gestionată pe MX nu este |
| MS WLAN | Backup LTE nu este gata | 2 | Starea conexiunii LTE (starea celulară) este „conectare” pentru 2 cicluri de interogare M3 |
| MS WLAN | Backup LTE nu este disponibil | 2 | Modernul celular USB ar trebui să fie acolo. dar nu este |
| MS WLAN | Pe LTE Backup | 2 | Conexiunea LTE (Stare celulară) este activă |
| MS WLAN | Administrator adăugat | 4 | Un utilizator administrativ a fost adăugat la baza de date de utilizatori locale a organizației Meraki |
| MS WLAN | Administratorul a fost șters | 4 | Un utilizator administrativ a fost șters din baza de date locale de utilizatori a organizației Meraki |
| MS WLAN | AP I Aparatul I Comutator eliminat | 4 | Dispozitivul indicat a fost scos de pe tabloul de bord |
Prioritate bilet Definiții
| Tipul biletului | Prioritate | Descriere |
| Outage | 1 | Serviciul este inutilizabil, pierderea completă a serviciului. Serviciul este lansat pentru testare fără restricții. |
| Degradat | 2 | Serviciul se confruntă cu probleme intermitente sau este degradat și nu este lansat pentru testare fără restricții. |
| Risc de serviciu | 3 | Probleme de calitate care amenință performanța serviciului. |
| Cerere de asistență | 4 | Probleme care nu afectează serviciul care necesită investigare, rezolvare sau alte acțiuni. |
Acestea sunt definițiile standard ale priorităților de bilete utilizate în Verizon.
Corelarea alarmei
Când alarmele sunt prezentate la IMPACT, se aplică o cheie de corelare pe baza numelui scurt și a identificatorului de locație. Alarmele cu aceeași cheie vor fi adăugate la același eveniment și bilet. Această cheie rămâne activă timp de 15 minute pentru locațiile Hub sau timp de 2 ore pentru locațiile de la distanță.

După expirarea temporizatorului, noi alarme vor crea evenimente noi, vor efectua toate timpul de așteptare, interogările backend etc. și apoi o verificare preexistentă va muta alarma la un eveniment/bilet anterior atunci când este găsit un eveniment/bilet deschis. impotriva aceluiasi shortage și identificatorul locației.
Apendice
API
Interfață de programare a aplicațiilor, un intermediar software care permite două aplicații să comunice între ele.
CPE
Echipamentul sediului clientului
ESP
Aceasta este baza de date principală pentru clienții cu servicii gestionate. Toate informațiile referitoare la gestionarea și monitorizarea dispozitivelor/serviciilor de Servicii gestionate sunt stocate în ESP.
M3
Sistem de monitorizare dezvoltat intern de Verizon.
IMPACT
Platforma de management integrat pentru tehnologii avansate de comunicații este o aplicație care oferă supraveghere, creșterea topologiei de alarmă, corelare, ticketing și capabilități de automatizare pentru rețeaua Verizon.
NOC
Centru de operare în rețea
INTELIGENTE
Face parte din EMC Service Assurance Suite și oferă informații critice de management pentru aplicații și servicii. Responsabil pentru trimiterea de alerte către IMPACT de fiecare dată când este detectată o defecțiune.
iunie 2021
Verizon Public
Documente/Resurse
![]() |
Software-ul verizon pentru informații de securitate și management al evenimentelor [pdfGhid de utilizare Informații de securitate Software de gestionare a evenimentelor, Software de gestionare a evenimentelor, Software pentru informații de securitate, Software, Management de evenimente |




