LOGO-ul verizonManagementul evenimentelor pentru
WAN/LAN gestionatInformații de securitate verizon șiamp Software de gestionare a evenimentelor

Introducere

Scopul acestei prezentări este de a oferi un nivel înaltview a procesului în care un eveniment declanșează crearea unui bilet de incident proactiv.
Este un over genericview și, prin urmare, excepțiile, precum și aranjamentele personalizate nu sunt acoperite.
Vă rugăm să consultați anexa de la sfârșitul prezentării pentru o explicație a termenilor.

Ce este managementul evenimentelor

Definiția managementului evenimentelor
Un eveniment poate fi definit ca orice eveniment detectabil care are semnificație pentru furnizarea de servicii IT. Evenimentele sunt de obicei notificări create de un serviciu IT, un element de configurare (Cl) sau un instrument de monitorizare.
Managementul evenimentelor de către Verizon
Verizon folosește SMARTS ca instrument de monitorizare a evenimentelor pentru WAN/LAN gestionat împreună cu M3 pentru dispozitivele Meraki. SMARTS folosește două metode pentru a detecta întreruperile serviciului:

  1. Monitorizare activă: sondajele de pe SMARTS sunt configurate pentru a interoga dispozitivele gestionate (SNMP și ICMP) la fiecare 3 minute.
  2. Monitorizare pasivă: dispozitivele gestionate sunt configurate să trimită o alertă (capcană SNMP) de fiecare dată când apar anumite erori.

Monitorizare activa

Informații de securitate verizon șiamp Software de management al evenimentelor - FIGURA 1

Sondaj: SMARTS este configurat să interogheze dispozitivul (echipamentul) la fiecare 3 minute. 1
Detectarea defecțiunilor:
Când SMARTS nu primește un răspuns de la dispozitivul interogat, SMARTS marchează dispozitivul ca „JOS”. SMARTS pornește al doilea ciclu de interogare (ciclu de netezire) de 3 minute și 35 de secunde pentru a confirma că dispozitivul nu răspunde. Timpul extins a fost implementat pentru a aștepta recuperarea automată a rețelei. 2
Eveniment trimis către Automation (IMPACT):
Dacă SMARTS nu primește un răspuns de la al doilea sondaj, SMARTS trimite alerta de eroare către IMPACT. 3
IMPACT:
La primirea unei alerte, IMPACT interogează ESP (Managed Device Inventory Database) cu numele entității pentru a prelua informații precum: ID circuit, numele clientului, produs, birou de service, NOC etc. Aceste informații sunt folosite pentru a popula alarma și pentru a crea biletul în cadrul sistemului Enterprise Ticket Management System (ETMS) al Verizon. 4

Crearea Alarmei

Cât durează crearea unei alarme?

  • Primul ciclu de interogare detectează defecțiunea în 3 minute
  • Al doilea ciclu de „netezire” confirmă defecțiunea în 3 minute și 35 de secunde
  • IMPACT primește alerta și colectează informații suplimentare pentru a crea alarma în câteva secunde

Timpul total este: 3min + 3min 35sec + câteva secunde ~ 7 minute
Criterii suplimentare de alarmă:

  • Procesul de creare a alarmei (din mecanismul de interogare) poate fi întrerupt în orice moment dacă dispozitivul începe să răspundă la interogare.

Monitorizare pasivă

Informații de securitate verizon șiamp Software de management al evenimentelor - FIGURA 2

Capcane SNMP: Capcanele sunt trimise de dispozitive către SMARTS de fiecare dată când apar anumite evenimente. 1
Următoarele capcane implicite sunt configurate în dispozitivele sediului clientului:

  • Interfață sus/jos (o capcană este trimisă de fiecare dată când starea unei interfețe se schimbă)
  • Pornire la rece/caldă (se trimite o capcană de fiecare dată când un dispozitiv pornește, ceea ce înseamnă că SMARTS știe când un dispozitiv se repornește (adică resetarea manuală sau pierderea alimentării)

IMPACT: La apariția repetitivă a unor capcane specifice (de exampdacă un dispozitiv trimite o capcană sus/jos de 4 ori în 4 ore) IMPACT creează alarme „instabile”. Pentru alarmele instabile ale interfeței, depinde de fiecare centru de management dacă acest lucru va duce automat la un bilet de incident proactiv. 2

Meraki

Gestionarea dispozitivelor Meraki nu este realizată de SMARTS, ci de un sistem de monitorizare dezvoltat intern Verizon, numit M3. Acest sistem interogează controlerul Cloud (adică tabloul de bord) la intervale de 3 minute, captează disponibilitatea și datele aferente și comunică condițiile de alarmă către IMPACT.
Controlerul Meraki Cloud sondajează CPE la fiecare 5 minute.
M3 interacționează cu cloud-ul Meraki într-unul din două moduri – SNMP sau un API REST. În versiunea inițială a lui M3, API-ul a fost folosit pentru aprovizionare, iar SNMP a fost folosit pentru monitorizare. Această abordare a fost înlocuită cu una care utilizează exclusiv API-ul și pentru noi activări nu este utilizat SNMP.

Informații de securitate verizon șiamp Software de management al evenimentelor - FIGURA 3

De la eveniment la bilet de incident

Informații de securitate verizon șiamp Software de management al evenimentelor - FIGURA 4

Un bilet este creat la 9-13 minute după evenimentul inițial de rețea.
Depanarea automată începe imediat după crearea biletului de incident proactiv. Aceasta este așa-numita fază de „triaj” și este publicată pe portalul VEC și prin eBonding.
Triage Depanarea automată permite o rezoluție mai rapidă, deoarece biletul este transferat automat către NOC dacă tehnicienii solicită diagnosticări suplimentare. Tehnicienii NOC pot folosi, de asemenea, ieșirea Triage pentru a diagnostica datele.

Informații de securitate verizon șiamp Software de management al evenimentelor - FIGURA 5

Lista de alarme și praguri

Produs Tip incident Prioritate Descriere
MS WAN Serviciu BGP întrerupt 1 Serviciul BGP și toate sesiunile BGP asociate cu acest serviciu sunt oprite
MS 'WAN Obsession Down M-am deconectat 1 Sesiunea BGP nu este stabilită fără o cauză rădăcină cunoscută
MS WAN Host I Card I Node Down Dispozitivul nu răspunde la sondarea SNMP
MS WAN Interfață în jos Interfața este oprită
MS WAN Interfață instabilă Au fost primite 5 capcane de conectare/lookdown într-o fereastră de rulare de 10 minute:
MS WAN Conexiune la rețea întreruptă 1 Conexiunea la rețea este întreruptă
MS WAN Conexiune la rețea instabilă 1 Au fost primite 5 capcane de conectare/linkdown într-o fereastră de rulare de 10 minute
MS WAN Router I Firewall I Comut în jos Dispozitivul nu răspunde la sondarea SNMP
MS WAN Firewall I Router I Switch I Host I swatch Unstable 2 În ultimele 2 de ore au fost primite cel puțin 24 capcane de tartă Warms
MS WAN Interfață cronică instabilă 2 Interfața a scăzut de cel puțin 16 ori într-o perioadă de 4 ore .1
MS WAN OSPF Network Auth Typervilismatch I Auth Hemistich 2 Simptome de configurare greșită există pe această rețea OSPF
MS WAN OSPF Network DRElectionFailure 2 Routerul desemnat nu a fost ales
MS WAN Interfața OSPF în jos 2 Două sau mai multe relații de vecinătate OSPF există pe interfață și toate sunt inactiv
MS WAN OSPFNeighborRelationship Down 2 Legătura OSPF între punctele finale învecinate este întreruptă
MS WAN OSPFNeighborRelationship NeighborStateAlarrn 2 Conectivitatea dintre vecinii OSPF a fost afectată de erori de conectivitate în nivelul 2 sau 3

Note:

  1. În funcție de centrul de management și de anumite criterii, acestea pot fi deschise ca Pri 2
  2. Alarma se stinge când 10 minute fără linkup'linkdown e-ent
  3. Alarma se șterge când 24 de ore fără evenimente Coldstart'Warmstart
  4. Alarma se șterge atunci când 4 ore fără capcane de conectare/link down

Fiecare tip de produs are un set diferit de alarme, grupul de produse este afișat în prima coloană.

Produs Tip incident Prioritate Descriere
MS WAN Punct final protocol BGP dezactivat 4 Interfața este inactivă din punct de vedere administrativ și sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare
MS WAN Protocol BGP Endpoint Remote ASMismatch I IBGP Peer Lipsește 4 Sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare
MS WAN BGP Protocol Endpoint Remote System nu rulează BGP I Difuzor la distanță nu este configurat 4 Sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare
MS WAN Interfață dezactivată 4 Interfața este oprită din punct de vedere administrativ (dezactivată manual)
MS WAN Interfața OSPF este dezactivată 4 Interfața este defectă din punct de vedere administrativ și cel puțin o adiacență OSPF raportează o stare necorespunzătoare
MS WAN OSPF Neighbour End Point Necunoscut Nbma Neighbour 4 Vecinul NBMA pentru acest punct final OSPF vecin nu este prezent în topologie
MS WAN Rețea OSPF Toate prioritățile routerului Zero 4 Routerele de rețea OSPF nu pot fi prioritizate
MS WAN Nepotrivirea rețelei OSPF I Router duplicat lD 4 Simptome de configurare greșită există pe această rețea OSPF
MS WAN OSPF Virtual Neighbor Endpoint Unknow Virtual Neighbor 4 Simptome de configurare greșită există pe această rețea OSPF
MS WAN – lite Firewall 1 Router instabil 2 2 evenimente ColdstartMarmstart au fost înregistrate în 24 de ore 2′
MS WAN – lite Gazda I Nodul jos 2 Dispozitivul nu răspunde la sondarea SNMP
MS WAN – lite Interfață în jos 2 Interfața este oprită
MS WAN – lite Conexiune la rețea întreruptă 2 Conexiunea la rețea este întreruptă
MS WAN – lite Router I Firewall jos 2 Routerul sau Firewall-ul nu răspunde la sondajul St'lfsiP a

Note:

  1. În funcție de centrul de management și de anumite criterii, acestea pot fi deschise ca Pri 2
  2. Alarma se stinge când 10 minute fără evenimente de conectare/lookdown
  3. Alarma se stinge când 24 de ore fără evenimente Colds Tart/Warms Tart
  4. Alarma se stinge când 4 ore fără capcane de conectare/lookdown

Lista de alarme Meraki

Produs Tip incident Prioritate Descriere
MS WLAN Aparat în jos 1 Dispozitivul controlat prin cloud este inaccesibil din Meraki Dashboard
Doamna WEAN Eșec de autentificare 1 Aceasta indică o defecțiune între M3 și tabloul de bord Meraki (tvleraki.com)
MS WLAN Tabloul de bord în jos 1 S-a pierdut comunicarea cu Cisco Meraki Cloud Controller
MS WLAN Expirarea licenței 1,2,4 Licența expiră sau a expirat așa cum este indicat în textul de alarmă
Prioritățile biletelor sunt următoarele 60 de zile = P4. 30 de zile = P2. 0 zile = P2. -30 zile = P1
MS WLAN AP I comuta în jos 2 Dispozitivul controlat prin cloud este inaccesibil din Meraki Dashboard
MS WLAN Interfață în jos 2 O interfață gestionată pe MX nu este
MS WLAN Backup LTE nu este gata 2 Starea conexiunii LTE (starea celulară) este „conectare” pentru 2 cicluri de interogare M3
MS WLAN Backup LTE nu este disponibil 2 Modernul celular USB ar trebui să fie acolo. dar nu este
MS WLAN Pe LTE Backup 2 Conexiunea LTE (Stare celulară) este activă
MS WLAN Administrator adăugat 4 Un utilizator administrativ a fost adăugat la baza de date de utilizatori locale a organizației Meraki
MS WLAN Administratorul a fost șters 4 Un utilizator administrativ a fost șters din baza de date locale de utilizatori a organizației Meraki
MS WLAN AP I Aparatul I Comutator eliminat 4 Dispozitivul indicat a fost scos de pe tabloul de bord

Prioritate bilet Definiții

Tipul biletului Prioritate Descriere
Outage 1 Serviciul este inutilizabil, pierderea completă a serviciului. Serviciul este lansat pentru testare fără restricții.
Degradat 2 Serviciul se confruntă cu probleme intermitente sau este degradat și nu este lansat pentru testare fără restricții.
Risc de serviciu 3 Probleme de calitate care amenință performanța serviciului.
Cerere de asistență 4 Probleme care nu afectează serviciul care necesită investigare, rezolvare sau alte acțiuni.

Acestea sunt definițiile standard ale priorităților de bilete utilizate în Verizon.

Corelarea alarmei

Când alarmele sunt prezentate la IMPACT, se aplică o cheie de corelare pe baza numelui scurt și a identificatorului de locație. Alarmele cu aceeași cheie vor fi adăugate la același eveniment și bilet. Această cheie rămâne activă timp de 15 minute pentru locațiile Hub sau timp de 2 ore pentru locațiile de la distanță.

Informații de securitate verizon șiamp Software de management al evenimentelor - FIGURA 6

După expirarea temporizatorului, noi alarme vor crea evenimente noi, vor efectua toate timpul de așteptare, interogările backend etc. și apoi o verificare preexistentă va muta alarma la un eveniment/bilet anterior atunci când este găsit un eveniment/bilet deschis. impotriva aceluiasi shortage și identificatorul locației.

Apendice
API
Interfață de programare a aplicațiilor, un intermediar software care permite două aplicații să comunice între ele.
CPE
Echipamentul sediului clientului
ESP
Aceasta este baza de date principală pentru clienții cu servicii gestionate. Toate informațiile referitoare la gestionarea și monitorizarea dispozitivelor/serviciilor de Servicii gestionate sunt stocate în ESP.
M3
Sistem de monitorizare dezvoltat intern de Verizon.
IMPACT
Platforma de management integrat pentru tehnologii avansate de comunicații este o aplicație care oferă supraveghere, creșterea topologiei de alarmă, corelare, ticketing și capabilități de automatizare pentru rețeaua Verizon.
NOC
Centru de operare în rețea
INTELIGENTE
Face parte din EMC Service Assurance Suite și oferă informații critice de management pentru aplicații și servicii. Responsabil pentru trimiterea de alerte către IMPACT de fiecare dată când este detectată o defecțiune.

LOGO-ul verizon 2iunie 2021
Verizon Public

Documente/Resurse

Software-ul verizon pentru informații de securitate și management al evenimentelor [pdfGhid de utilizare
Informații de securitate Software de gestionare a evenimentelor, Software de gestionare a evenimentelor, Software pentru informații de securitate, Software, Management de evenimente

Referințe

Lasă un comentariu

Adresa ta de e-mail nu va fi publicată. Câmpurile obligatorii sunt marcate *