Ghidul utilizatorului software-ului pentru informații de securitate și management al evenimentelor verizon

Managementul evenimentelor pentru
WAN/LAN gestionat

Cuprins ascunde

1 Introducere

2 Ce este managementul evenimentelor

3 Monitorizare activa

4 Crearea Alarmei

5 Monitorizare pasivă

6 Meraki

7 De la eveniment la bilet de incident

8 Lista de alarme și praguri

9 Prioritate bilet Definiții

Introducere

Scopul acestei prezentări este de a oferi un nivel înaltview a procesului în care un eveniment declanșează crearea unui bilet de incident proactiv.
Este un over genericview și, prin urmare, excepțiile, precum și aranjamentele personalizate nu sunt acoperite.
Vă rugăm să consultați anexa de la sfârșitul prezentării pentru o explicație a termenilor.

Ce este managementul evenimentelor

Definiția managementului evenimentelor
Un eveniment poate fi definit ca orice eveniment detectabil care are semnificație pentru furnizarea de servicii IT. Evenimentele sunt de obicei notificări create de un serviciu IT, un element de configurare (Cl) sau un instrument de monitorizare.
Managementul evenimentelor de către Verizon
Verizon folosește SMARTS ca instrument de monitorizare a evenimentelor pentru WAN/LAN gestionat împreună cu M3 pentru dispozitivele Meraki. SMARTS folosește două metode pentru a detecta întreruperile serviciului:

Monitorizare activă: sondajele de pe SMARTS sunt configurate pentru a interoga dispozitivele gestionate (SNMP și ICMP) la fiecare 3 minute.

Monitorizare pasivă: dispozitivele gestionate sunt configurate să trimită o alertă (capcană SNMP) de fiecare dată când apar anumite erori.

Monitorizare activa

Sondaj: SMARTS este configurat să interogheze dispozitivul (echipamentul) la fiecare 3 minute. 1
Detectarea defecțiunilor: Când SMARTS nu primește un răspuns de la dispozitivul interogat, SMARTS marchează dispozitivul ca „JOS”. SMARTS pornește al doilea ciclu de interogare (ciclu de netezire) de 3 minute și 35 de secunde pentru a confirma că dispozitivul nu răspunde. Timpul extins a fost implementat pentru a aștepta recuperarea automată a rețelei. 2
Eveniment trimis către Automation (IMPACT): Dacă SMARTS nu primește un răspuns de la al doilea sondaj, SMARTS trimite alerta de eroare către IMPACT. 3
IMPACT: La primirea unei alerte, IMPACT interogează ESP (Managed Device Inventory Database) cu numele entității pentru a prelua informații precum: ID circuit, numele clientului, produs, birou de service, NOC etc. Aceste informații sunt folosite pentru a popula alarma și pentru a crea biletul în cadrul sistemului Enterprise Ticket Management System (ETMS) al Verizon. 4

Crearea Alarmei

Cât durează crearea unei alarme?

Primul ciclu de interogare detectează defecțiunea în 3 minute
Al doilea ciclu de „netezire” confirmă defecțiunea în 3 minute și 35 de secunde
IMPACT primește alerta și colectează informații suplimentare pentru a crea alarma în câteva secunde

Timpul total este: 3min + 3min 35sec + câteva secunde ~ 7 minute
Criterii suplimentare de alarmă:

Procesul de creare a alarmei (din mecanismul de interogare) poate fi întrerupt în orice moment dacă dispozitivul începe să răspundă la interogare.

Monitorizare pasivă

Capcane SNMP: Capcanele sunt trimise de dispozitive către SMARTS de fiecare dată când apar anumite evenimente. 1
Următoarele capcane implicite sunt configurate în dispozitivele sediului clientului:

Interfață sus/jos (o capcană este trimisă de fiecare dată când starea unei interfețe se schimbă)

Pornire la rece/caldă (se trimite o capcană de fiecare dată când un dispozitiv pornește, ceea ce înseamnă că SMARTS știe când un dispozitiv se repornește (adică resetarea manuală sau pierderea alimentării)

IMPACT: La apariția repetitivă a unor capcane specifice (de exampdacă un dispozitiv trimite o capcană sus/jos de 4 ori în 4 ore) IMPACT creează alarme „instabile”. Pentru alarmele instabile ale interfeței, depinde de fiecare centru de management dacă acest lucru va duce automat la un bilet de incident proactiv. 2

Meraki

Gestionarea dispozitivelor Meraki nu este realizată de SMARTS, ci de un sistem de monitorizare dezvoltat intern Verizon, numit M3. Acest sistem interogează controlerul Cloud (adică tabloul de bord) la intervale de 3 minute, captează disponibilitatea și datele aferente și comunică condițiile de alarmă către IMPACT.
Controlerul Meraki Cloud sondajează CPE la fiecare 5 minute.
M3 interacționează cu cloud-ul Meraki într-unul din două moduri – SNMP sau un API REST. În versiunea inițială a lui M3, API-ul a fost folosit pentru aprovizionare, iar SNMP a fost folosit pentru monitorizare. Această abordare a fost înlocuită cu una care utilizează exclusiv API-ul și pentru noi activări nu este utilizat SNMP.

De la eveniment la bilet de incident

Un bilet este creat la 9-13 minute după evenimentul inițial de rețea.
Depanarea automată începe imediat după crearea biletului de incident proactiv. Aceasta este așa-numita fază de „triaj” și este publicată pe portalul VEC și prin eBonding.
Triage Depanarea automată permite o rezoluție mai rapidă, deoarece biletul este transferat automat către NOC dacă tehnicienii solicită diagnosticări suplimentare. Tehnicienii NOC pot folosi, de asemenea, ieșirea Triage pentru a diagnostica datele.

Lista de alarme și praguri

Produs	Tip incident	Prioritate	Descriere
MS WAN	Serviciu BGP întrerupt	1	Serviciul BGP și toate sesiunile BGP asociate cu acest serviciu sunt oprite
MS 'WAN	Obsession Down M-am deconectat	1	Sesiunea BGP nu este stabilită fără o cauză rădăcină cunoscută
MS WAN	Host I Card I Node Down	1¹	Dispozitivul nu răspunde la sondarea SNMP
MS WAN	Interfață în jos	1¹	Interfața este oprită
MS WAN	Interfață instabilă	1¹	Au fost primite 5 capcane de conectare/lookdown într-o fereastră de rulare de 10 minute:
MS WAN	Conexiune la rețea întreruptă	1	Conexiunea la rețea este întreruptă
MS WAN	Conexiune la rețea instabilă	1	Au fost primite 5 capcane de conectare/linkdown într-o fereastră de rulare de 10 minute
MS WAN	Router I Firewall I Comut în jos	1¹	Dispozitivul nu răspunde la sondarea SNMP
MS WAN	Firewall I Router I Switch I Host I swatch Unstable	2	În ultimele 2 de ore au fost primite cel puțin 24 capcane de tartă Warms
MS WAN	Interfață cronică instabilă	2	Interfața a scăzut de cel puțin 16 ori într-o perioadă de 4 ore .1
MS WAN	OSPF Network Auth Typervilismatch I Auth Hemistich	2	Simptome de configurare greșită există pe această rețea OSPF
MS WAN	OSPF Network DRElectionFailure	2	Routerul desemnat nu a fost ales
MS WAN	Interfața OSPF în jos	2	Două sau mai multe relații de vecinătate OSPF există pe interfață și toate sunt inactiv
MS WAN	OSPFNeighborRelationship Down	2	Legătura OSPF între punctele finale învecinate este întreruptă
MS WAN	OSPFNeighborRelationship NeighborStateAlarrn	2	Conectivitatea dintre vecinii OSPF a fost afectată de erori de conectivitate în nivelul 2 sau 3

Note:

În funcție de centrul de management și de anumite criterii, acestea pot fi deschise ca Pri 2
Alarma se stinge când 10 minute fără linkup'linkdown e-ent
Alarma se șterge când 24 de ore fără evenimente Coldstart'Warmstart
Alarma se șterge atunci când 4 ore fără capcane de conectare/link down

Fiecare tip de produs are un set diferit de alarme, grupul de produse este afișat în prima coloană.

Produs	Tip incident	Prioritate	Descriere
MS WAN	Punct final protocol BGP dezactivat	4	Interfața este inactivă din punct de vedere administrativ și sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare
MS WAN	Protocol BGP Endpoint Remote ASMismatch I IBGP Peer Lipsește	4	Sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare
MS WAN	BGP Protocol Endpoint Remote System nu rulează BGP I Difuzor la distanță nu este configurat	4	Sesiunea BGP pentru acest punct final raportează o stare necorespunzătoare
MS WAN	Interfață dezactivată	4	Interfața este oprită din punct de vedere administrativ (dezactivată manual)
MS WAN	Interfața OSPF este dezactivată	4	Interfața este defectă din punct de vedere administrativ și cel puțin o adiacență OSPF raportează o stare necorespunzătoare
MS WAN	OSPF Neighbour End Point Necunoscut Nbma Neighbour	4	Vecinul NBMA pentru acest punct final OSPF vecin nu este prezent în topologie
MS WAN	Rețea OSPF Toate prioritățile routerului Zero	4	Routerele de rețea OSPF nu pot fi prioritizate
MS WAN	Nepotrivirea rețelei OSPF I Router duplicat lD	4	Simptome de configurare greșită există pe această rețea OSPF
MS WAN	OSPF Virtual Neighbor Endpoint Unknow Virtual Neighbor	4	Simptome de configurare greșită există pe această rețea OSPF
MS WAN – lite	Firewall 1 Router instabil	2	2 evenimente ColdstartMarmstart au fost înregistrate în 24 de ore 2′
MS WAN – lite	Gazda I Nodul jos	2	Dispozitivul nu răspunde la sondarea SNMP
MS WAN – lite	Interfață în jos	2	Interfața este oprită
MS WAN – lite	Conexiune la rețea întreruptă	2	Conexiunea la rețea este întreruptă
MS WAN – lite	Router I Firewall jos	2	Routerul sau Firewall-ul nu răspunde la sondajul St'lfsiP a

Note:

În funcție de centrul de management și de anumite criterii, acestea pot fi deschise ca Pri 2

Alarma se stinge când 10 minute fără evenimente de conectare/lookdown
Alarma se stinge când 24 de ore fără evenimente Colds Tart/Warms Tart
Alarma se stinge când 4 ore fără capcane de conectare/lookdown

Lista de alarme Meraki

Produs	Tip incident	Prioritate	Descriere
MS WLAN	Aparat în jos	1	Dispozitivul controlat prin cloud este inaccesibil din Meraki Dashboard
Doamna WEAN	Eșec de autentificare	1	Aceasta indică o defecțiune între M3 și tabloul de bord Meraki (tvleraki.com)
MS WLAN	Tabloul de bord în jos	1	S-a pierdut comunicarea cu Cisco Meraki Cloud Controller
MS WLAN	Expirarea licenței	1,2,4	Licența expiră sau a expirat așa cum este indicat în textul de alarmă Prioritățile biletelor sunt următoarele 60 de zile = P4. 30 de zile = P2. 0 zile = P2. -30 zile = P1
MS WLAN	AP I comuta în jos	2	Dispozitivul controlat prin cloud este inaccesibil din Meraki Dashboard
MS WLAN	Interfață în jos	2	O interfață gestionată pe MX nu este
MS WLAN	Backup LTE nu este gata	2	Starea conexiunii LTE (starea celulară) este „conectare” pentru 2 cicluri de interogare M3
MS WLAN	Backup LTE nu este disponibil	2	Modernul celular USB ar trebui să fie acolo. dar nu este
MS WLAN	Pe LTE Backup	2	Conexiunea LTE (Stare celulară) este activă
MS WLAN	Administrator adăugat	4	Un utilizator administrativ a fost adăugat la baza de date de utilizatori locale a organizației Meraki
MS WLAN	Administratorul a fost șters	4	Un utilizator administrativ a fost șters din baza de date locale de utilizatori a organizației Meraki
MS WLAN	AP I Aparatul I Comutator eliminat	4	Dispozitivul indicat a fost scos de pe tabloul de bord

Prioritate bilet Definiții

Tipul biletului	Prioritate	Descriere
Outage	1	Serviciul este inutilizabil, pierderea completă a serviciului. Serviciul este lansat pentru testare fără restricții.
Degradat	2	Serviciul se confruntă cu probleme intermitente sau este degradat și nu este lansat pentru testare fără restricții.
Risc de serviciu	3	Probleme de calitate care amenință performanța serviciului.
Cerere de asistență	4	Probleme care nu afectează serviciul care necesită investigare, rezolvare sau alte acțiuni.

Acestea sunt definițiile standard ale priorităților de bilete utilizate în Verizon.

Corelarea alarmei

Când alarmele sunt prezentate la IMPACT, se aplică o cheie de corelare pe baza numelui scurt și a identificatorului de locație. Alarmele cu aceeași cheie vor fi adăugate la același eveniment și bilet. Această cheie rămâne activă timp de 15 minute pentru locațiile Hub sau timp de 2 ore pentru locațiile de la distanță.

După expirarea temporizatorului, noi alarme vor crea evenimente noi, vor efectua toate timpul de așteptare, interogările backend etc. și apoi o verificare preexistentă va muta alarma la un eveniment/bilet anterior atunci când este găsit un eveniment/bilet deschis. impotriva aceluiasi shortage și identificatorul locației.

Apendice
API
Interfață de programare a aplicațiilor, un intermediar software care permite două aplicații să comunice între ele.
CPE
Echipamentul sediului clientului
ESP
Aceasta este baza de date principală pentru clienții cu servicii gestionate. Toate informațiile referitoare la gestionarea și monitorizarea dispozitivelor/serviciilor de Servicii gestionate sunt stocate în ESP.
M3
Sistem de monitorizare dezvoltat intern de Verizon.
IMPACT
Platforma de management integrat pentru tehnologii avansate de comunicații este o aplicație care oferă supraveghere, creșterea topologiei de alarmă, corelare, ticketing și capabilități de automatizare pentru rețeaua Verizon.
NOC
Centru de operare în rețea
INTELIGENTE
Face parte din EMC Service Assurance Suite și oferă informații critice de management pentru aplicații și servicii. Responsabil pentru trimiterea de alerte către IMPACT de fiecare dată când este detectată o defecțiune.

iunie 2021
Verizon Public

Documente/Resurse

Software-ul verizon pentru informații de securitate și management al evenimentelor [pdfGhid de utilizare
Informații de securitate Software de gestionare a evenimentelor, Software de gestionare a evenimentelor, Software pentru informații de securitate, Software, Management de evenimente

Referințe

Manual de utilizare