Punti chiave
- Perché il monitoraggio della integrità dell’hardware è importante: Traccia in modo proattivo le prestazioni di CPU, RAM, disco e archiviazione per prevenire i tempi di inattività, evita la perdita di dati e mantieni la conformità negli ambienti IT di livello enterprise.
- Ruolo delle piattaforme RMM: Strumenti di monitoraggio e gestione remota (RMM) come NinjaOne, N-able, Atera e Datto RMM forniscono visibilità in tempo reale sullo stato dei dispositivi, rilevamento tempestivo dei guasti e avvisi automatici.
- Metriche essenziali per l’integrità dell’hardware: Monitora l’utilizzo e la temperatura della CPU, la disponibilità della memoria, lo stato e la capacità del disco SMART e le tendenze di utilizzo dell’archiviazione a lungo termine per ottenere informazioni precise sulle prestazioni.
- Prerequisiti RMM: Distribuisci un agente RMM agli endpoint, garantisci i privilegi di amministratore, abilita il supporto di PowerShell e utilizza facoltativamente WMI, WinRM o SNMP per il monitoraggio esteso dei sistemi legacy.
- Metodi di monitoraggio delle metriche mediante RMM:
- Criteri RMM nativi: Utilizza i modelli di monitoraggio integrati per impostare soglie per CPU (>85%), RAM (>90%), spazio su disco (<10%) e guasti delle unità SMART, con avvisi e rimedi automatici.
- Script PowerShell: Interroga direttamente lo stato di integrità di CPU, memoria e disco, registra gli eventi per l’utilizzo di risorse elevate e integra gli strumenti RMM per il monitoraggio centralizzato degli eventi e le risposte automatiche.
- Monitoraggio del prompt dei comandi: Raccogli le metriche di CPU, memoria e disco tramite Tasklist, Systeminfo e WMIC; scrivi gli avvisi nei file di log per un monitoraggio leggero e compatibile con le tecnologie tradizionali.
- Applicazione dei criteri di gruppo: Configura la registrazione centralizzata e gli avvisi sulle prestazioni tramite Gestione dei criteri di gruppo per i dispositivi Windows connessi al dominio.
- Sfide comuni: Osserva gli agenti RMM inattivi, i problemi di autorizzazione degli script, i dati mancanti, i falsi positivi e le lacune nella conservazione dei registri. Ottimizza le soglie per ridurre l’affaticamento degli avvisi.
- Considerazioni avanzate: Estendi il monitoraggio agli ambienti virtuali (prestazioni dell’host e della macchina virtuale), ai dispositivi mobili con accesso limitato e agli endpoint leggeri sensibili al polling frequente.
Questa guida fornisce esempi per gli amministratori IT e i fornitori di servizi gestiti (MSP) per monitorare le metriche di integrità dell’hardware dei client utilizzando piattaforme di monitoraggio e gestione remota (RMM) .
Include consigli ed esempi di script PowerShell che possono essere utilizzati per creare controlli automatici dello stato di integrità coerenti tra i dispositivi, fornendo informazioni che possono essere utilizzate per inviare avvisi quando vengono raggiunte soglie critiche.
Il degrado dell’hardware non rilevato porta a tempi di inattività imprevisti e a costose riparazioni.
Perché è necessario monitorare in remoto lo stato di integrità dell’hardware dei client negli ambienti di livello enterprise
Le aziende dipendono dalla loro infrastruttura IT. Dai dispositivi sotto specificati che esauriscono le risorse (ad esempio, RAM o spazio su disco insufficienti o CPU debole) ai guasti hardware e ai dispositivi danneggiati, il monitoraggio della integrità dell’hardware consente di risolvere in modo proattivo i problemi degli utenti finali e di garantire che la produttività non venga compromessa. Un guasto all’hardware può anche portare a problemi più dannosi, come la perdita di dati, che potrebbe causare danni reali all’azienda e potenziali problemi di conformità.
L’utilizzo delle piattaforme RMM per monitorare da remoto lo stato di integrità dell’hardware dei clienti offre agli MSP una visibilità in tempo reale sulle prestazioni dei dispositivi dei loro clienti, consentendo loro di individuare tempestivamente i segnali di allarme di un hardware insufficiente o in avaria, di risolvere i problemi prima che abbiano un impatto e di migliorare la loro reputazione con i clienti aziendali.
Le principali metriche di integrità dell’hardware da monitorare includono:
- Utilizzo della CPU e stato termico
- Utilizzo e disponibilità della memoria (RAM)
- Stato del disco (stato SMART, soglie di capacità, errori I/O)
- Tendenze di utilizzo dell’archiviazione
Per impostare le metriche di integrità dell’hardware del client attivo con la piattaforma RMM scelta, avrai bisogno di:
- Una piattaforma RMM attiva (ad esempio: NinjaOne, N-able, Atera o Datto RMM)
- Un agente RMM distribuito sugli endpoint di destinazione
- Privilegi di amministratore per l’esecuzione degli script
- Supporto PowerShell sugli endpoint monitorati
Puoi, anche, sfruttare l’accesso WMI, WinRM e/o SNMP (per i sistemi legacy) per una raccolta estesa dei dati hardware.
Metodo 1: Utilizzo dei modelli di monitoraggio hardware nativi di RMM
La maggior parte delle piattaforme RMM fornisce modelli di criteri per il monitoraggio dell’integrità dell’hardware e dell’utilizzo delle risorse. I dettagli variano a seconda dei prodotti RMM, ma in linea di massima seguono questi passaggi:
- Vai su ‘Criteri di monitoraggio’ o ‘Modelli di condizione nello strumento RMM’
- Crea o modifica un modello da includere:
- Soglia di utilizzo della CPU (ad esempio, >85% per 5 minuti)
- Soglia di utilizzo della RAM (ad esempio, >90% della memoria fisica)
- Soglia di spazio libero su disco (ad esempio, <10% sul volume di sistema)
- Rilevamento dei guasti SMART per le unità supportate
- Imposta le azioni da intraprendere in caso di violazione di una soglia, come l’invio di un avviso, l’esecuzione di uno script di rimedio o l’apertura di un ticket di assistenza
- Assegnazione del modello a dispositivi, gruppi o siti
Utilizzando la piattaforma RMM per distribuire i criteri, puoi garantire che il monitoraggio di tutti i client sia standardizzato e copra tutte le metriche richieste.
Metodo 2: Utilizzo di PowerShell per interrogare le metriche hardware
Se il tuo RMM non supporta la raccolta delle metriche richieste o se vuoi creare una soluzione personalizzata, puoi utilizzare PowerShell per accedere a informazioni granulari sull’hardware in tempo reale.
Controlla l’utilizzo della CPU in PowerShell eseguendo il comando:
(Get-Counter ‘\Processor(_Total)\% Processor Time’).CounterSamples.CookedValue
Controlla la memoria disponibile eseguendo il comando:
Get-CimInstance -ClassName Win32_OperatingSystem | Select-Object FreePhysicalMemory, TotalVisibleMemorySize
Controlla lo spazio libero e lo stato di integrità del disco eseguendo:
Get-PSDrive -PSProvider ‘FileSystem’ | Select-Object Name, Used, Free
Get-WmiObject -Namespace root\wmi -Class MSStorageDriver_FailurePredictStatus | Select PredictFailure
Se viene rilevato un problema, puoi generare un registro eventi di Windows. Questo esempio mostra la creazione di un registro se viene rilevato un utilizzo elevato della CPU:
se ($cpu -gt 85) {
Write-EventLog -LogName Application -Source “HardwareMonitor” -EventID 1501 -EntryType Warning -Message “High CPU usage detected”
}
Scrivendo nel registro eventi di Windows, puoi utilizzare RMM o altri strumenti di monitoraggio per tenere traccia di eventi specifici, fornendo una posizione centralizzata per il monitoraggio di questi eventi.
Metodo 3: Usare il Prompt dei comandi per interrogare le statistiche delle risorse
Il Prompt dei comandi di Windows può essere utilizzato per il monitoraggio di base dell’hardware, utile negli ambienti legacy o nelle piccole implementazioni in cui sono richiesti meno dettagli.
Controlla il carico della CPU (esempio di Tasklist):
tasklist /FO TABLE >> C:\Logs\task_snapshot.txt
Controlla l’utilizzo della memoria:
systeminfo | findstr /C:”Available Physical Memory”
Controlla lo spazio su disco:
wmic logicaldisk get size,freespace,caption
Se viene rilevato un problema, puoi scriverlo in un file di registro (questo esempio mostra la scrittura di un avviso di spazio ridotto su disco in un file di testo):
for /f “skip=1 tokens=2” %%A in (‘wmic logicaldisk where “DeviceID=’C:'” get FreeSpace’) do (
if %%A lss 10737418240 echo Low disk space >> C:\Logs\disk_warning.log
)
Puoi utilizzare il tuo RMM o un altro agente di monitoraggio per verificare le modifiche a questi file di registro.
Metodo 4: Uso dei Criteri di gruppo per imporre la registrazione e gli avvisi sulle risorse
I Criteri di gruppo di Windows consentono di configurare centralmente i dispositivi Windows 10 e Windows 11 collegati al dominio, compresa l’abilitazione della registrazione delle prestazioni:
- Apri la console di gestione dei Criteri di gruppo
- Accedi a Configurazione del computer > Modelli amministrativi > Sistema > Registri e avvisi delle prestazioni
- Configura le impostazioni individuali per Data Collector Sets, Criteri di registrazione per CPU, memoria, disco e Impostazioni di audit per gli eventi di spazio su disco insufficiente
Il personale IT spreca ore per controllare manualmente lo stato dei dispositivi sulle proprie reti.
Ulteriori considerazioni e risoluzione dei problemi
Quando si creano gli script per alimentare i dati sull’integrità dei dispositivi con la soluzione RMM, bisogna considerare anche gli ambienti virtuali. Puoi monitorare sia le prestazioni a livello di host che quelle dell’hardware virtualizzato.
Considera anche il tipo di dispositivo che desideri monitorare. I dispositivi mobili possono limitare l’accesso diretto all’hardware, mentre alcuni dispositivi di archiviazione potrebbero non supportare SMART. Inoltre, le prestazioni dei dispositivi leggeri possono essere compromesse da client RMM/monitoraggio pesanti o da polling troppo frequenti.
Gli errori più comuni nel monitoraggio dell’integrità dell’hardware del client remoto includono dati mancanti (spesso dovuti a un agente RMM inattivo), errori di script dovuti ad autorizzazioni insufficienti, conservazione inadeguata dei registri e soglie che portano a falsi positivi.
Oltre il monitoraggio dell’integrità dell’hardware con strumenti RMM intelligenti
RMM di NinjaOne offre un robusto monitoraggio dell’hardware remoto senza la necessità di una complessa configurazione di script. Include criteri di monitoraggio dell’hardware per tenere traccia dell’utilizzo di CPU, RAM e disco con avvisi basati su soglie, supporto dello stato SMART per identificare in modo proattivo i guasti dell’archiviazione dei dati, scripting personalizzato, automazione basata su avvisi e inventario dei dispositivi (compresa la raccolta delle specifiche hardware).
Tutto viene segnalato e gestito attraverso una dashboard web centrale, con avvisi unificati via e-mail o notifiche push, in modo da rilevare i problemi all’hardware prima che possano causare perdite di dati o impattare sulla produttività. Per gli MSP, questo consente di scalare e gestire più clienti, compresi più dispositivi, mantenendo team efficienti e concentrati.
Quick-Start Guide
NinjaOne offre solide capacità di monitoraggio dell’integrità dell’hardware attraverso diverse funzionalità:
1. Monitoraggio dell’integrità del dispositivo
– Il dashboard offre un widget completo per i problemi di integrità del dispositivo che tiene traccia:
– Server attualmente non funzionanti
– Dispositivi con minacce attive
– Dispositivi con patch non riuscite o in sospeso
– Dispositivi con condizioni specifiche
– In attesa di riavvio
– Stati dei lavori di backup
2. Metriche di prestazione
– NinjaOne è in grado di monitorare le prestazioni del sistema, tra cui:
– Utilizzo della CPU
– Utilizzo della memoria
– Prestazioni del disco
– Metriche di rete
3. Patch management
– La dashboard dettagliata del patch management mostra:
– Stato dell’installazione delle patch
– Patch non riuscite
– Conformità delle patch
– Dati di vulnerabilità
4. Gestione della rete
– Il sistema di gestione della rete (NMS) consente il monitoraggio dello:
– Stato del dispositivo di rete
– Tempo di attività del dispositivo
– Backup della configurazione
5. Monitoraggio automatico
– Supporta la creazione di condizioni e avvisi personalizzati
– Può generare notifiche in base a specifiche soglie di integrità dell’hardware
