/
/

Come monitorare le metriche di integrità dell’hardware dei client utilizzando RMM

di Lauren Ballejos, IT Editorial Expert   |  
translated by Chiara Cavalletti
How to Monitor Client Hardware Health Metrics Using RMM blog banner image

Riepilogo

Questo post del blog NinjaOne offre un elenco completo di comandi CMD di base e un’analisi approfondita dei comandi di Windows con oltre 70 comandi cmd essenziali sia per i principianti che per gli utenti avanzati. La guida si propone si piegare in modo pratico i comandi del prompt dei comandi per la gestione dei file, la navigazione nelle directory, la risoluzione dei problemi di rete, le operazioni su disco e l’automazione, con esempi reali per migliorare la produttività. Che tu voglia imparare i comandi cmd fondamentali o padroneggiare gli strumenti avanzati della CLI di Windows, questa guida ti aiuterà a utilizzare il Prompt dei comandi in modo più efficace.

Punti chiave

  • Perché il monitoraggio della integrità dell’hardware è importante: Traccia in modo proattivo le prestazioni di CPU, RAM, disco e archiviazione per prevenire i tempi di inattività, evita la perdita di dati e mantieni la conformità negli ambienti IT di livello enterprise.
  • Ruolo delle piattaforme RMM: Strumenti di monitoraggio e gestione remota (RMM) come NinjaOne, N-able, Atera e Datto RMM forniscono visibilità in tempo reale sullo stato dei dispositivi, rilevamento tempestivo dei guasti e avvisi automatici.
  • Metriche essenziali per l’integrità dell’hardware: Monitora l’utilizzo e la temperatura della CPU, la disponibilità della memoria, lo stato e la capacità del disco SMART e le tendenze di utilizzo dell’archiviazione a lungo termine per ottenere informazioni precise sulle prestazioni.
  • Prerequisiti RMM: Distribuisci un agente RMM agli endpoint, garantisci i privilegi di amministratore, abilita il supporto di PowerShell e utilizza facoltativamente WMI, WinRM o SNMP per il monitoraggio esteso dei sistemi legacy.
  • Metodi di monitoraggio delle metriche mediante RMM:
    • Criteri RMM nativi: Utilizza i modelli di monitoraggio integrati per impostare soglie per CPU (>85%), RAM (>90%), spazio su disco (<10%) e guasti delle unità SMART, con avvisi e rimedi automatici.
    • Script PowerShell: Interroga direttamente lo stato di integrità di CPU, memoria e disco, registra gli eventi per l’utilizzo di risorse elevate e integra gli strumenti RMM per il monitoraggio centralizzato degli eventi e le risposte automatiche.
    • Monitoraggio del prompt dei comandi: Raccogli le metriche di CPU, memoria e disco tramite Tasklist, Systeminfo e WMIC; scrivi gli avvisi nei file di log per un monitoraggio leggero e compatibile con le tecnologie tradizionali.
    • Applicazione dei criteri di gruppo: Configura la registrazione centralizzata e gli avvisi sulle prestazioni tramite Gestione dei criteri di gruppo per i dispositivi Windows connessi al dominio.
  • Sfide comuni: Osserva gli agenti RMM inattivi, i problemi di autorizzazione degli script, i dati mancanti, i falsi positivi e le lacune nella conservazione dei registri. Ottimizza le soglie per ridurre l’affaticamento degli avvisi.
  • Considerazioni avanzate: Estendi il monitoraggio agli ambienti virtuali (prestazioni dell’host e della macchina virtuale), ai dispositivi mobili con accesso limitato e agli endpoint leggeri sensibili al polling frequente.

Questa guida fornisce esempi per gli amministratori IT e i fornitori di servizi gestiti (MSP) per monitorare le metriche di integrità dell’hardware dei client utilizzando piattaforme di monitoraggio e gestione remota (RMM) .

Include consigli ed esempi di script PowerShell che possono essere utilizzati per creare controlli automatici dello stato di integrità coerenti tra i dispositivi, fornendo informazioni che possono essere utilizzate per inviare avvisi quando vengono raggiunte soglie critiche.

Il degrado dell’hardware non rilevato porta a tempi di inattività imprevisti e a costose riparazioni.

Proteggi lo stack IT con il monitoraggio in tempo reale

Perché è necessario monitorare in remoto lo stato di integrità dell’hardware dei client negli ambienti di livello enterprise

Le aziende dipendono dalla loro infrastruttura IT. Dai dispositivi sotto specificati che esauriscono le risorse (ad esempio, RAM o spazio su disco insufficienti o CPU debole) ai guasti hardware e ai dispositivi danneggiati, il monitoraggio della integrità dell’hardware consente di risolvere in modo proattivo i problemi degli utenti finali e di garantire che la produttività non venga compromessa. Un guasto all’hardware può anche portare a problemi più dannosi, come la perdita di dati, che potrebbe causare danni reali all’azienda e potenziali problemi di conformità.

L’utilizzo delle piattaforme RMM per monitorare da remoto lo stato di integrità dell’hardware dei clienti offre agli MSP una visibilità in tempo reale sulle prestazioni dei dispositivi dei loro clienti, consentendo loro di individuare tempestivamente i segnali di allarme di un hardware insufficiente o in avaria, di risolvere i problemi prima che abbiano un impatto e di migliorare la loro reputazione con i clienti aziendali.

Le principali metriche di integrità dell’hardware da monitorare includono:

  • Utilizzo della CPU e stato termico
  • Utilizzo e disponibilità della memoria (RAM)
  • Stato del disco (stato SMART, soglie di capacità, errori I/O)
  • Tendenze di utilizzo dell’archiviazione

Per impostare le metriche di integrità dell’hardware del client attivo con la piattaforma RMM scelta, avrai bisogno di:

  • Una piattaforma RMM attiva (ad esempio: NinjaOne, N-able, Atera o Datto RMM)
  • Un agente RMM distribuito sugli endpoint di destinazione
  • Privilegi di amministratore per l’esecuzione degli script
  • Supporto PowerShell sugli endpoint monitorati

Puoi, anche, sfruttare l’accesso WMI, WinRM e/o SNMP (per i sistemi legacy) per una raccolta estesa dei dati hardware.

Metodo 1: Utilizzo dei modelli di monitoraggio hardware nativi di RMM

La maggior parte delle piattaforme RMM fornisce modelli di criteri per il monitoraggio dell’integrità dell’hardware e dell’utilizzo delle risorse. I dettagli variano a seconda dei prodotti RMM, ma in linea di massima seguono questi passaggi:

  • Vai su ‘Criteri di monitoraggio’ o ‘Modelli di condizione nello strumento RMM’
  • Crea o modifica un modello da includere:
    • Soglia di utilizzo della CPU (ad esempio, >85% per 5 minuti)
    • Soglia di utilizzo della RAM (ad esempio, >90% della memoria fisica)
    • Soglia di spazio libero su disco (ad esempio, <10% sul volume di sistema)
    • Rilevamento dei guasti SMART per le unità supportate
  • Imposta le azioni da intraprendere in caso di violazione di una soglia, come l’invio di un avviso, l’esecuzione di uno script di rimedio o l’apertura di un ticket di assistenza
  • Assegnazione del modello a dispositivi, gruppi o siti

Utilizzando la piattaforma RMM per distribuire i criteri, puoi garantire che il monitoraggio di tutti i client sia standardizzato e copra tutte le metriche richieste.

Metodo 2: Utilizzo di PowerShell per interrogare le metriche hardware

Se il tuo RMM non supporta la raccolta delle metriche richieste o se vuoi creare una soluzione personalizzata, puoi utilizzare PowerShell per accedere a informazioni granulari sull’hardware in tempo reale.

Controlla l’utilizzo della CPU in PowerShell eseguendo il comando:

(Get-Counter ‘\Processor(_Total)\% Processor Time’).CounterSamples.CookedValue

Controlla la memoria disponibile eseguendo il comando:

Get-CimInstance -ClassName Win32_OperatingSystem | Select-Object FreePhysicalMemory, TotalVisibleMemorySize

Controlla lo spazio libero e lo stato di integrità del disco eseguendo:

Get-PSDrive -PSProvider ‘FileSystem’ | Select-Object Name, Used, Free

Get-WmiObject -Namespace root\wmi -Class MSStorageDriver_FailurePredictStatus | Select PredictFailure

Se viene rilevato un problema, puoi generare un registro eventi di Windows. Questo esempio mostra la creazione di un registro se viene rilevato un utilizzo elevato della CPU:

se ($cpu -gt 85) {

Write-EventLog -LogName Application -Source “HardwareMonitor” -EventID 1501 -EntryType Warning -Message “High CPU usage detected”

}

Scrivendo nel registro eventi di Windows, puoi utilizzare RMM o altri strumenti di monitoraggio per tenere traccia di eventi specifici, fornendo una posizione centralizzata per il monitoraggio di questi eventi.

Metodo 3: Usare il Prompt dei comandi per interrogare le statistiche delle risorse

Il Prompt dei comandi di Windows può essere utilizzato per il monitoraggio di base dell’hardware, utile negli ambienti legacy o nelle piccole implementazioni in cui sono richiesti meno dettagli.

Controlla il carico della CPU (esempio di Tasklist):

tasklist /FO TABLE >> C:\Logs\task_snapshot.txt

Controlla l’utilizzo della memoria:

systeminfo | findstr /C:”Available Physical Memory”

Controlla lo spazio su disco:

wmic logicaldisk get size,freespace,caption

Se viene rilevato un problema, puoi scriverlo in un file di registro (questo esempio mostra la scrittura di un avviso di spazio ridotto su disco in un file di testo):

for /f “skip=1 tokens=2” %%A in (‘wmic logicaldisk where “DeviceID=’C:'” get FreeSpace’) do (

if %%A lss 10737418240 echo Low disk space >> C:\Logs\disk_warning.log

)

Puoi utilizzare il tuo RMM o un altro agente di monitoraggio per verificare le modifiche a questi file di registro.

Metodo 4: Uso dei Criteri di gruppo per imporre la registrazione e gli avvisi sulle risorse

I Criteri di gruppo di Windows consentono di configurare centralmente i dispositivi Windows 10 e Windows 11 collegati al dominio, compresa l’abilitazione della registrazione delle prestazioni:

  • Apri la console di gestione dei Criteri di gruppo
  • Accedi a Configurazione del computer > Modelli amministrativi > Sistema > Registri e avvisi delle prestazioni
  • Configura le impostazioni individuali per Data Collector SetsCriteri di registrazione per CPU, memoria, discoImpostazioni di audit per gli eventi di spazio su disco insufficiente

Il personale IT spreca ore per controllare manualmente lo stato dei dispositivi sulle proprie reti.

Scopri la gestione intelligente dell’IT con NinjaOne

Ulteriori considerazioni e risoluzione dei problemi

Quando si creano gli script per alimentare i dati sull’integrità dei dispositivi con la soluzione RMM, bisogna considerare anche gli ambienti virtuali. Puoi monitorare sia le prestazioni a livello di host che quelle dell’hardware virtualizzato.

Considera anche il tipo di dispositivo che desideri monitorare. I dispositivi mobili possono limitare l’accesso diretto all’hardware, mentre alcuni dispositivi di archiviazione potrebbero non supportare SMART. Inoltre, le prestazioni dei dispositivi leggeri possono essere compromesse da client RMM/monitoraggio pesanti o da polling troppo frequenti.

Gli errori più comuni nel monitoraggio dell’integrità dell’hardware del client remoto includono dati mancanti (spesso dovuti a un agente RMM inattivo), errori di script dovuti ad autorizzazioni insufficienti, conservazione inadeguata dei registri e soglie che portano a falsi positivi.

Oltre il monitoraggio dell’integrità dell’hardware con strumenti RMM intelligenti

RMM di NinjaOne offre un robusto monitoraggio dell’hardware remoto senza la necessità di una complessa configurazione di script. Include criteri di monitoraggio dell’hardware per tenere traccia dell’utilizzo di CPU, RAM e disco con avvisi basati su soglie, supporto dello stato SMART per identificare in modo proattivo i guasti dell’archiviazione dei dati, scripting personalizzato, automazione basata su avvisi e inventario dei dispositivi (compresa la raccolta delle specifiche hardware).

Tutto viene segnalato e gestito attraverso una dashboard web centrale, con avvisi unificati via e-mail o notifiche push, in modo da rilevare i problemi all’hardware prima che possano causare perdite di dati o impattare sulla produttività. Per gli MSP, questo consente di scalare e gestire più clienti, compresi più dispositivi, mantenendo team efficienti e concentrati.

Quick-Start Guide

NinjaOne offre solide capacità di monitoraggio dell’integrità dell’hardware attraverso diverse funzionalità:

1. Monitoraggio dell’integrità del dispositivo

– Il dashboard offre un widget completo per i problemi di integrità del dispositivo che tiene traccia:

– Server attualmente non funzionanti  – Dispositivi con minacce attive  – Dispositivi con patch non riuscite o in sospeso  – Dispositivi con condizioni specifiche  – In attesa di riavvio  – Stati dei lavori di backup

2. Metriche di prestazione

– NinjaOne è in grado di monitorare le prestazioni del sistema, tra cui:

– Utilizzo della CPU  – Utilizzo della memoria  – Prestazioni del disco  – Metriche di rete

3. Patch management

– La dashboard dettagliata del patch management mostra:

– Stato dell’installazione delle patch  – Patch non riuscite  – Conformità delle patch  – Dati di vulnerabilità

4. Gestione della rete

Il sistema di gestione della rete (NMS) consente il monitoraggio dello:

– Stato del dispositivo di rete  – Tempo di attività del dispositivo  – Backup della configurazione

5. Monitoraggio automatico

– Supporta la creazione di condizioni e avvisi personalizzati– Può generare notifiche in base a specifiche soglie di integrità dell’hardware

FAQs

Le metriche chiave includono

  • Utilizzo della CPU e stato termico,
  • Disponibilità di RAM,
  • integrità del disco e stato SMART,
  • tendenze di utilizzo dell’archiviazione e
  • Errori di I/O.

Il monitoraggio di questi elementi garantisce il rilevamento tempestivo dei colli di bottiglia delle prestazioni e dei potenziali guasti hardware.

Le piattaforme RMM forniscono agli MSP visibilità in tempo reale sui dispositivi dei clienti, automatizzano i controlli sullo stato di integrità dell’hardware, attivano avvisi in caso di superamento delle soglie e consentono di rimediare da remoto, aiutando gli MSP a scalare le loro operazioni mantenendo la qualità del servizio.

Sì. Gli script PowerShell possono monitorare il carico della CPU, l’utilizzo della memoria, lo spazio su disco e lo stato SMART. I risultati possono essere scritti in registri o file di eventi, che gli agenti RMM possono monitorare per la creazione di report e avvisi centralizzati.

I modelli di monitoraggio RMM nativi standardizzano i criteri su tutti i dispositivi, riducono i tempi di configurazione e garantiscono la coerenza. Inoltre, si integrano direttamente con gli avvisi automatici e i flussi di lavoro di bonifica.

Le sfide tipiche includono

  • agenti RMM inattivi,
  • autorizzazioni insufficienti per gli script,
  • falsi positivi dovuti a soglie impostate male e
  • registri mancanti da periodi di conservazione brevi.

La soluzione di questi problemi garantisce un monitoraggio affidabile.

Sì. Le piattaforme e gli script RMM possono tracciare sia le prestazioni a livello di host che l’utilizzo dell’hardware delle singole macchine virtuali, garantendo la visibilità delle infrastrutture IT virtualizzate e ibride.

Sei pronto a prendere il controllo del tuo monitoraggio hardware? Visita la pagina domande frequenti su NinjaOne RMM per saperne di più sull’implementazione, i prezzi e le funzionalità, oppure inizia oggi stesso la tua prova gratuita .

Ti potrebbe interessare anche

Pronto a semplificare le parti più complesse dell'IT?