Table des matières :
- Introduction
- Surveillance de l'intégrité des appareils
- Surveillance du disque
- Surveillance des applications
- Surveillance du réseau
- Contrôle de la sécurité
- 4 clés pour améliorer votre surveillance
- Bonnes pratiques pour la gestion des tickets et les alertes
Ce guide fournit des recommandations pour l'élaboration de votre stratégie de surveillance des terminaux et des alertes, ainsi que des instructions étape par étape pour créer plus de 30 conditions personnalisées de surveillance des terminaux dans NinjaOne.
Introduction
À quoi ressemble une bonne surveillance ?
La surveillance et les alertes sont essentielles à l'utilisation efficace d'un RMM. De bonnes pratiques de surveillance vous permettent d'identifier les problèmes de manière proactive, de les résoudre plus rapidement et d'être plus efficace. Un meilleur suivi peut également jouer un rôle clé dans la génération de revenus supplémentaires et la satisfaction de vos clients.
Le plus dur consiste à savoir ce qu'il faut surveiller, ce qui nécessite une alerte, les problèmes qui peuvent être résolus automatiquement et ceux qui nécessitent une intervention manuelle. Acquérir ces connaissances peut parfois prendre des années, et même les meilleures équipes peuvent encore avoir du mal à réduire la lassitude face aux alertes et les tickets non pertinents sur les appareils des clients.
C'est pour cela que nous vous avons préparé une liste de plus de 25 conditions à surveiller, dans le but d'aider celles et ceux qui se lancent à être opérationnels plus rapidement et à moins s'éparpiller. Ces recommandations sont basées sur les suggestions de nos partenaires et sur l'expérience de NinjaOne en matière d'assistance auprès des MSP lors de l'implémentation d'une surveillance efficace et exploitable.
Pour chaque condition, nous décrivons ce qui est surveillé, comment configurer le moniteur dans NinjaOne et quelles actions doivent être entreprises si la condition est déclenchée. Certaines suggestions de surveillance sont concrètes, tandis que d'autres peuvent nécessiter une légère adaptation à votre cas d'utilisation.
Ces idées de surveillance ne sont évidemment pas exhaustives et peuvent ne pas s'appliquer à tous les cas de figure possibles. Une fois que vous aurez commencé à implémenter votre surveillance sur la base de ces suggestions, vous devrez élaborer une stratégie de surveillance plus personnalisée et plus efficace, spécifique à vos clients et à leurs besoins. Vous trouverez également à la fin de ce guide des recommandations supplémentaires pour vous aider dans vos effort et faire de la surveillance, des alertes et de la gestion des tickets un avantage concurrentiel pour votre MSP.
Surveillance de l'intégrité des appareils
Surveiller les événements critiques continus |
|
Identifier le redémarrage involontaire d'un appareil |
|
Identifier les appareils nécessitant un redémarrage |
|
Surveiller les terminaux hors ligne |
|
Surveiller les changements de matériel |
|
Surveiller l'utilisation élevée et prolongée du processeur |
|
Surveillance du disque
| Surveiller les potentielles défaillances du disque |
|
| Identifier quand l'espace disque approche de sa capacité limite |
|
| Surveiller les défaillances potentielles du RAID |
|
| Surveiller l'utilisation élevée et prolongée du disque |
|
| Surveiller le taux d'activité élevé du disque |
|
| Surveiller l'utilisation de la mémoire |
|
Surveillance des applications
| Identifier si les applications requises existent sur un terminal |
|
| Contrôler si les applications critiques fonctionnent (en particulier pour les serveurs) |
|
| Surveiller l'utilisation des ressources pour les applications connues pour causer des des problèmes de performance |
|
| Surveiller les plantages d'application |
|
Surveillance du réseau
| Surveiller l'utilisation inattendue de la bande passante |
|
| S'assurer que les appareils du réseau sont opérationnels |
|
| Contrôler les ports ouverts |
|
| Surveiller la disponibilité du site web du client |
|
Contrôle de la sécurité
| Déterminer si le pare-feu Windows a été désactivé |
|
| Déterminer si des outils antivirus et de sécurité sont installés et/ou fonctionnent sur un terminal |
|
| Surveillance des menaces AV/EDR non intégrées détectées |
|
| Contrôle des échecs de connexion utilisateur |
|
| Surveiller la création, l'élévation ou la suppression d'utilisateurs sur un terminal |
|
| Identifier si les disques d'un terminal sont chiffrés/non chiffrés |
|
| Surveiller les échecs de sauvegarde (NinjaOne Backup) |
|
| Surveiller les défaillances des sauvegardes (autres fournisseurs de sauvegardes) |
|
4 clés pour améliorer votre surveillance
- Créez un modèle de base pour le contrôle de l'état des appareils.
- Discutez avec les clients de leurs priorités.
- Quels sont les serveurs et les postes de travail importants ?
- Quelles sont les applications essentielles
à leur activité ou à leur productivité ? - Quels sont leurs points faibles en informatique ?
- Surveillez votre PSA/système de gestion des tickets pour détecter les problèmes récurrents.
- Ajustez les alertes pour éviter les tickets non pertinents.
- Contrôlez les journaux d'événements des clients pour détecter les problèmes récurrents.
Bonnes pratiques pour la gestion des tickets et les alertes
- N'alertez que sur des informations exploitables : si vous n'avez pas de réponse spécifique associée à un moniteur, ne le surveillez pas.
- Classez vos alertes en fonction des différents tableaux de service de votre PSA.
- Organisez régulièrement des réunions pour discuter du nettoyage des alertes.
- Quelles sont les alertes qui déclenchent le plus d'alertes ? Peut-on les supprimer ou en réduire le champ d'application ?
- Qu'est-ce qui n’est pas surveillé ou ne crée pas de notifications alors que cela devrait être le cas ?
- Quelles sont les alertes courantes qui peuvent faire l'objet d'une remédiation automatique ?
- Y a-t-il des projets à venir susceptibles de générer des alertes ?
- Nettoyez vos tickets et envoyez des alertes lorsqu'ils sont résolus.
- Dans NinjaOne, de nombreuses conditions disposent d'une option « Réinitialiser lorsque ce n'est plus vrai » ou « Réinitialiser lorsque ce n'est pas vrai pendant une période x » pour vous aider à résoudre et à nettoyer les notifications qui peuvent se résoudre d'elles-mêmes.