Pontos principais
- O que é RTO? O objetivo de tempo de recuperação (RTO) é o tempo máximo aceitável de inatividade após uma interrupção antes que os sistemas e as operações sejam restaurados para evitar um impacto significativo nos negócios.
- Diferenças entre RTO e RPO: Enquanto o RTO se concentra na rapidez com que os sistemas devem voltar a ficar on-line após um incidente, o RPO se concentra na quantidade de perda de dados aceitável.
- Benefícios de RTO e RPO para MSPs: Metas claras de RTO e RPO ajudam os MSPs a definir expectativas, projetar estratégias confiáveis de backup e recuperação de desastres e atender aos SLAs, minimizando o tempo de inatividade e a perda de dados para os clientes.
- Como o RTO e o RPO são definidos: Os valores de RTO e RPO são estabelecidos por meio da análise de impacto nos negócios (BIA) e da avaliação de riscos, levando em conta a criticidade operacional, o impacto financeiro e a tolerância do cliente em relação ao tempo de inatividade ou à perda de dados.
- Considerações sobre custos e compensações: RTOs e RPOs mais curtos normalmente exigem maior investimento em backup, recuperação e infraestrutura, o que torna essas métricas essenciais para equilibrar resiliência, custo e lucratividade.
Os MSPs têm o dever para com seus clientes de minimizar o tempo de inatividade e mantê-los on-line e totalmente operacionais. Com esse objetivo, a preparação para o inesperado ajuda a minimizar o tempo de inatividade. Definir metas para resolver problemas e voltar a ficar on-line é fundamental para reduzir o tempo de inatividade do cliente.
O objetivo de tempo de recuperação (RTO) e o objetivo de ponto de recuperação (RPO) desempenham um papel fundamental no processo de planejamento de recuperação de desastres. Os provedores de serviços gerenciados devem examinar cada uma dessas métricas, definir sua função no processo de recuperação e trabalhar para incluir esses objetivos nos planos de resiliência de seus clientes.
O que este artigo abordará:
- O que são RTO e RPO?
- As diferenças entre RTO e RPO
- Por que o RTO e o RPO são importantes para os provedores de serviços gerenciados
- Como calcular o RTO e o RPO
- Como as ferramentas de TI ajudam você a atingir os objetivos de recuperação
O que é uma RTO?
O objetivo de tempo de recuperação (RTO) define os parâmetros para a rapidez com que uma empresa deve recuperar seus sistemas do tempo de inatividade após um incidente. Isso é calculado para cada cliente individual e é exclusivo de sua operação.
A definição de um RTO permite que você tome decisões mais informadas sobre soluções e implementação de backup e recuperação de desastres (BDR). Com números concretos, é mais fácil manter as coisas realistas e baseadas em objetivos, em vez de confiar em uma ideia ambígua como “fazer com que eles voltem a funcionar o mais rápido possível”. Essas generalizações são difíceis de definir nos contratos de nível de serviço.
É fácil visualizar um RTO em ação. É simplesmente uma meta definida pela análise dos custos e riscos associados ao tempo de inatividade (é bom definir o que significa “tempo de inatividade” para o cliente específico) e determinar quanto tempo eles podem esperar para se recuperar antes que as perdas se tornem significativas.
Alguns fatores que podem influenciar o RTO de um usuário incluem:
- Quanto de receita a empresa perderá por cada hora de tempo de inatividade
- Quanto de perda financeira eles podem ou querem absorver durante uma emergência
- A disponibilidade dos recursos necessários para restaurar as operações
- A tolerância de seus próprios clientes ao tempo de inatividade
Se um cliente precisa que seus sistemas funcionem em três horas, esse é o seu RTO. Se o tempo médio calculado para a recuperação real for de cinco horas, o RTO foi excedido em duas horas. Como esse é um cálculo preparatório, ele indica que mais investimentos precisam ser feitos em BDR para reduzir o tempo real de recuperação.
O que é um RPO?
O objetivo de ponto de recuperação (RPO) é um limite de risco/perda semelhante. Enquanto o RTO define a quantidade de tempo que pode ser perdida, o RPO define a quantidade de dados que seu cliente pode perder sem resultados significativos ou catastróficos.
Isso se concentra principalmente na cadência do backup de dados: a frequência do último ponto de backup. Se o seu cliente perdesse tudo agora mesmo e não tivesse nada além do último backup, quantos dados essenciais ele ainda teria?
Muitos usam as operações de saúde como exemplo de RPO. Embora algumas empresas possam se dar ao luxo de perder todos os dados que inserem ao longo de uma semana, graças à disponibilidade de documentos em papel, os hospitais geralmente não têm essa margem de erro. Com dezenas de profissionais médicos distribuindo milhares de medicamentos todos os dias, há muito pouca chance de que a equipe se lembre de tudo o que fez ou precisa fazer em relação ao tratamento.
E, como estamos falando de produtos farmacêuticos, a perda de um dia sequer de dados pode significar a confusão de doses ou a mistura de medicamentos. Esses são problemas potencialmente fatais, portanto, uma operação desse tipo precisa fazer backup de seus dados com frequência. Essa necessidade de dados atualizados informa seu RPO.
Os RPOs são importantes para o MSP porque ajudam a orientar suas recomendações de soluções de backup de dados, especialmente no que se refere ao espaço e à modalidade de armazenamento. Backups mais frequentes significam mais uso de dados. É importante que os clientes entendam por que o RPO é importante ao explicar o valor desse custo adicional.
Alguns fatores que podem influenciar o RPO de um cliente incluem:
- Complexidade e número de aplicativos e sistemas críticos
- Volume de dados e requisitos de acesso
- Com que frequência os dados são alterados (ou seja, com que frequência informações importantes são adicionadas ou alteradas em um arquivo)
- Método e frequência de backup de dados
Atinja os objetivos de RTO e RPO e minimize o tempo de inatividade com o NinjaOne.
Qual é a diferença entre RTO e RPO?
Ambas as métricas são importantes ao formular planos de backup e recuperação de dados. O RPO e o RTO o ajudarão a decidir sobre os principais recursos de backup e recuperação e informarão suas recomendações sobre as soluções de BDR do cliente. Em última análise, sua meta é garantir que os dados e sistemas essenciais estejam disponíveis quando necessário, e esses cálculos podem ajudá-lo a atingir essa meta.
Embora ambos sejam funcionais no planejamento de recuperação, são diferentes na prática. As RTOs ativas normalmente são designadas após a ocorrência de um evento (excetuando aquelas usadas teoricamente durante o planejamento). Os RPOs são sempre determinados antes que a recuperação seja necessária.
Em alguns casos, o planejamento da recuperação se concentra nos sistemas e não nos dados. Nessas situações, a única preocupação é a RTO. Assim que os dados se tornarem parte da equação, o MSP desejará calcular e levar em conta o RPO. Vale a pena observar que, quando os dois são combinados, um RTO curto geralmente requer um RPO igualmente curto.
Cálculo de RPO e RTO
Normalmente, você determinará as metas relevantes de RTO e RPO durante uma análise de impacto nos negócios (BIA) ou uma análise geral de riscos.
Ao usar uma BIA, seu objetivo é identificar os processos de negócios essenciais e as tecnologias e os dados necessários para dar suporte a essas operações. Esses relatórios geralmente consideram as implicações financeiras do tempo de inatividade ou da interrupção e ilustram os possíveis riscos de inatividade.
Em geral, o MSP buscará a contribuição da liderança do cliente ou da gerência sênior relevante para identificar objetivos e atribuir valores numéricos aos cenários de recuperação. Você pode começar explorando os cenários de melhor e pior caso e trabalhar de trás para frente para encontrar números atingíveis e razoáveis.
Não existe uma fórmula padrão para calcular os valores de RTO/RPO, pois eles são valores numéricos de tempo exclusivos de cada organização. Um servidor crítico pode ter um RTO de uma hora, enquanto o RTO de um sistema menos crítico pode ser de 24 horas. Todo o propósito da BIA é determinar objetivos razoáveis com base na necessidade de vários sistemas para o usuário.
À medida que o RTO e o RPO diminuem, os custos envolvidos para atingir esses objetivos provavelmente aumentarão. Nesse sentido, os cálculos de RTO/RPO fornecem as informações de que você precisa para pesquisar soluções e pontos de preço. Ter essas informações permite que os tomadores de decisão tomem decisões mais informadas quando se trata de manter seus contratos lucrativos.
Os valores de BIA e RTO/RPO podem ser úteis durante o processo de vendas. Os conflitos geralmente surgem em relação aos custos, portanto, é importante poder demonstrar o valor dos serviços de BDR. Isso é mais fácil de apontar quando se mostra que soluções mais baratas não atenderiam às necessidades de RTO/RPO e resultariam em custos maiores em caso de desastre.
Como a NinjaOne ajuda os MSPs a cumprir RTOs e RPOs
Com base nos resultados de sua análise de risco e BIA, você deve ter uma boa ideia do que poderia colocar seu cliente em risco. Parte da análise geral é determinar a frequência das ocorrências, a probabilidade do perigo e os possíveis efeitos que elas podem ter sobre o cliente.
Depois de quantificar essas métricas baseadas em riscos, você pode traduzir esses fatores em ativos e medidas recomendados. Um hub centralizado de monitoramento e gerenciamento remoto como o NinjaOne torna esses dois processos muito mais simples. Ao agregar dados sobre ativos e utilização importantes do cliente, você pode obter insights mais profundos ao determinar o RPO e o RTO.
Naturalmente, o fato de a BDR ser fundamental para o uso das métricas de RTO/RPO significa que a solução de backup integrada da NinjaOne o ajudará a enfrentar o desafio sem problemas, não apenas a avaliá-lo.
Agregando valor com a análise de impacto nos negócios (BIA)
Compreender o RTO e o RPO é fundamental para estabelecer um plano sólido de recuperação de desastres, mas essas métricas se tornam ainda mais poderosas quando usadas em conjunto com uma análise de impacto nos negócios (BIA). Uma BIA prevê as consequências da interrupção das funções e dos processos de negócios, permitindo que as empresas desenvolvam estratégias de recuperação abrangentes.
O BIA identifica os impactos operacionais e financeiros que podem resultar de uma interrupção. Esses impactos podem variar desde a perda de vendas e receitas até o aumento de despesas como horas extras, multas regulatórias e até mesmo insatisfação ou deserção de clientes. Também leva em conta o momento e a duração da interrupção, pois o momento em que uma função ou processo comercial é interrompido pode afetar significativamente a perda sofrida.
O custo real da recuperação
Ao discutir a recuperação, é fundamental considerar o custo da recuperação. Esses custos devem ser comparados com os possíveis impactos de uma interrupção, conforme determinado pela BIA. O relatório da BIA deve priorizar a restauração dos processos de negócios que tenham os maiores impactos operacionais e financeiros. É importante observar que, à medida que o RTO e o RPO diminuem, os custos envolvidos para atingir esses objetivos provavelmente aumentarão.
Tipos de desastres e planos de contingência
Os desastres que podem interromper as operações comerciais podem ocorrer de várias formas, como danos físicos a edifícios, quebra de máquinas, acesso restrito a um local, interrupção da cadeia de suprimentos, interrupções de serviços públicos e até mesmo absenteísmo de funcionários essenciais. Por isso, é importante ter planos de contingência adaptados a diferentes tipos de desastres. Esses planos devem ser informados pelos resultados da BIA e das RTOs e RPOs definidas.
Testes e ensaios de planos de recuperação de desastres
Depois de identificar RTOs e RPOs, realizar uma BIA e criar planos de contingência, é fundamental testar e ensaiar essas estratégias de recuperação de desastres. Testes regulares garantem que seus planos sejam eficazes e lhe dão a chance de refinar suas estratégias com base nos resultados. Também é uma boa maneira de garantir que todas as partes interessadas estejam familiarizadas com suas funções durante um cenário de recuperação real.
Importância das relações com os fornecedores
Os fornecedores desempenham um papel importante nos planos de recuperação de desastres. É fundamental estabelecer relacionamentos sólidos com fornecedores que possam fornecer os serviços e recursos necessários durante um processo de recuperação. Talvez você precise contar com esses fornecedores para restaurar os serviços, oferecer soluções alternativas ou até mesmo fornecer recursos para um local temporário. Confira os principais fornecedores de software de backup e recuperação de dados para sua equipe de TI.
RTO e RPO são métricas importantes que orientam o desenvolvimento de seu plano de recuperação de desastres. Entretanto, eles não devem ser usados isoladamente. Ao realizar uma BIA completa, considerando o custo da recuperação, preparando-se para vários tipos de desastres, testando e ensaiando seus planos e construindo relacionamentos sólidos com fornecedores, você pode criar uma estratégia de recuperação de desastres robusta e confiável.
Veja como o NinjaOne ajuda os MSPs e as empresas a atingir metas críticas de RTO e RPO.
Conclusão
Há duas métricas que ajudam os MSPs a obter os melhores resultados quando se trata de backup e recuperação de dados: Objetivo de tempo de recuperação e objetivo de ponto de recuperação. Ambas as métricas são essenciais e inter-relacionadas quando se trabalha com soluções de backup e recuperação de dados, estratégias de continuidade de negócios e planos de recuperação de desastres.
Para os MSPs que fornecem backup e recuperação de dados, essas métricas são essenciais para planejar e agregar valor à solução. Cada RTO/RPO ajuda a determinar a configuração ideal de backup de dados e tecnologia para atingir suas metas. Esses números também podem ser importantes para a conformidade e a auditoria, pois os auditores podem procurar evidências desses valores como parte dos controles de backup/recuperação de dados marcados.
A NinjaOne pode ajudá-lo a obter, calcular e utilizar o RPO/RTO para seus clientes, garantindo que você forneça o melhor serviço e atenda às expectativas quando se trata de tempo de atividade e continuidade operacional.