Não é segredo para ninguém que as empresas estão cada vez mais dependentes de tecnologia da informação, para manter uma boa produtividade, garantir o fluxo de trabalho e armazenamento de dados — procedimentos que são primordiais para uma boa gestão orientada a dados. Diante disso, é essencial ter um plano de Disaster Recovery.

Afinal, se não for reparada com agilidade, qualquer avaria na infraestrutura pode travar toda uma cadeia produtiva. E, por mais que alguns problemas corriqueiros sejam de simples resolução, existem situações imprevisíveis, que fogem do controle humano e que dependem de um plano de Disaster Recovery, para que causem o menor impacto possível na infraestrutura e na receita da empresa.

Estamos falando de desastres naturais, como tempestades, inundações, enchentes, furacões e outros fenômenos da natureza. Dentro do escopo dos desastres, podemos colocar também situações extraordinárias, que fogem do controle dos gestores, como ataques, sabotagens, falhas humanas e acidentes, que danificam os equipamentos.

Por mais que tentemos diminuir a margem de erro, os incidentes não avisam quando estão na iminência de acontecer. Quando acontecem, é necessário que seja garantido o pleno restabelecimento do sistema, permitindo à empresa uma oportunidade de continuar as suas atividades, sem maiores danos, com a recuperação dos dados e do sistema.

Neste post, você conhecerá 6 aspectos relevantes sobre Disaster Recovery, do conceito ao checklist para a sua execução? Confira!

1. O que é Disaster Recovery?

Quando falamos sobre Disaster Recovery, ou recuperação de desastres, em português, estamos nos referindo aos planos que definem os procedimentos relativos aos incidentes que comprometem as operações de TI, tais como sabotagens, fenômenos naturais, incêndios, vandalismos, acidentes, ataques, entre outros.

O objetivo aqui é o restabelecimento das operações, com as menores sequelas possíveis, de forma ágil e com o menor custo, preservando a produtividade da empresa atingida e garantindo a segurança dos dados.

Existem duas métricas importantes que devem ser avaliadas quando o assunto é Disaster Recovery. Esses indicadores devem ser calculados com base nas prioridades da empresa em relação à continuidade de suas operações e na criação do customer onboarding. Confira a seguir.

RTO — Recovery Time Objective

RTO é a métrica que está relacionada ao tempo máximo que o sistema levará para ficar disponível após um desastre. Dentro desse tempo, está incluído orestore de dados, reinstalações, atualizações e outras operações necessárias para a plena recuperação do sistema.

O cálculo deverá ser feito com base no período de tolerância, ou seja, o tempo que a empresa consegue ficar com o sistema parado, sem afetar sua segurança e a produtividade. Com essa estimativa em mãos, a gestão de TI terá a base para a criação de soluções ágeis, sabendo quais ferramentas utilizar, para que a recuperação seja executada no tempo programado.

O cálculo do RTO é importante também para que os profissionais de TI possam pensar na criação de alternativas, caso não seja possível cumprir o prazo inicial.

RPO — Recovery Point Objective

O RPO está relacionado à margem de perda de dados que uma empresa pode ter em caso de desastres, sem que as operações vitais para o bom andamento da corporação sejam afetadas. Em resumo, podemos dizer que o RPO está diretamente ligado à periodicidade dos backups.

Por exemplo, se a empresa realiza o backup todos os dias às 15h e acontecer uma pane às 7h, o ponto de recuperação será às 15h do dia anterior, ou seja, temos um RPO de 24 horas. Se a empresa executa essa atividade duas vezes por dia, estamos falando de um RPO de 12 horas.

2. Por que um gestor de TI precisa se preocupar com essa política?

Agora que você já conhece o conceito de Disaster Recovery e suas principais métricas para a recuperação de um sistema, está na hora de entender melhor os motivos pelos quais uma empresa deve adotar o quanto antes a essa política. Confira.

Garantir a disponibilidade e segurança do ambiente

O principal motivo da elaboração de um plano de Disaster Recovery é a manutenção da disponibilidade do ambiente de TI. É o plano de recuperação de desastres que resguarda o sistema de incidentes que fogem do controle da equipe de TI, e que são inevitáveis. Podemos dizer que essa política é uma necessidade e não uma opção.

São problemas que podem trazer sérios prejuízos, desde a recompra de equipamentos, perdas produtivas que diminuem a receita e geram custos, até perdas milionárias, com o vazamento de dados estratégicos.

Trabalhar com foco na prevenção

Provavelmente, você já ouviu aquele ditado: “prevenir é sempre melhor do que remediar”. O ideal é que seja feita uma análise da infraestrutura física onde a empresa está instalada, a parte elétrica, condições da estrutura etc. Outro fator importante é a avaliação geográfica, analisando o histórico de alagamentos, incidência de raios, possibilidade de chuvas torrenciais entre outros.

Tudo isso deve ser verificado previamente, para que o gestor ou fornecedor de TI consiga mostrar para os gestores da empresa que o Disaster Recovery não representa um custo adicional no orçamento, e sim um investimento.

É uma maneira de fazer com que a empresa mantenha a sua produtividade, pois os acidentes e a ação de pessoas mal-intencionadas não chegam com hora marcada. Além disso, evitar problemas é sempre mais eficaz e barato do que correr atrás do prejuízo.

3. Quais ameaças devem ser combatidas?

A seguir, entenda melhor quais são as principais ameaças que podem causar incidentes nos ambientes de TI e que justificam o investimento em um plano de recuperação de desastres.

Interrupção no fornecimento de energia

Não estamos falando de uma ameaça pouco plausível. Todo mundo já enfrentou problemas relacionados à falta de energia, seja em casa, seja no ambiente de trabalho. Essas quedas podem ser causadas pelos mais diversos motivos, que vão desde problemas no próprio sistema elétrico até desastres naturais.

A queda de energia em empresas que não possuem sistemas emergenciais, como geradores, baterias ou fontes alternativas, pode causar problemas de perda produtiva e de prazos de entrega, o que refletirá na receita do negócio. Porém, esse é dos males o menor.

O grande problema que uma queda abrupta de energia pode causar são os danos aos equipamentos, que ocasionam a perda das informações que não são salvas de forma automática.

Quando a queda de energia é ocasionada por curto-circuito, os danos podem ser bem maiores, inutilizando máquinas e trazendo enormes prejuízos, que poderão ser amenizados com um plano de recuperação de desastres.

Furtos e assaltos

Quando falamos da infraestrutura TI de uma empresa, a preocupação em relação à segurança envolve várias raízes. Além da insegurança natural, que, infelizmente, vivemos em nosso país, toda empresa carrega um bem valiosíssimo em seus servidores: os dados. As informações estratégicas podem valer milhões de reais.

Por isso, dentro do plano de recuperação de desastres, deve-se ter uma preocupação especial em relação a furtos e roubos de equipamentos de TI na empresa.

Não podemos nos esquecer de que, além das informações privilegiadas que poderão ser furtadas, estamos falando de equipamentos caros e primordiais para a empresa, e que, se roubados, deverão ser repostos, gerando mais custos à corporação.

Segurança da informação

Ainda no tema segurança, falamos no tópico acima sobre roubos de dispositivos. Agora, vamos falar sobre outro tipo de ameaça, que é muito mais perigosa, porque chega sem fazer alarde: os ataques cibernéticos.

Todos sabemos que, mesmo com todos os cuidados e planos de segurança, existem pessoas mal-intencionadas que se dedicam a burlar os mais aprimorados sistemas de segurança. O plano de recuperação de desastres deve estar preparado para esse tipo de situação.

Aliás, uma das práticas criminosas mais recorrentes é o sequestro de informações com os ransomwares, em que os meliantes pedem um valor em dinheiro para devolverem os dados. Um sistema confiável de recuperação de arquivos ajuda na prevenção desse tipo de crime.

Pane nos equipamentos

Toda máquina está sujeita a algum tipo de pane, independentemente de quão sofisticada ela seja. Superaquecimento, lentidão, travamentos, defeitos de fabricação, curtos-circuitos, enfim, poderíamos fazer um texto só com as possíveis avarias que um dispositivo pode ter.

Quando um equipamento crítico falha, o primeiro resultado é a parada produtiva e, dependendo da gravidade do dano, o dispositivo pode ser inutilizado. Se não houver um plano de backup e recuperação, todos os dados armazenados no dispositivo avariado poderão ser perdidos.

Acidentes naturais

Muita gente utiliza os desastres naturais para transferir responsabilidades quando ele provoca problemas sérios a uma infraestrutura empresarial. Boa parte dos eventos ambientais acontece com uma certa periodicidade, como nas cidades que sempre têm problemas de energia ou inundação quando chove.

Nesses casos, seus impactos podem ser estudados com antecipação, permitindo aos gestores traçar planos de prevenção. Porém, quando falamos de fenômenos naturais inesperados, como chuvas torrenciais, quando, em um único dia, chove o previsto para um mês, furacões, enchentes causadas por trombas d’água ou rompimento de barragens, estamos falando do imprevisível.

Fator humano

Por mais capacitado que um profissional seja, como todo ser humano, ele é passível de erros, que podem gerar pequenos estragos ou danos irreversíveis. Além disso, há sempre o risco de ataques internos, em que profissionais mal-intencionados ou querendo se vingar da empresa, por exemplo, sabotam o próprio sistema.

4. Existem exemplos conhecidos de Disaster Recovery?

Para que você possa ter uma dimensão da diferença que faz uma boa política de recuperação de desastres para bom funcionamento do sistema de uma empresa, vamos apresentar um caso que aconteceu em uma gigante do entretenimento e que pode ter custado milhões de dólares. Acompanhe!

O desaparecimento do Xerife Woody

Uma das maiores e mais conceituadas empresas de animação do mundo, a Pixar, quase teve que adiar a estreia de um de seus maiores sucessos, o segundo filme da franquia Toy Story. O filme, que foi lançado em 1999, quase não saiu, porque apagaram os arquivos antes da finalização — tudo por causa de uma simples linha de comando.

Tudo aconteceu quando um colaborador não identificado da empresa, ainda no ano de 1998, escreveu uma linha de comando nos diretórios em que o filme estava armazenado. Detalhe: a função do código era formatar o diretório de forma rápida.

O resultado desse ato foi a perda de várias partes do filme, sendo que quase 90% dele foi apagado — cenários, sequências, acessórios de personagens e muito mais. Para piorar, o backup do sistema falhou e a empresa não tinha uma outra cópia do filme.

O estrago só não foi maior porque uma funcionária, que trabalhava no regime home office, tinha uma cópia do filme em sua máquina, não tão completa, mas que diminuiu consideravelmente a necessidade de reconstrução — sim, uma funcionária salvou uma empresa milionária de um prejuízo maior, por falta de um plano de recuperação de desastres.

Só a partir desse incidente é que a Pixar tomou medidas preventivas, criando cópias de segurança e adotando um plano completo de recuperação de desastres.

5. Como montar um plano de Disaster Recovery e continuidade de negócios?

Bem, já sabemos o que é Disaster Recovery e os danos que sua ausência pode causar a um ambiente de TI. Para ajudar você nesse quesito, mostraremos a seguir alguns passos para que possa montar um plano de recuperação de desastres em sua empresa.

Entenda a recuperação de desastres como medida preventiva

O Disaster Recovery é uma medida preventiva e proativa, e não reativa. Por mais que você encare o desastre como algo que peça uma reação imediata, o plano deve ser sempre proativo, buscando resolver os problemas. Ter isso em mente é de extrema importância para começar a elaboração do planejamento sem perder o foco principal e não deixar o setor se tornar um “apagador de incêndios”.

Estamos falando de TI, no primeiro momento, mas não podemos nos esquecer de que existe um negócio em jogo, investimentos, colaboradores, fornecedores, sócios, clientes, enfim, toda uma cadeia que gira em torna de uma empresa e que pode ser quebrada por um desastre, que poderia ser prevenido.

Por isso, o primeiro passo é identificar todos os riscos — tanto os físicos, ambientais e os internos quanto os que estão dentro da infraestrutura de TI, que abrem vulnerabilidades para invasões sorrateiras de hackers, por exemplo.

Assim, a empresa começará o plano de recuperação de desastres identificando suas vulnerabilidades e podendo ter um ponto de partida para garantir a segurança das informações.

Avalie da infraestrutura de TI

É necessário que todos os ativos de TI estejam mapeados — hardwares, softwares, dados, redes etc. Com esse mapeamento em mãos, o gestor deverá fazer uma avaliação refinada de toda a infraestrutura de TI, para se aprofundar sobre as reais condições.

Um dos principais objetivos dessa avaliação é identificar os elementos que estão em pleno funcionamento e separá-los daqueles que estão parados ou sendo subutilizados, pois esses geralmente estão desatualizados e podem se tornar uma entrada para as ameaças cibernéticas, além de gerar gastos sem entregar nada.

Integre os setores

Para que o plano de recuperação de desastre seja plenamente executado, é necessário que todos os setores estejam inteirados e participem ativamente dos processos relacionados à segurança da informação.

É importante que os usuários saibam os procedimentos de armazenamento correto dos dados e como utilizar as tecnologias, de forma intuitiva. Todos eles devem estar cientes da importância das atualizações e dos riscos que podem ocorrer no ambiente de TI, para que possam notificar com rapidez qualquer avaria.

Crie uma equipe de gestão de crises

É recomendável a criação de uma equipe de gestão de crises, para ficar responsável por efetuar as ações planejadas e demais soluções de problemas. Isso aumentará consideravelmente a eficiência das ações referentes ao Disaster Recovery.

Essa equipe deverá se submeter a um processo de qualificação, para que todos estejam plenamente capacitados para lidar com as avarias. Ficarão também responsáveis pela identificação das perdas, recuperação dos dados, recuperação dos hardwares, ou redução dos danos.

Conte com ajuda profissional

Nem sempre a empresa conta com uma equipe interna, com a expertise para lidar com um planejamento tão complexo, o que pode comprometer o trabalho. Nesse cenário, é interessante a contratação de um profissional especializado. Em certos casos, a terceirização da gestão da infraestrutura de TI será a melhor solução.

É aí que o fornecedor de TI encontra uma excelente oportunidade, principalmente, quando a sua empresa tem credibilidade e know-how, com as ferramentas e profissionais capacitados.

Assim, será possível oferecer para o cliente o melhor plano de recuperação de desastres, mostrando que ele economizará, por não ter a necessidade de fazer um investimento pesado em contratação e poderá ficar livre para cuidar de outras áreas da empresa.

Revise frequentemente o plano

No mundo da tecnologia da informação, as mudanças acontecem bem mais rápido do que na “vida real”. Softwares e dispositivos ficam obsoletos rapidamente, da mesma forma que soluções de segurança costumam ter um prazo de validade. As pessoas mal-intencionadas estão sempre em busca de burlar os protocolos de segurança, sendo que boa parte delas é especialista e domina técnicas refinadas.

Por isso, é necessário revisar periodicamente o plano de recuperação de desastres, garantindo que ele ainda está apto a cobrir todas as possibilidades de ameaças e invasões. Além disso, as empresas estão sempre em busca de um crescimento, e o plano deve acompanhar essa escalabilidade.

6. Como fazer um checklist de Disaster Recovery?

Confira a seguir um exemplo de checklist de Disaster Recovery, para que você tenha mais agilidade, dinamismo e expertise na elaboração de seu plano de recuperação de desastres.

Você pode adaptá-lo às necessidades de sua empresa, mas é importante considerar todos os pontos abordados aqui, para que as suas chances de sucesso sejam maiores.

Lembrando que a elaboração do plano não é nenhum bicho de sete cabeças, mas exigirá comprometimento, empenho e técnica, tanto para o gestor quanto para os usuários do sistema. Confira o checklist a seguir.

Programe backups periódicos

É importante definir a hierarquia, identificando quais dados e sistemas têm relação direta com o núcleo do negócio e, portanto, sua perda causaria danos maiores à empresa. Não é que você não deva se preocupar com os outros, mas, efetivamente, em caso de desastres, devemos primeiro nos ater às prioridades.

Programe backups diários e automatize o processo, com o auxílio de uma ferramenta de gestão. Não ignore a computação em nuvem, pois ela é escalável e oferece a redundância, o que é essencial quando falamos de desastres.

Tenha fontes alternativas de energia e internet

Os velhos e bons no-breaks ainda “salvam a vida” de várias empresas quando acontecem as fatídicas interrupções momentâneas de fornecimento de energia elétrica. Para as empresas de grande porte, é interessante contar com geradores ou com fontes de energias limpas, como a solar, acompanhada de uma bateria de alta capacidade.

Em relação ao fornecimento de internet, nunca fique preso a apenas uma operadora, por melhor que ela seja. Como a maioria das empresas está com boa parte de sua infraestrutura na nuvem, a internet é primordial para garantir a disponibilidade.

O ideal é que a empresa diversifique o meio em que recebe a internet, por exemplo, com a contratação de um provedor via fibra óptica e outro via satélite. Isso porque, caso aconteça algum problema em um poste e a empresa trabalhe com duas operadoras via fibra óptica, poderá perder as duas fontes.

Prepare um ambiente para operações temporárias

Por mais que a empresa tenha a sua infraestrutura em nuvem, é importante ter uma alternativa viável reservada para as necessidades temporárias, e manter a empresa funcionando após um desastre.

Se a corporação tiver disponibilidade, o ideal é que reserve um espaço físico, com computadores, energia, internet e outros dispositivos necessários para não parar a produção. Como a empresa está operando na nuvem, esse espaço poderá ser reduzido, não havendo a necessidade de um data center interno.

Defina políticas de procedimentos

É aqui que o gestor define a função de cada membro da equipe de gestão de crises. Essa organização é necessária para que cada um saiba exatamente o que fazer, evitando gargalos e garantindo um trabalho harmonioso. Sem organização, dificilmente o plano de recuperação de desastre terá sucesso.

Esperamos que, após a leitura deste texto, você tenha entendido a importância de um plano de Disaster Recovery, para a manutenção da disponibilidade da infraestrutura de uma empresa, para a segurança dos dados e dos dispositivos. Trabalhe sempre de forma proativa, evitando os problemas, em vez de focar apenas resolvê-los. Assim, você estará sempre à frente da concorrência, com profissionalismo e inovação no mercado de TI.

Gostou do post? Deixe seu comentário abaixo e nos conte sua experiência com a recuperação de desastres!

Rodrigo Gazola
Autor

Com muitos anos de experiencia em TI, trabalhando 24 horas por dia, 7 dias por semana, dá aula sobre excelência em workaholic. Apesar de ser especialista em MSP, adora quando o assunto é backup. Rodrigo esbanja bom humor (diz a lenda que seu segredo é cerveja, churrasco e Rock'N'Roll) e é o mais ativo daqui, já até pensou em rodar o mundo em cima da sua bike.

Escreva um comentário

Share This