Friday 19 June 2020

Introdução à Business Continuity and Disaster Recovery

Os desastres naturais normalmente são os que inicialmente pensamos quando mencionamos BC/DR. um desastre significa e engloba tudo desde a perda de um sistema ou CPU crítico até desastres naturais que podem destruir uma empresa por completo. Tudo que cause uma perturbação nos procedimentos operacionais de uma organização pode ser considerado um desastre. Sem um plano de acção bem pensado, a maioria das organizações não consegue recuperar de interrupções inesperadas às suas operações normais.

Os termos business continuity (continuidade do negócio) e disaster recovery (recuperação de desastres) costumam ser utilizados sem distinção, e embora existam alguns elementos em comum, eles não são a mesma coisa.

A continuidade de negócio foca-se na capacidade de uma organização continuar operacional independente da natureza de uma potencial interrupção. O seu planeamento implica uma metodologia formal, que pode ser estudada e pela qual os seus praticantes podem ser certificados.

Recuperação de desastres tipicamente é um subtipo do planeamento de continuidade de negócio pois lida com a mitigação dos efeitos de um evento ou desastre. Estes desastres podem ser naturais, causados intencionalmente por humanos, ou acidentais.

As principais motivações para o planeamento BC/DR são a quantidade de riscos que são toleráveis para uma empresa, e quanto é que uma empresa está disposta a dispender para evitar estes riscos e perturbações.

As empresas são compostas por pessoas, processos, e tecnologias e infraestruturas relacionadas. Cada uma destas componentes, individualmente ou relacionada, tem de ser considerada para o planeamento BC/DR.

As pessoas são responsáveis por criar e implementar os planos BC/DR, e são influenciadas e susceptíveis aos efeitos emocionais, mentais e físicos de um desastre. Os processos são utilizados pelas empresas para manter uma ordem e fluxo consistente das operações de negócio, e deverão ser analisados durante o planeamento para determinar quais são os processos críticos e como deverão ser alterados ou implementados. A tecnologia é implementada através das pessoas e processos, portanto uma visão que integre e considere pessoas, processos e tecnologias é essencial para desenhar um plano de emergência.

Business Continuity versus Disaster Recovery

Business Continuity

O planeamento de continuidade de negócio é uma metodologia utilizada para criar e validar um plano para manter as operações de uma organização em funcionamento contínuo, antes, durante e após um desastre e outras perturbações. Este tipo de metodologia tornou-se de grande importância sobretudo, e como exemplo, após o evento do “Y2K”, em que inúmeras empresas e sistemas falharam após o dia 1 de Janeiro de 2000. Muitas empresas não conseguem tolerar períodos de total inactividade ou downtime – isto inclui empresas de finanças, empresas que processam informação de débito ou cartões de crédito, ou alguns vendedores online de grande escala e volume, estas empresas poderão então decidir que compensa investir num sistema de recuperação e continuidade implementado pois a perda e custo pela inactividade pode chegar aos milhões. Estas empresas requerem também que os planos operacionais gerais reflitam esta prioridade.

O termo “disponibilidade contínua” pode classificar-se como um subconjunto de business continuity, também é conhecido como zero-downtime, e é extremamente dispendioso de implementar.

Os planos de continuidade de negócio baseiam-se em acções de prevenção executadas no dia-a-dia. Estas ações quando postas em prática acabam por ser bastante fáceis de implementar e executar com naturalidade. Estas acções de prevenção podem ser classificadas em três classes gerais: mitigação, evitação e transferência. No contexto da continuidade do negócio e recuperação de desastres:

  • Mitigação é algo realizado com o intuito de reduzir a probabilidade de ocurrência, ou o dano sofrido por um evento inevitável.

  • Evitação é o acto de evitar e manter a distância de um evento.

  • Transferência é o acto de transferir o risco de um evento inevitável ou impossível de controlar para terceiras entidades.

Disaster Recovery

Recuperação de desastres é uma parte da continuidade de negócio, e lida com o impacto imediato de um evento. A recuperação envolvida numa falha de sistema ou de energia, uma fuga de segurança, ou desastres naturais como um furacão pertencem todos a esta categoria. Disaster recovery envolve a paragem o mais rápido possível dos efeitos do desastre, e a conseguinte análise e remediação após o desastre. Isto pode incluir desligar sistemas comprometidos, avaliar que sistemas foram afectados durante um sismo, e determinar a melhor maneira de proceder face às consequências sofridas. A uma certa altura, as actividades de business continuity e disaster recovery sobrepõem-se, não só porque uma crise nunca corre exactamente de acordo com o que foi previamente planeado, e porque são levantadas questões que se relacionam com ambas as categorias e que se focam em conjunto em manter a organização operacional, questões estas como por exemplo, em que localização colocar sistemas temporários, como procurar e substituir sistemas ou partes de sistemas, ou como estabelecer mecanismos de segurança numa nova localização.

Os desastres podem ser distinguidos em três categorias. Desastres naturais, desastres causados por humanos, e acidentes e desastres tecnológicos.

Estes podem ser mínimos e fáceis de antecipar e mitigar, ou moderados a catastróficos, portanto um planeamento eficiente deve considerar estes três tipos de ameaças potenciais. O tsunami da indonésia em 2005 ou o furacão Katrina são alguns dos exemplos que provocaram falhas catastróficas, ambos puderam ser antecipados até um certo limite, através de dados sísmicos debaixo do mar e de dados metereológicos respectivamente, mas ninguém pôde estimar a rapidez e área de efeito do tsunami, ou a duração e impacto do furacão. Por conseguinte, o impacto destes dois acontecimentos foi devastador.

Os desastres causados por humanos, também designados de antropogénicos, podem ser mais diversos em natureza. A maioria são intencionais e vão de terrorismo, bombas, ciberataques, roubos, extorsão, fogos postos, protestos ou manifestações civis, contaminação radioactiva, ou adulteração de produtos.

Os desastres tecnológicos e acidentais estão maioritariamente relacionados com os causados por humanos, mas considerados não intencionais. Estes incluem acidentes e falhas de transportes (um colapso de um túnel ou um acidente numa autoestrada), acidentes e falhas de infraestruturas (falhas de gás, electricidade, água ou barragens).

Componentes de Negócio

Antes de planear o que quer que seja, precisamos de tomar um passo atrás e abstrair-nos do que compõe uma empresa ou organização, e como é que esses elementos se interligam e funcionam na empresa. Podemos distinguir três simples categorias, pessoas, processos e tecnologia.

Pessoas

As pessoas, claramente são responsáveis pelo planeamento e implementação dos planos de continuidade do negócio e recuperação do desastre (ou BC/DR), alguns elementos importantes que deveremos considerar nesta categoria “Pessoas” são os seguintes.

Erros humanos. Erros são cometidos diariamente pelos responsáveis dos processos da empresa. Por muitos sistemas bem implementados e variados, por vezes é uma sequência de más decisões ou erros humanos que pode resultar num evento crítico. Um estudo realizado por um especialista da Ontrack Data International indicou que, comparando aos riscos dos ciberataques por vírus ou outro malware, o erro humano é responsável por 5 vezes mais pela perda de dados ou fugas de segurança.

Outro aspecto a tomar em consideração é a diversidade de respostas que as pessoas podem ter face a um desastre. Desde mobilização à paralização, o stress emocional e físico pode reduzir a eficiência até dos indivíduos mais bem preparados.

Processos

No planeamento BC/DR podemos distinguir duas fases: a de planeamento/preparação, e a de implementação. Os processos que uma empresa utiliza no dia-a-dia são a chave para o sucesso a longo prazo. Estes processos são imediatamente interrompidos no caso de um desastre, e um plano que consiga cobrir várias emergências e desastres, contando também com o stress e respostas das pessoas envolvidas pode fazer a diferença entre a recuperação ou o falhanço e consecutivo encerramento da empresa. Algumas das circunstâncias em consideração podem ser a altura do ano, e a mais importante: o que fazer se um desastre ocorre antes, durante ou depois do processamento dos salários. É importante ter planos dedicados e bem pensados para todos estes casos exemplares.

Tecnologia

À medida que a tecnologia continua a tornar-se cada vez mais integral às operações das corporações a uma escala global em todos os aspectos da organização, o papel dos sistemas de informação e dos seus profissionais expandiu-se para englobar todos estes aspectos. Por conseguinte, esta é a área que mais pode sofrer face a desastres, em termos financeiros. Por exemplo, se após uma emergência forem necessárias uma localização e instalações temporárias, inicialmente é menos dispendioso ter um plano de contingência para este aspecto, do que mais tarde após ou durante uma emergência tentar negociar opções disponíveis, sobretudo se um desastre afectar várias empresas. Outros aspectos a considerar são a localização geográfica dos dados ou bases de dados, e dos sistemas electrónicos, o acesso e segurança/métodos de criptografia em vigor e a existência de ficheiros backup ou réplicas.


Planeamento BC/DR

Um dos fortes benefícios de um plano de BC/DR é como planear nos força a observar criticamente as fraquezas nos processos e ferramentas de negócio e a fortalecê-los antes que um desastre ocorra. A análise implícita no desenvolvimento de um plano vai sempre permitir uma compreensão mais profunda da empresa, e descobrir procedimentos e actividades desnecessárias e ineficientes dentro da organização. Isto adiciona valor estratégico à empresa, pois para além da visão alargada dos procedimentos da empresa, oferece vantagem competitiva.

Um plano incompleto ou deficiente muitas das vezes pode ser pior do que não ter um plano de todo, resultando em penalidades financeiras e legais, e também podendo levar as pessoas a assumir que existem planos de contingência e de emergência em efeito – uma falsa segurança.

Para criar um plano efectivo, que aborde ação e contingência, deveremos questionar-nos e cobrir os seguintes problemas.

  • Quais são os meus activos críticos?

  • Quais os riscos associados aos activos da empresa? Quais são os sistemas e dados que devemos proteger?

  • Como se pode reduzir a probabilidade de uma ameaça ocorrer?

  • Como se pode minimizar os danos no caso de uma ameaça inevitável?

  • O que é que as equipas da empresa deverão fazer quando isto acontece? Que indivíduos, departamentos e equipas são responsáveis?

  • Onde posso encontrar mais informação pertinente às minhas necessidades para desenvolver o plano?

Tendo em consideração as componentes de negócio numa visão abstraída, nomeadamente como pessoas, processos e tecnologias se interrelacionam, podemos então desenvolver um plano BC/DR. Podem ser delineados sete etapas ou passos básicos. A figura abaixo representa a ordem e relação entre as várias etapas.

Início de Projecto

É um dos elementos principais no planeamento BC/DR pois é nesta etapa que se definem os limites sobre o que queremos e podemos fazer. É necessário o suporte e colaboração dos utilizadores da empresa (desde os necessários para implementação como especialistas ou managers experientes, aos não envolvidos) e executivos (financiamento, recursos, staff, cobrimento político e legal) através da comunicação clara, concisa e convincente, realçando a necessidade de uma solução BC/DR. É necessário ter âmbito, objectivos e requisitos bem definidos.

As etapas básicas de um projecto são:

  1. definição do projecto

  2. formação de equipas (estabelecer managers para as análises de risco, uma equipa para controlo e avaliação de crises e respectivo porta-voz, uma equipa para os danos, uma para respostas de emergência e notificação, um coordenador para a continuidade de negócio, e responsáveis por recursos e logística)

  3. organização e planeamento do projecto

  4. implementação do projecto

  5. monitorização

  6. fecho do projecto

Análise de Risco

Corresponde ao processo de identificar, controlar e eliminar ou minimizar eventos incertos ou inesperados que possam afectar uma organização; inclui análise do custo-benefício, e selecção, teste e implementação de estratégias. Em suma, uma análise de risco é suposto estabelecer e analisar todo o tipo de ameaças e os potenciais riscos que uma empresa corre no dia-a-dia. É aqui que se levantam e se tentam solucionar questões e problemas com o apoio, experiência e conhecimento do resto dos indivíduos e departamentos da empresa. É o processo de tentar controlar a incerteza, ou seja,

Risco = ameaça + (probabilidade da ameaça ocorrer + vulnerabilidade) + impacto.

Também temos de ter em consideração o apetite de risco (o quanto uma empresa consegue tolerar) versus o custo da solução. De maneira geral, as análises de risco normalmente implicam:

  • análise de potenciais ameaças

  • análise de vulnerabilidades

  • análide do impacto (desenvolvo na próxima etapa)

  • desenvolvimento estratégias de mitigação (próxima etapa)

Análise do Impacto no Negócio

Uma vez delineados os riscos da empresa, deveremos tomar atenção ao possível impacto desses vários riscos, e se é possível tolerá-los. Novamente, é necessário o input de vários especialistas e departamentos.

Processos de negócio que devemos ter em consideração nesta etapa são os salários, e informações dos empregados, transferência de trabalho e responsabilidade para outras áreas da empresa (é uma função dos recursos humanos), dívidas e empréstimos, processamento de dados de contas de crédito, taxas (função das finanças), e chamadas e informações dos clientes/consumidores e histórico e análises dos clientes (função de vendas e departamento de marketing), e sistemas de recuperação, servidores e backups incluindo o tempo e meios de recuperação (função dos sistemas IT).

Resumidamente, alguns dos elementos incluídos num report do impacto no negócio são:

  • processos e funções chave da empresa, e suas interdependências

  • dependências dos sistemas de informação e seus profissionais

  • impacto crítico nas operações

  • informação histórica e de backups, e outros recursos de recuperação

  • papéis chave, posições, conhecimento, experiência requerida por indivíduos

  • operações legais, financeiras, de mercado, e impacto no staff

  • trabalho remoto e distribuição de trabalho/tarefas

Desenvolvimento de Estratégias de Mitigação

Para pequenas empresas, as estratégias de mitigação podem ser bastante simples – desde manter backups remotos, e cópias das informações dos empregados e clientes. Contudo, para a maioria das empresas, o processo de desenvolvimento de estratégias é mais complexo, aqui já devemos incluir como é que o risco e impacto poderão ser tolerados, reduzidos, evitados ou transferidos. Para além da mitigação, esta etapa inclui estratégias de recuperação, alguns dos atributos incluídos numa análise de custo/capacidade são:

  • custo da mitigação ou recuperação

  • capacidades da opção de mitigação/recuperação

  • esforço para implementar e controlar a opção de mitigação/recuperação

  • qualidade dos produtos, serviços ou dados associados à opção escolhida

  • controlo retido pela companhia sob os processos de negócio

  • segurança da solução

  • o carácter e o julgamento qualitativo da opção de mitigação/recuperação escolhida

Desenho do Plano

Após as etapas de análise, já é possível desenvolver um plano. É preciso definir a metodologia que se vai aplicar, para maximizar sucessos e diminuir erros. Isto inclui processos como estabeler requisitos técnicos e de negócio, definição de âmbito e orçamento, intervalo de tempo e prazos a cumprir, métricas de qualidade, etc. Como mencionado nas etapas anteriores, de uma maneira geral, algumas das equipas envolvidas na implementação do plano serão equipas de crise ou danos, equipas responsáveis pelas operações de uma empresa, equipas técnicas, responsáveis pelos sistemas tecnológicos e de informação de uma empresa, equipas de transporte, management, de assuntos legais e políticos e administrativas, equipas de recursos humanos/comunicação social.

Treino, Testes e Auditoria

Após o desenho do plano, é necessário treinar as pessoas sobre a sua implementação através de exercícios ou simulações apropriadas. Todas as equipas mencionadas nas etapas anteriores, incluindo equipas de resposta imediata/emergência deverão trabalhar em conjunto para garantir uma assimilação do plano BC/DR.

Manutenção do Plano

É necessário definir um plano de manutenção, para rever e actualizar o plano BC/DR em vigor periodicamente. Mudança é algo constante nas organizações, desde alterações em operações, pessoal, regulações ou tecnologias, etc. Voltando às três componentes essenciais de um negócio:

Pessoas são promovidas, despedidas ou mudam naturalmente de emprego. Uma revisão periódica pode ajudar a determinar se existe pessoal cuja saída ou entrada da empresa afecta o plano em vigor.

Alterações aos processos deverão ser monitorizadas também, pois podem ocorrer mudanças significativas diariamente às operações de rotina de uma empresa. Mudanças críticas como o objectivo e requisitos de uma empresa deverão ser a maior prioridade.

Em relação à tecnologia, mudanças do equipamento utilizado, tanto científico como de manufacturação, políticas e requisitos, ou outras tecnologias e infraestruturas especializadas também deverão ser analisadas e monitorizadas periodicamente.


Coronavirus

A recente pandemia do Covid-19 pode ser considerada uma emergência natural, contudo a falta de preparação e contenção de muitos países resultou em bastantes erros humanos acidentais e contaminação desnecessária. Esta situação de emergência demonstrou a importância de ter métodos de continuidade de negócio e recuperação de desastres.

Uma pandemia mundial é um caso raro mas não menos importante para ter planeamento prévio. A maioria das empresas à escala global foi obrigada a recorrer aos seus planos BC/DR. Alguns dos impactos que as empresas sofreram e/ou tiveram de considerar foram os seguintes.

  • Impossibilidade dos empregados viajarem. Tanto os aeroportos como os transportes públicos encerraram ou minimizaram drasticamente os seus serviços, portanto tornou-se mais difícil, senão impossível de se deslocar.

  • Impossibilidade de ocupar áreas de trabalho e outros serviços durante tempo prolongado. Para além dos serviços não-essenciais terem fechado por completo durante umas semanas, algumas empresas, escolas e jardins de infância também o fizeram. Os pais trabalhadores, por exemplo, iriam lidar com a extra dificuldade de gerir a família e filhos.

  • Abrandagem ou paragem do crescimento económico e vendas. As empresas sem plataformas online, ou que se baseiam num serviço presencial (retalho, restaurantes, hotelaria, etc) foram as que mais sofreram.

  • Perda de produtividade e performance da empresa. Os empregados que não têm disponibilidade nem meios para trabalhar for a do seu local de trabalho baixaram os seus níveis de produtividade.

  • Custos relacionados com a contratação de empregados temporários e outras componentes necessárias. Não só é necessário apoiar os empregados doentes, como contratar substitutos que consigam realizar o mesmo trabalho.

  • Custos dos métodos tecnológicos distribuídos e teletrabalho. Muitas empresas tiveram de investir em métodos extra para que os empregados pudessem trabalhar remotamente, aceder aos recursos necessários para o fazer, manter-se online, e comunicar clara e constantemente com a empresa.

Considerando a recente crise do Coronavirus, as empresas deverão rever, analisar e actualizar os seus planos BC/DR para ajudar a minimizar esta e outras potenciais interrupções às suas operações normais. Podem ser tomados os seguintes passos para preparação e um planeamento e recuperação adequados:

  • Identificação do pessoal chave, nomeando pelo menos um porta-voz/ponto de contacto, ou outros membros de uma equipa selecionados para especificamente coordenar actividades de mobilização no caso de pandemia. Estes indivíduos deverão também ser responsáveis pela monitorização de notícias e anúncios, e deverá ser identificado e estabelecido pessoal backup, no caso de doença de membros efectivos.

  • Desenvolvimento de um plano de comunicação com os funcionários e de ação face a contaminação. Como mencionado anteriormente, a maioria das empresas terá de responder a vários cenários (como por exemplo, escolas fechadas, áreas de quarentana, colegas de trabalho infectados, etc… Inclui clarificar rumores, estado da empresa, e anúncios oficiais sobre o potencial retorno aos processos padrão.

  • Teste da capacidade dos funcionários poderem trabalhar de casa (por exemplo, alterar equipas para trabalhar remotamente em dias selecionados), protecção, e fornecimento de recursos para situações de trabalho remoto. Inclui fornecer meios informáticos, como laptops, monitores, teclados, impressoras, docking stations, criptografia, etc, e evitar se possível, transferir o trabalgo para computadores pessoais. Também inclui o treino do pessoal para garantir que os funcionários compreendam as suas funções e responsabilidades durante uma interrupção de negócios.

  • Coordenação com os principais fornecedores e terceiros. Implica desenvolver comunicações abertas e facilitar a coordenação com outras componentes externas, incluindo clientes, accionistas, parceiros e reguladores, e mídia.

Embora nenhum plano BC/DR consiga garantir o retorno imediato e total das operações de negócios, devido ao carácter e impacto do COVID-19, a criação de uma estrutura sólida e respectiva implementação de processos pode ajudar a preparar uma empresa e os seus funcionários para lidar interrupções significativas das operações comerciais.


Conclusão

A continuidade dos negócios e a recuperação de desastres não são conceitos novos para os negócios, mas o acto de avaliar e planear conscientemente potenciais problemas certamente foi ressaltado pelos eventos desastrosos de décadas passadas, incluindo terremotos, tsunamis, furacões, tufões, e ataques terroristas.

As empresas precisam sempre de planear para possíveis desastres que possam impactar a sua

capacidade de continuarem operacionais e gerarem receita. Sem um plano para recuperarem de qualquer evento inesperado ou desastre, não importa quão grande ou pequeno, muitas empresas acabam por falhar fatalmente, indo à falência, ou perdendo imenso dinheiro.

Ao desenvolver um plano de business continuity e disaster recovery, é necessário considerar

os três componentes principais dos negócios: pessoas, processos e tecnologia. Quando tomamos uma

visão holística da empresa e das suas operações através das lentes desses três elementos, torna-se mais provável saber que abordagens tomar para desenvolver um plano efectivo. Pessoas, processos e tecnologia devem ser considerados de forma integrada e holística, pois estão interrelacionados.

Através do processo de planeamento de BC/DR, análises de risco potencial, do impacto, e conseguintes alterações na empresa em prol deste plano conseguimos não só responder imediatamente e confiantemente em períodos de emergências e crise, mas beneficiar as empresas a um nível integral, aumentando a productividade das pessoas através de auditorias das funções críticas dos indivíduos e departamentos e uma melhor compreensão de como todos juntos funcionam e se complementam para realizar os objectivos da empresa; aumentando também a efectividade dos processos que constituem a empresa, e a utilidade das tecnologias implementadas, para que se possa tirar o máximo proveito dos sistemas de informação sabendo as suas limitações.


Originalmente escrito por C. M. Rodrigues.


Referências

  • Study shows human error major cause of data loss. https://www.itweb.co.za/content/Gb3BwMWoKmnM2k6V

  • COVID-19: 8 key considerations for workplace continuity. https://www.jll.pt/pt/views/covid-19-8-key-considerations-for-workplace-continuity

  • Susan Snedaker. (2007). Business Continuity and Disaster Recovery Planning for IT Professionals.

  • What is BCDR? Business continuity and disaster recovery guide. (Fevereiro 2020). https://searchdisasterrecovery.techtarget.com/definition/Business-Continuity-and-Disaster-Recovery-BCDR

  • Business Continuity vs Disaster Recovery: 5 Key Differences. https://phoenixnap.com/blog/business-continuity-vs-disaster-recovery

  • Disaster recovery and business continuity auditing. https://en.wikipedia.org/wiki/Disaster_recovery_and_business_continuity_auditing

No comments:

Post a Comment