Ir para o conteudo 1

Fotografia do data center RJ. Imagem dos racks tem tons de cor de rosa.Com a conclusão da modernização do parque de TI em 2014, houve aumento da segurança, capacidade energética e disponibilidade dos ambientes de produção, hoje de quase 100%. Os serviços hospedados na Dataprev têm uma garantia muito forte de disponibilidade, de padrão internacional.

Esta reportagem faz parte da série que mostra como funcionam os data centers, localizados no Rio, em São Paulo e Brasília, e o que está por trás do dia a dia de operação.

Quando é feita uma atualização no sistema, ela não entra no ar automaticamente, uma vez que o serviço pode estar sendo acessado de algum lugar, por um usuário ou agência. Antes de estar efetivamente em produção, toda atualização é testada em um ambiente de homologação para verificar se a performance e as funcionalidades estão  de acordo com o que precisa ser entregue ao cliente. O processo é estudado para prevenir possíveis indisponibilidades, lentidões ou intermitências para os clientes, usuários e cidadãos.

Se o teste for bem-sucedido, um horário é agendado, no geral, no fim do expediente para não haver necessidade de interrupção, e a atualização é executada. Com 200 mil atendimentos realizados por dia e a necessidade de dar uma resposta rápida para garantir a performance do sistema, não é possível fazer batimentos, análises e processamentos, das 8h às 18h, já que isso afetaria diretamente quem acessa o sistema. Por isso, os grandes processamentos são feitos de madrugada.

Quando é possível trabalhar paralelamente não existe esse problema. Os sistemas transacionais, que podem sofrer constantes mudanças, são  mantidos funcionando 24 horas e o processamento é feito paralelamente em uma cópia da base ou dos sistemas sem que esta atividade afete a performance do ambiente transacional acessado pelos clientes. A base do Cadastro Nacional de Informações Sociais (CNIS), por exemplo, que tem mais de 19 bilhões de registros, desde que o primeiro emprego é registrado na Carteira de Trabalho e Previdência Social (CTPS), funciona replicada.

Quando é feita a replicação de uma base, toda a parte de Analytics do sistema pode ser feita paralelamente porque a informação está segura em outro lugar. No caso do CNIS, a base está hospedada em um data center e uma base paralela está replicada em outro. Assim grandes processamentos podem ser realizados inclusive durante o dia.

Além de fazer replicação dos dados on-line entre dois data centers ou mais, a Dataprev  ainda conta com uma tecnologia de armazenamento e proteção de dados que permite armazenar as cópias de segurança em disco e também replicá-las entre os data centers. Com a modernização do sistema de armazenamento das cópias de segurança, passando da fita magnética para disco, a empresa passou a usar apenas 6% do espaço físico que era demandado anteriormente para guardar informações.

Esta nova tecnologia ainda permitiu reduzir espaço de armazenamento, uma vez que o sistema conta com uma taxa de compressão de dados 3x mais eficiente que a tecnologia anterior, além de diminuir o tempo de cópia e restauração dos dados, já que é mais rápido gravar informações em disco do que em fita. Com a replicação dos dados para outro data center, a proteção dos dados dos clientes aumentou, pois em caso de sinistro com um data center é possível recuperar todos os sistemas do cliente em outro data center.

Fotografia de gerador, que garante disponibilidade de aplicações durante quedas de energia.Segurança física - A sala-cofre, estrutura que existe dentro de um data center, possui uma porta específica com controle biométrico de abertura, resistente à inundação, terremotos, pequenas explosões, gases corrosivos e incêndio. Trata-se de um local totalmente isolado do ambiente externo. Dentro dessa sala e da sala segura, estrutura semelhante, mas que guarda dados menos críticos, há conjuntos de racks padronizados que hospedam servidores de alta performance.

É preciso se preocupar sempre com a eficiência energética e com a climatização dos equipamentos nestas salas. Antes de entrar na sala-cofre ou na sala segura, todo novo equipamento passa por um rigoroso processo de análise e avaliação técnica para garantir o atendimento aos requisitos de redundância elétrica e os impactos no fluxo de ar do ambiente. No caso do sistema de ar-condicionado, a temperatura definida é 20°. Um esquema de precisão, diferente do que acontece com aparelhos domésticos, garante que a temperatura do ambiente será uniformizada em 20° e isso será mantido mesmo que a temperatura externa mude.

A refrigeração segue um esquema de aquecimento e resfriamento. No geral, ar quente é liberado pela parte de trás das máquinas e refrigerado para ser devolvido ao ambiente. Os equipamentos trabalham puxando esse ar gelado da frente para resfriar os componentes e empurram o ar quente para trás, que é recondicionado pelo equipamento de ar-condicionado para manter a temperatura.

Em Brasília, o ar quente é enclausurado e então resfriado e o ar gelado é empurrado para fora. No caso do Rio de Janeiro, o corredor enclausurado prende o ar frio. Esse ar é insuflado do piso e puxado pela frente das máquinas para depois o ar quente ser empurrado para trás. Então o ar quente é recapturado e de novo volta para a corrente de aquecimento e resfriamento.

Incidentes - Sempre que há uma mudança programada em um sistema, algum incidente ou evento de infraestrutura, requisição de serviço ou gestão de configuração, isso é tratado dentro da empresa pela Superintendência de Operações (SUOP). Só em 2016, os 633 empregados que compõem a SUOP atenderam mais de 760 mil itens, ou seja, foram gerados mais de 760 mil tickets de atendimento tratados por equipes especializadas. A partir do seu Núcleo de Operações (NOC), uma equipe que atua em regime 24x7 nos 3 data centers, monitora todos os serviços hospedados em seus sites.

Qualquer anomalia no comportamento dos componentes que sustentam estes sistemas gera um evento nas ferramentas de monitoração, que são tratados pela equipe do NOC para que não se tornem incidentes. Se em até 20 minutos a anomalia não for resolvida, este evento vira um incidente e é escalado para a equipe de suporte. Apenas no ano de 2016 a equipe do NOC resolveu mais de 670 mil eventos antes que estes gerassem impactos ao negócio e fossem considerados incidentes.

Investimentos - Investimentos da ordem de R$ 580 milhões permitiram que a empresa tivesse uma salvaguarda que garante que todos os equipamentos continuarão funcionando mesmo que ocorra um Imagem de servidor no data center DF. Foto é escura com tons de azul.acidente. Esse nível de contingência é atestado pelo certificado Tier III e pela exigência de contrato de manutenção e/ou garantia de fábrica de todos os equipamentos dentro do data center. Assim, se houver qualquer tipo de evento nos equipamentos, o fabricante é acionado e deve solucionar o problema em um tempo máximo estabelecido em contrato.

Leia também:

#DataCenterDataprev: Tecnologia para garantir acesso a direitos