Definição – o que significa redundância de dados?
Redundância de dados é uma condição criada em um banco de dados ou tecnologia de armazenamento de dados em que a mesma parte dos dados é mantida em dois locais separados.
Isso pode significar dois campos diferentes em um único banco de dados ou dois pontos diferentes em vários ambientes ou plataformas de software. Sempre que os dados são repetidos, basicamente constitui redundância de dados.
A redundância de dados pode ocorrer por acidente, mas também é feita deliberadamente para fins de backup e recuperação.
Definirtec explica a redundância de dados
Na definição geral de redundância de dados, existem diferentes classificações com base no que é considerado adequado no gerenciamento de banco de dados e o que é considerado excessivo ou desperdício. A redundância de dados perdulários geralmente ocorre quando uma determinada parte dos dados não precisa ser repetida, mas acaba sendo duplicada devido à codificação ineficiente ou à complexidade do processo.
Por exemplo, redundância de dados desnecessária pode ocorrer quando duplicatas inconsistentes da mesma entrada são encontradas no mesmo banco de dados. A redundância acidental de dados pode ocorrer devido a codificação ineficiente ou processos de armazenamento de dados complicados e representa um problema em termos de eficiência e custos.
Como a existência de campos de dados duplicados ou desnecessários deve ser resolvida, as operações de reconciliação, integração e normalização necessárias para remover inconsistências podem ser caras e demoradas. Os erros gerados ao acessar os conjuntos de dados redundantes errados podem levar a muitos problemas com os clientes. Por último, o espaço adicional ocupado por dados redundantes pode começar a aumentar com o tempo, levando a bancos de dados inchados.
Um tipo positivo de redundância de dados funciona para proteger os dados e promover a consistência. Várias instâncias dos mesmos conjuntos de dados podem ser aproveitadas para fins de backup, recuperação de desastres (DR) e verificações de qualidade.
Os dados redundantes podem ser armazenados propositalmente, criando versões compactadas de dados de backup que podem ser restaurados e se tornam parte de estratégias específicas de DR. No caso de um ataque cibernético ou violação de dados, por exemplo, ter os mesmos dados armazenados em vários locais diferentes pode ser fundamental para garantir a continuidade das operações, bem como a mitigação de danos.
A redundância de dados também pode ser aproveitada para melhorar a velocidade das atualizações e o acesso aos dados se estiverem armazenados em vários sistemas que podem ser acessados por diferentes departamentos.
Muitos desenvolvedores consideram aceitável que os dados sejam armazenados em vários locais. A chave é ter um campo ou espaço mestre central para esses dados, de modo que haja uma maneira de atualizar todos os locais onde os dados são redundantes por meio de um ponto de acesso central. Caso contrário, a redundância de dados pode levar a grandes problemas com inconsistência de dados, onde uma atualização não atualiza automaticamente outro campo. Como resultado, pedaços de dados que deveriam ser idênticos acabam tendo valores diferentes.
Sempre que a prevenção não for suficiente, as operações de normalização ou reconciliação do banco de dados podem ser necessárias para eliminar redundâncias já existentes. Uma série de regras de padronização são definidas primeiro para definir o que “dados normais” realmente são. Em seguida, o banco de dados é verificado para garantir que as dependências em todas as colunas e tabelas sejam aplicadas corretamente e que todas as duplicatas desnecessárias sejam tratadas corretamente.