Definição – O que significa Engenharia de Confiabilidade do Site (SRE)?
A engenharia de confiabilidade de site (SRE) é uma abordagem para operações de sites que usa técnicas de engenharia de software para construir sites mais confiáveis. A engenharia de confiabilidade do site foi desenvolvida pela primeira vez no Google em 2003. O termo está relacionado ao DevOps, que também mistura engenharia de software com administração de sistema, mas DevOps envolve a automação de tarefas manuais.
Definirtec explica a Engenharia de Confiabilidade do Site (SRE)
A engenharia de confiabilidade de site envolve o uso de técnicas de engenharia de software, incluindo algoritmos, estruturas de dados, desempenho e linguagens de programação para obter aplicativos da web altamente confiáveis. A abordagem foi desenvolvida pela primeira vez no Google em 2003.
Em uma entrevista, o vice-presidente de engenharia do Google, Ben Traynor, disse que a empresa contratou 50-50 pessoas com experiência em engenharia de software e administração de sistema para suas equipes de SRE. O Google atribui pequenas equipes de SRE a grandes projetos. Traynor atribuiu o notável tempo de atividade do Google à automação de muitas atividades operacionais do site. Embora as falhas ocasionalmente aconteçam, elas são corrigidas rapidamente porque a equipe SRE automatizou muitas tarefas de antemão.
O Google também se inspirou em jogos de RPG na maneira como estruturou exercícios de prontidão de operação para testar os engenheiros no caso de falhas que exigem automação. A empresa chama esses exercícios de “Roda do infortúnio”, em que um funcionário desempenha o papel do sistema e o outro desempenha o papel de engenheiro de plantão. Traynor disse que essa abordagem fez com que os engenheiros pensassem em confiabilidade mais do que as brocas convencionais.
O SRE é semelhante ao DevOps, mas o último se concentra na automação da implantação de sistemas em geral, enquanto o SRE se concentra especificamente na confiabilidade.