Dados

Dados referem-se a informações distintas, geralmente formatadas e armazenadas de forma compatível com uma finalidade específica. Os dados podem existir em várias formas: como números ou texto gravado em papel, como bits ou bytes armazenados na memória eletrônica ou como fatos que vivem na mente de uma pessoa. Desde o advento da ciência da computação em meados dos anos 1900, entretanto, os dados geralmente se referem a informações que são transmitidas ou armazenadas eletronicamente.

Gramaticamente, dados são a forma plural do dado singular, mas na prática os dados são amplamente usados ​​como um substantivo massivo, como areia ou água. Por exemplo, pode-se dizer que os dados provam algo ser verdadeiro neste caso, “dados” se refere a muitas informações que estão sendo usadas coletivamente para validar uma reivindicação. Nem todos os escritores aceitam o uso popular de substantivos massivos, entretanto. Alguns editores acadêmicos e técnicos são inflexíveis quanto à distinção latina plural e singular (“o conjunto de dados prova” e “um dado prova”).

Dados legíveis por máquina vs. dados legíveis por humanos

Todos os dados podem ser categorizados como legíveis por máquina, legíveis por humanos ou ambos. Os dados legíveis por humanos utilizam formatos de linguagem natural (como um arquivo de texto contendo códigos ASCII ou documento PDF), enquanto os dados legíveis por máquina usam linguagens de computador formalmente estruturadas (Parquet, Avro etc.) para serem lidos por sistemas de computador ou software. Alguns dados podem ser lidos por máquinas e humanos, como no caso de CSV, HTML ou JSON.

A linha entre os dados legíveis por máquina e humanos está se tornando cada vez mais tênue porque muitos formatos que prevalecem hoje são acessíveis o suficiente para serem navegados por um humano, mas estruturados o suficiente para serem processados ​​por uma máquina. Isso é em grande parte o resultado da inteligência artificial, aprendizado de máquina e automação, que agiliza tarefas e fluxos de trabalho para que a entrada e análise de dados manuais sejam feitas por uma máquina em vez de um ser humano. No entanto, esses processos precisam manter sua legibilidade humana caso a programação precise ser ajustada. A maioria dos dados nesses casos também existe no vácuo e não tem muito significado sem contexto de uma perspectiva humana.

Frases de dados em tecnologia

Os dados se tornaram a vanguarda de muitas conversas convencionais sobre tecnologia. As inovações constantemente atraem comentários sobre os dados, como os usamos e analisamos e implicações mais amplas para esses efeitos. Como resultado, o vernáculo de TI popular passou a incluir uma série de frases novas e antigas:

  • Big data: Um grande volume de dados estruturados e não estruturados que são muito grandes para serem processados ​​usando banco de dados tradicional e tecnologias de software.

  • Análise de big data: o processo de coleta, organização e síntese de grandes conjuntos de dados para descobrir padrões ou outras informações úteis.

  • Data center: infraestrutura física ou virtual usada por empresas para hospedar sistemas e componentes de computador, armazenamento e rede para as necessidades de TI da empresa.

  • Integridade dos dados: a validade dos dados, que pode ser comprometida de várias maneiras, incluindo erro humano ou erros de transferência.

  • Data miner: Um aplicativo de software que monitora e / ou analisa as atividades de um computador e, posteriormente, de seu usuário, para coletar informações.

  • Mineração de dados: uma classe de aplicativos de banco de dados que procuram padrões ocultos em um grupo de dados que podem ser usados ​​para prever / antecipar comportamento futuro.

  • Data warehouse: um sistema de gerenciamento de dados que usa dados de várias fontes para promover a inteligência de negócios.

  • Banco de dados: uma coleção de pontos de dados organizados de uma forma que seja facilmente manobrada por um sistema de computador.

  • Metadados: informações resumidas sobre um conjunto de dados.

  • Dados brutos: informações que foram coletadas, mas não formatadas ou analisadas.

  • Dados estruturados: quaisquer dados que residam em um campo fixo dentro de um registro ou arquivo, incluindo dados contidos em bancos de dados relacionais e planilhas.

  • Dados não estruturados: informações que não residem em um banco de dados coluna-linha tradicional, como dados estruturados.