Esta matriz ajuda a decidir como empregar termos técnicos na comunicação da Base dos Dados.
Ela deve ser usada como referência para equilibrar precisão e acessibilidade em todos os contextos — seja plataforma ou marketing.
| Situação | O que fazer | Exemplo | Como aplicar |
|---|---|---|---|
| É amplamente conhecido | Use | API, BigQuery | Use o termo naturalmente. |
| Não existe termo melhor | Use | join, Parquet | É melhor usar o termo reconhecido. |
| Você explica na sequência | Use | “As tabelas tratadas ficam disponíveis no datalake, que é onde centralizamos os dados prontos para uso” | Use o termo com uma explicação simples e contextualizada, destacando sua função dentro da plataforma. |
| É importante, mas pouco conhecido | Explique | “Compressão do Parquet, que reduz o tamanho dos arquivos sem perder dados” | Explique no próprio texto ou através de links, tooltips etc. |
| Pode gerar dúvida | Explique | “Normalizamos os dados” (normalização estatística ou de escala?) | Se o termo for ambíguo, explique o sentido. |
| É só jargão | Evite | “Geramos um snapshot incremental da tabela” vs “Criamos uma versão atualizada da tabela” | Substitua o termo quando seu uso não for necessário. |
| Existe forma mais clara | Evite | “Orquestramos os jobs com Airflow” vs “Coordenamos as etapas do processo com o Airflow” | Substitua o termo quando seu uso não for necessário. |
Este glossário reúne os principais termos padronizados de uso na comunicação da Base dos Dados.
Ele deve ser usado como referência para garantir consistência terminológica em conteúdos de todas as áreas da organização.
| Termo | Definição | Recomendação | Use | Evite |
|---|---|---|---|---|
| arquivo auxiliar | É um material que fornece mais contexto e ajuda a entender melhor os dados. Pode incluir notas técnicas, descrições de coleta e amostragem, etc | “arquivo auxiliar”, “arquivos auxiliares” (plural) | “material de apoio” | |
| coluna | É cada uma das variáveis presentes em uma tabela tratada. | Use “coluna” para se referir aos títulos das variáveis na tabela tratada. Quando quiser se referir a uma coluna específica, use sempre o nome como aparece na plataforma (ex: coluna_ano, coluna valor_total). Em materiais de apoio, é útil explicar que as colunas correspondem às variáveis da tabela — mas mantenha o uso da palavra “coluna” como padrão. | “coluna”, “colunas” (plural), “variável”, “variáveis” (plural) | “campo” |
| código institucional | É um identificador numérico ou alfanumérico atribuído por instituições para representar locais, categorias ou outras entidades nos dados. | Use “código institucional” quando estiver se referindo a identificadores oficiais atribuídos por instituições para representar entidades específicas nos dados. Evite usar apenas “código” quando houver risco de ambiguidade com consultas ou scripts. | “código institucional”, “códigos institucionais” (plural) | “código” |
| cobertura temporal | É o intervalo de tempo ao qual os dados de um conjunto se referem. | Use “cobertura temporal” para informar o intervalo de tempo que os dados representam. Sempre que houver risco de ambiguidade, especifique “cobertura do conjunto” ou “cobertura da tabela”. | “cobertura temporal” | “intervalo de cobertura” |
| conjunto de dados | É uma unidade organizada que agrupa informações sobre um mesmo tema e origem. Pode conter tabelas tratadas, fontes originais ou as duas coisas. | Use “conjunto de dados” quando quiser deixar claro que se trata de uma coleção organizada, que pode incluir tanto tabelas tratadas quanto apenas fontes originais. O uso da forma curta “conjunto” é aceito quando o contexto já deixa evidente que se trata de dados — por exemplo "Explorar conjuntos". | “conjunto de dados”, “conjuntos de dados” (plural), “conjunto”, “conjuntos” (plural) | “base de dados”, “base”, “dataset” |
| consulta | É a instrução em SQL que a plataforma gera automaticamente para realizar a seleção específica de dados em uma tabela processada. Ela pode ser executada diretamente no BigQuery ou utilizada dentro de ambientes de programação Python ou R. Cada consulta corresponde a um recorte específico de uma tabela tratada. | Use “consulta” para se referir à instrução em código que acessa e filtra dados de uma tabela tratada, e não à ação de procurar ou navegar por dados na interface. Evite usar “código” como sinônimo de “consulta”, especialmente quando o conteúdo também trata de códigos institucionais (como códigos do IBGE, CNAE, CBO etc.). Nestes casos, “código” pode gerar ambiguidade, já que se refere a valores presentes nas colunas das tabelas tratadas. | “consulta”, “consultas” (plural) | “código” |
| cruzamento | É o processo de combinar dados de diferentes tabelas ou variáveis para analisar relações entre elas. | Use “cruzamento” quando quiser explicar ou descrever o que está acontecendo sem entrar no detalhe técnico da linguagem ou ferramenta. Em contextos técnicos, é possível usar os termos “join” (para SQL) e “merge” (para Python ou R). | “cruzamento”, “cruzamentos” (plural), “join”, “merge” | |
| dados atualizados automaticamente | São os dados que são atualizados sem intervenção manual. | Use "dados atualizados automaticamente" para se referir ao benefício exclusivo dos planos pagos. Vale destacar que, embora a verificação seja diária, algumas fontes originais podem ter frequências de atualização diferentes — como mensalmente, trimestralmente, ou conforme a disponibilização das instituições. Por isso, utilizamos "automaticamente" em vez de "diariamente" para evitar confusão. | “dados atualizados automaticamente” | “dados de alta frequência”, “dados atualizados diariamente” |
| datalake | É o repositório onde ficam armazenados todos os dados da plataforma. | Use “datalake” quando quiser se referir à camada técnica de armazenamento de dados da BD — não à plataforma. Em textos voltados a pessoas desenvolvedoras, analistas de dados ou outros públicos técnicos, “datalake” pode ser usado para explicar a origem ou estrutura dos dados. Para o público geral, prefira mencionar a plataforma ou os dados disponíveis na BD — e deixe “datalake” para materiais mais especializados. | “datalake” | “banco de dados” |
| diretório | É uma tabela que liga diversos códigos institucionais e informações de diferentes entidades brasileiras. | Use “diretório” quando se referir a tabelas que facilitam o cruzamento de dados, oferecendo uma ponte entre códigos e entidades. | “diretório”, “diretórios” (plural), “tabela de referência” | “tabela mestre” |
| documentação | É o conjunto de informações técnicas e operacionais que explicam o funcionamento da plataforma, suas funcionalidades e formas de uso. Inclui instruções para realizar tarefas, descrever recursos, compreender estruturas de dados e integrar ferramentas externas. É voltada principalmente para quem quer entender melhor como a plataforma funciona por trás, explorar de forma mais avançada ou automatizar processos. | Use “documentação” quando se referir a conteúdo mais completo e técnico sobre a plataforma ou seus recursos. | “documentação” | “guia de uso”, “manual de uso”, “tutorial” |
| download | É a ação de baixar um arquivo de dados da plataforma para o computador do usuário. É possível fazer o download diretamente pela plataforma (em formato CSV) ou usando instruções geradas em SQL, Python ou R. | Use “download direto” quando quiser enfatizar que o arquivo está disponível para baixar com um clique. | “download”, “download direto”, “baixar” | “exportar” |
| editor de consultas do BigQuery | É uma ferramenta na interface do Google BigQuery que permite aos usuários escrever, editar e executar consultas SQL para buscar e manipular dados armazenados no BigQuery. | Use "editor de consultas do BigQuery" para se referir à ferramenta para interação com dados no Google BigQuery. | “editor de consultas do BigQuery” | “console do BigQuery” |
| entidade | É o objeto principal representado nas observações da tabela — ou seja, o “quem” ou “o quê” sobre o qual os dados são registrados. A entidade costuma fazer parte (ou ser igual) ao nível da observação — mas nem sempre são a mesma coisa. | Use “entidade” para descrever o foco dos dados em uma tabela. | “entidade”, “entidades” (plural) | “objeto” |
| equipe | É o grupo de pessoas responsáveis pela plataforma, que inclui profissionais de diferentes áreas, como dados, desenvolvimento e suporte. | Use "equipe" sempre que precisar se referir ao grupo de pessoas responsáveis pelo funcionamento da plataforma. | “equipe” | “time” |
| fonte original | É um link para uma página externa à plataforma com informações úteis sobre o conjunto de dados. | Use “fonte original” quando quiser indicar onde o dado foi publicado originalmente. Evite usar apenas “fonte” para não confundir com outras possíveis interpretações. | “fonte original”, “fontes originais” (plural) | “fonte externa”, “link externo”, “fonte” |
| frequência de atualização | É a periodicidade com que os dados na plataforma são atualizados. | Use “frequência de atualização” para indicar com que regularidade os dados são mantidos atualizados na plataforma. | “frequência de atualização”, “frequências de atualização” (plural) | "periodicidade de atualização”, “data de atualização” |
| guia de uso | É um material que ajuda o usuário a entender, explorar e utilizar um conjunto de dados. O guia de uso é diferente de um arquivo auxiliar: enquanto o guia é produzido pela equipe da BD, os arquivos auxiliares geralmente vêm da fonte original. | Use “guia de uso” para manter o tom acessível e indicar que se trata de uma orientação prática voltada à exploração dos dados de um conjunto. | “guia de uso”, “guias de uso” (plural) | “manual de uso”, “tutorial”, “documentação” |
| inclusão de dados | É o processo de adicionar novas informações à plataforma, seja na forma de tabelas tratadas (prontas para análise) ou de fontes originais (links para os dados como publicados pela instituição de origem). | Use “inclusão de dados” para se referir à adição de novas tabelas tratadas ou fontes originais na plataforma. | “inclusão de dados”, “incluir os dados” | “subida de dados”, “subir os dados” |
| nível da observação | É a menor granularidade possível de análise com os dados. É como se a combinação das colunas que compõem o nível da observação fosse uma chave primária. | Use “nível da observação” para descrever a estrutura lógica da tabela: o que cada linha representa. | “nível da observação” | |
| organização | É a instituição que coleta, produz ou publica os dados disponíveis na plataforma. | Use “organização” para indicar quem é responsável pela geração ou publicação dos dados. Evite confundir com a fonte original, que é o link específico para baixar os dados. A fonte pode apontar para uma página da organização, mas os termos têm usos diferentes na plataforma. | “organização” | “fonte” |
| pacote | É uma biblioteca de código que permite acessar, consultar e manipular dados da plataforma diretamente em ambientes como Python ou R. | Use “pacote” quando estiver se referindo ao acesso via código. | “pacote”, “pacotes” (plural) | “biblioteca” |
| partição | É uma divisão feita em uma tabela para facilitar o gerenciamento e a consulta de dados. | Use “partição” quando estiver explicando desempenho de consulta ou estrutura técnica. | “partição”, “partições” (plural), “particionada” | |
| plataforma | É o ambiente digital onde os usuários fazem buscas, geram consultas para acesso aos dados, leem guias de uso, conhecem os serviços oferecidos, exploram informações sobre a iniciativa. | Use “plataforma” para se referir a todo o ambiente digital da BD. “Site” tem um significado mais limitado, geralmente associado a páginas estáticas ou institucionais. Já “plataforma” comunica que o ambiente é interativo e que o usuário pode realizar ações. Em alguns contextos muito informais (como redes sociais), “site” pode ser aceito. Mas, no geral, prefira sempre “plataforma” para manter consistência e clareza. | “plataforma”, “plataforma de dados”, “plataforma da BD” | “portal”, “site” |
| tabela de tradução | É uma tabela que relaciona códigos institucionais com seus significados, facilitando a compreensão e o uso dos dados. | Use “tabela de tradução” quando quiser indicar uma tabela que ajuda o usuário a interpretar códigos institucionais. | “tabela de tradução”, “tabelas de tradução” (plural) | “tabela de códigos” |
| tabela tratada | É uma tabela pronta para análise, disponível via SQL, Python e R. | Use “tabela tratada” quiser indicar que os dados passaram por um processo de tratamento. O uso reduzido, como “tabela”, é aceitável apenas quando o contexto já deixa evidente que se trata de uma tabela tratada — por exemplo, em uma explicação onde o termo completo já foi apresentado antes. | “tabela tratada”, “tabelas tratadas” (plural), “tabela”, “tabelas” (plural) | “tabela tratada BD+” |
| tema | É a área de conhecimento à qual um conjunto de dados está relacionado. Exemplos de temas são: educação, saúde, economia, meio ambiente. | Use “tema” para organizar os conjuntos de dados por área de conteúdo. | “tema”, “temas” (plural) | “categoria”, “área temática” |
| terminal | É um ambiente de linha de comando que permite aos usuários interagir com o sistema operacional ou executar scripts para manipular e consultar dados. | Use “terminal” para se referir ao ambiente de linha de comando usado para executar comandos ou scripts. | “terminal”, “terminais” (plural) | “console” |
| tratamento | É processo que envolve a padronização de nomes de variáveis e compatibilização de códigos das tabelas. | Use "tratamento" ao descrever o processo interno que a equipe faz para preparar os dados antes de disponibilizá-los como tabelas tratadas. Evite usar "limpeza de dados" porque pode ser confundido com remoção de registros ou erros apenas, e não inclui padronização ou compatibilização. | “tratamento” | “limpeza” |
| tutorial | É um passo a passo prático que mostra como realizar uma tarefa ou operação usando os dados da plataforma. | Use “tutorial” quando o foco estiver em ensinar como fazer algo passo a passo, com ações claras. Diferente do guia de uso, que explica o conteúdo do conjunto de dados, o tutorial mostra como fazer algo com os dados — seja na própria plataforma ou em ferramentas externas como BigQuery, Python ou R. | “tutorial”, “tutoriais” (plural) | “guia de uso”, “manual de uso”, “documentação” |
Base dos Dados