Observatório de dados/BI/Capacidade/Visualização

Fonte: Wikiversidade

As visualizações podem ser tanto componentes de relatórios como componentes da análise.

As principais capacidades de visualização são: capacidade de estruturas ou editar templates, widgets, e capacidade gráfica. Todas elas são estratégias para garantir uma maior reusabilidade de componentes do relatório. Em alguns casos o reuso se dá dentro de um mesmo relatório, mas o mais comum é o reuso orientado à padronização dos relatórios e às boas práticas da comunicação visual.

Template[editar | editar código-fonte]

Template típico T=Olá ${x}!!
onde a variável x é substituída por um dos dados de entrada. O template engine é uma função ou processo P(T,x).

Nas ferramentas de BI o template pode estar em diversos lugares:

  • na geração de relatórios, o sistema de template é o módulo da ferramenta de BI que gera os relatórios. Em relatórios complexos podem ser diversos templates dentro de uma estrutura maior.
  • na análise e visualização, pedaços por exemplo da visualização de um gráfico ou de uma tabela, podem conter templates

O template em si é como um "documento modelo" ou um formulário com suas lacunas. Fragmentos de um documento maior podem ser templates especializados. Por exemplo a empresa ClimaTempo fornece componentes online para inserir um pequeno quadro informando a previsão numa página Web. Na ferramenta Power BI um fragmento similar para compor seus dados é chamado de cartão.

Formalmente - Sistemas de template são caracterizados por um processador de template, P, e sua "linguagem de template" (em geral uma linguagem especializada). Cabe ao usuário escolher o template T desejado, uma entrada de dados X adequada e ele, com elementos x0, x1, etc. e então gerar documentos ri = P(xi,T). Cada item de dado pode ser uma estrutura composta de sub-itens. O processador P reconhece as lacunas de T (na ilustração ${x} é uma lacuna) e substitui pelo subitem correspondente. A finalidade do sistema de template é justamente a produção em massa de documentos.
Computacionalmente as linguagens de template são organizadas em três grupos, em complexidade crescente: templates de lacunas, templates regulares (de repetição), e templates Turing-completos.

A seguir alguns exemplos em ordem de complexidade, lembrando que, para o usuário final, as linguagens de template mais importantes são as mais simples.

Template de lacunas[editar | editar código-fonte]

Cada dado é apresentado em uma lacuna. Se exemplo o conjunto de dados é formado por duas fotografias, e a lacuna da apresentação é porção rosa de uma "imagem template", temos os seguintes resultados da aplicação do dado ao template:

Exemplos de componentes de ferramentas de BI que adotam templates de lacuna: no Tableau a edição avançada por exemplo do título de um gráfico permite expressar variáveis pré-definidas... no Power BI ... Nas ferramentas derivadas de Javascript e no modelo de referência, padrão Javascript template literals.

Template tabular[editar | editar código-fonte]

É um tipo ainda simples de template, mas muito utilizado e com um primeiro nível de complexidade, que consiste na repetição das linhas de uma tabela. A entrada típica desse template é um vetor (para produzir uma só tabela) ou uma lista de vetores (produzindo várias tabelas).

Detalhe de componente tabular de um relatório do exemplo 2.1.

Em geral há um template para o cabeçalho (rótulos das colunas), e um template para o layout das linhas, onde cada variável de template representará os valores de uma coluna da tabela final.

O dado tabular é uma das formas mais importantes apresentação de dados. Em ferramentas de BI onde os relatórios podem ser mais complexos, com sua estrutura definida por DTDs, a tabela pode eventualmente corresponder a uma "DTD de matriz". A figura abaixo exemplifica esse tipo de template mais complexo.

Exemplos de componentes de ferramentas de BI que adotam templates tabulares: ...

Template complexo[editar | editar código-fonte]

Processo de composição do produto final a partir do template em linguagem Mustache e dos dados de entrada (view do template).

Template cuja entrada é um dado tabular (com uma ou mais colunas repetindo-se), em árvore ou um grafo. O caso mais simples é o da árvore, onde o produto final reproduz a estrutura dos dados de entrada, formando um texto composto de itens e subitens. No modelo de referência a linguagem adotada foi a Mustache.


Gráfica[editar | editar código-fonte]

A capacidade gráfica de uma ferramenta de BI refere-se à visualização dos dados através de gráficos, os mais variados... Incluindo gráficos estatísticos, diagramas de conjuntos, grafos, dendrogramas, etc. A cada tipo de gráfico está associado também um tipo de entrada de dados válida, exemplos, com ilustrações abaixo:

  • a entrada de um gráfico XY de espalhamento, é uma tabela com duas colunas (X e Y)
  • a entrada de um Histograma depende da ferramenta, pode fazer internamente a segmentação automática (em intervalos regulares), ou requerer os dados previamente filtrados.
  • a entrada de um Dendrograma em geral é uma matriz de semelhança, mas se a ferramenta não for estatística, não constrói a árvore, requer apenas uma estrutura de rótulos e distâncias.

A capacidade gráfica (visualização) não deve ser confundida com a capacidade analítica (inferência), apesar de em geral a análise não ser possível sem respectiva visualização.