Ir para o conteúdo

Visualização e Qualidade de Dados no Wikidata/Consultas e Representações no Wikidata/Ontologias no Wikidata

De Wikiversidade


Ontologias no Wikidata

Conteúdo

Um Grafo de Conhecimento (Knowledge Graph) é uma base de conhecimento que modela informações na forma de um grafo semântico. Nesta estrutura de dados, os representamos entidades do mundo real ou conceituais, como objetos físicos (uma pessoa, uma cidade), eventos ou ideias, e as arestas, rotuladas semanticamente, representam as relações que conectam essas entidades. Esta modelagem contrasta com a abordagem de bancos de dados relacionais tradicionais, que organizam dados em tabelas com esquemas rígidos.

A principal vantagem do modelo de grafo reside na sua capacidade de representar diretamente as interconexões complexas e heterogêneas presentes no conhecimento, tornando-as explicitar e navegáveis. Um aspecto crítico que diferencia um simples conjunto de dados interligados de um grafo de conhecimento propriamente dito é a presença de uma ontologia formal.

A ontologia atua como o esquema ou a espinha dorsal semântica, definindo formalmente as classes de entidades (ex: Pessoa, Organização), os tipos de relações permitidas (ex: empregado por, localizado em) e as restrições sobre seu uso (ex: uma pessoa pode ser empregado por uma organização, mas não o contrário). Esta camada ontológica permite que o grafo seja interpretado de forma inequívoca tanto por humanos quanto por sistemas computacionais, facilitando a integração de dados de fontes diversas e, crucialmente, permitindo a inferência de novos conhecimentos a partir dos fatos explicitamente declarados.

Modelagem de Dados no Wikidata

[editar | editar código]

O Wikidata constitui um grafo de conhecimento colaborativo e de acesso livre. Sua fundação semântica repousa inteiramente na estrutura de tripla, também conhecida como statement ou afirmação. Uma tripla é uma expressão atômica que segue o padrão Sujeito-Predicado-Objeto, onde:

Sujeito: Sempre um item do Wikidata, identificado por um QID único (ex: Q42 para Douglas Adams). Itens representam as entidades no grafo.

Predicado: Sempre uma propriedade do Wikidata, identificada por um PID único (ex: P106 para ocupação). As propriedades definem o tipo de relação semântica.

Objeto: Pode ser outro item (ex: Q36180 para escritor), formando uma aresta entre dois nós no grafo, ou um valor literal (ex: uma string de texto, um número, uma data).

Ontologia no Wikidata

[editar | editar código]

A ontologia do Wikidata é, portanto, o conjunto de definições e regras que governam a criação e utilização desses itens e propriedades. Ela é construída de maneira colaborativa e evolutiva pela comunidade de editores. Esta ontologia define, por exemplo:

Classes e Instâncias: O item Q5 representa a classe ser humano. Douglas Adams (Q42) é uma instância desta classe, declarada através da propriedade instância de (P31).

Hierarquia de Classes: A propriedade subclasse de (P279) permite estabelecer que escritor (Q36180) é uma subclasse de artista (Q483501), herdando assim suas características.

Domínio e Contradomínio das Propriedades: A propriedade localização (P276) pode ser restrita a ter como domínio itens que são instância de edifício (Q41176) e como contradomínio itens que são instância de cidade (Q515).

Desta forma, a ontologia não está separada dos dados; ela é intrinsecamente codificada no próprio grafo por meio de triplas especiais que definem o esquema. Por exemplo, a tripla P276 subclasse de P501 (localização é um tipo de propriedade de objeto) é uma afirmação ontológica que ajuda os sistemas a entenderem como a propriedade P276 deve ser usada.

Semântica

[editar | editar código]

A combinação da estrutura de tripla com uma ontologia explícita confere ao Wikidata e a grafos de conhecimento em geral características fundamentais:

Semanticidade Explícita: O significado das relações é definido formalmente. Isso vai além da mera ligação entre dados; permite que agentes de software compreendam que capital (P36) é uma relação específica entre uma entidade administrativa e uma cidade, possibilitando consultas e inferências precisas. Um sistema pode, por exemplo, inferir que se uma cidade X é a capital de um país Y, então X está localizada em Y, dependendo das regras de inferência implementadas com base na ontologia.

Flexibilidade e Evolutividade ("Grafo Vivo"): A natureza baseada em triplas torna o grafo intrinsicamente expansível. Novos fatos são adicionados como novas triplas, e novos conceitos são incorporados através da criação de itens e propriedades, sem necessidade de alterar um esquema centralizado e rígido. O Wikidata está em constante estado de evolução, com milhares de edições diárias que refinam tanto os dados quanto a própria ontologia, adaptando-se à necessidade de representar novos domínios de conhecimento.

Interoperabilidade e Integração: A estrutura padronizada de triplas, aliada a protocolos da Web Semântica como SPARQL (linguagem de consulta), permite que o Wikidata atue como um hub para integração de dados. Dados externos podem ser mapeados para a ontologia do Wikidata, permitindo a agregação de informações de múltiplas fontes em um espaço de conhecimento coerente e interligado.

Conteúdos audiovisuais

Quiz

Caro(a) aluno(a), lembre-se que o quiz é uma autoavaliação.

1

O que é a estrutura de dados fundamental de um Grafo de Conhecimento?

Um grafo, com nós e arestas.
Uma tabela, com linhas e colunas.
Um documento de texto livre.
Uma árvore hierárquica estrita.

2

No Wikidata, o que é uma "tripla" ou statement/declaração?

Uma estrutura atômica que segue o padrão Sujeito-Predicado-Objeto.
Uma consulta complexa escrita na linguagem SPARQL.
Um arquivo de backup completo da base de dados.
O conjunto de todas as propriedades de um único item.

3

O que a ontologia de um grafo de conhecimento, como o do Wikidata, define formalmente?

As classes de entidades, os tipos de relações e suas regras de uso.
A localização física dos servidores que hospedam a base de dados.
A interface gráfica utilizada pelos editores humanos.
A velocidade de resposta para consultas ao grafo.

4

No Wikidata, o que um "item" (identificado por um QID) representa?

Uma entidade no grafo (ex: uma pessoa, um lugar, um conceito).
O tipo de relação semântica entre duas entidades.
Um valor literal, como um nome ou uma data.
Um usuário editor registrado na plataforma.

5

Qual é a principal característica de um grafo de conhecimento ser considerado "vivo"?

Sua capacidade de evoluir e expandir com novos dados e esquemas.
A capacidade de realizar inferências lógicas de forma instantânea.
O fato de estar sempre carregado na memória principal (RAM) para acesso rápido.
Sua independência de qualquer intervenção humana para manutenção.

6

Como a ontologia do Wikidata é principalmente desenvolvida e atualizada?

Por meio de um esforço colaborativo e contínuo da comunidade de editores.
Por um único grupo de especialistas que controla todas as mudanças.
Automaticamente, por algoritmos de IA que analisam fontes externas.
É uma ontologia estática, definida no lançamento do projeto e não alterada.

7

Qual é uma vantagem fundamental de se usar uma estrutura baseada em triplas?

Flexibilidade para adicionar novos fatos e relações sem alterar um esquema rígido.
Garantia absoluta de que todos os dados inseridos estão semanticamente corretos.
Maior velocidade de processamento em comparação com bancos de dados relacionais.
Não requer nenhum tipo de esquema ou ontologia para funcionar.

8

Que tipo de operação a ontologia explícita do Wikidata permite?

A inferência de novos conhecimentos a partir dos fatos declarados.
A criptografia de todos os dados para maior segurança.
A geração automática de textos narrativos a partir dos itens.
A exclusão automática de dados inconsistentes.

Conteúdo adicional

Nenhuma leitura adicional definida.
Você pode definir leituras adicionais aqui.
Você também pode usar o botão de edição no canto superior direito de uma seção para editar seu conteúdo.

Discussão