Observatório dos Prenomes/Variantes

Fonte: Wikiversidade

Convenções do Observatório dos Prenomes para as considerações relativas a variantes de um prenome. Foram consultadas diversas fontes especializadas e estabelecidos os critérios e padrões que proporcionam uma metodologia objetiva para sua adoção.

Para evitar a documentação de relacionamentos dispersos entre variantes, optou-se por fixar as variantes apenas com relação aos prenomes canônicos, ou seja, registra-se comparações entre prenomes apenas quando um deles é canônico.

Os critérios objetivos permitem a padronização dos relatórios e, em alguns casos, já geram automaticamente todos os itens de um relatório. Em geral serão o de partida para um processo mais refinado de seleção para se obter os itens adequados.

Variantes fonéticas[editar | editar código-fonte]

São variações na escrita do prenome canônico que apresentam uma mesma pronúncia (prenomes homófonos) ou pronúncia similar, dentro de uma gradação de semelhança.

Algumas grafias são indiscutivelmente homófonas, aceitas como equivalentes por todo o Brasil, outras podem apresentar semelhança conforme a rapidez com que se pronuncia, ou diferenças conforme regionalismos da entoação. Existem algumas regras gerais do português, mas na falta delas é a tradição oral da região (aqui representada pelos curadores) que define.

Optou-se por rotular as relações fonéticas entre prenomes através da seguinte gradação, que parte da homofonia perfeita. Na relação sempre se compara um prenome canônico c com um de seus variantes fonéticos. Eles pertencerão ao conjunto

A função grauHomofonia(x,c) não tem algoritmo, é definida apenas pela tabela de decisão abaixo. Na prática, para automatizar a análise dos milhares de prenomes de HPR, pode-se iniciar um processo de refinamento com algoritmos do tipo Metaphone.

Tipo de prenome Grau de homofonia Caracterização e exemplos
Homófono 100% Mesma pronúncia (de x) que o canônico c, há consenso geral ou tradição em tratá-los como homônimos.
Numa votação, 100% dos curadores concordam que x e c são homófonos.

Débora e Déborah, Débora e Debhora, Geni e Jenny, Mateus e Matheus, Regina e Rejina, Rosângela e Rozangela.

Parônimo 75% Não há um consenso tão amplo, x fica melhor caracterizado como um parônimo de c. Numa votação, pelo menos 75% dos curadores consideram x homófono, ou 100% consideram x parônimo. Imaginando uma votação nacional, os votos destoantes seriam por efeito de regionalismos diferenciando a pronúncia.

Regina e Rigina, Rosângela e Rosangila.

Parecido 50% Não há consenso, apenas 50% dos curadores consideram x homófono de c. Numa votação também vale o resultado de 100% julgarem x apenas parecido com c.

Ana e Ania, ...

Afim 25% Não há homofonia, apenas com a pronunciação misturada a ruído, ou situações de "fala mais rápida".

Débora e Dedora, Débora e Bedora, Geni e Jane,

Notas técnicas: 1. o grau de homofonia permite caracterizar, simultaneamente, o grau de pertinência fuzzy de x em Homofc. Grau 100% significa totalmente incluso, demais graus, parcialmente incluso. 2. quando houver ambiguidade a decisão entre homófono ou parônimo pode ser obtida por distância Levenshtein, se for pequena fica como homófono.

Convenciona-se também que homófonas e parônimas não podem fazer parte de mais do que um conjunto de variantes.

Critério objetivo[editar | editar código-fonte]

A algoritmo que melhor se adequa aos requisitos da função grauHomofonia(x,c) é o Metaphone adaptado ao Português do Brasil, MetaphonePtBr. Ele em geral vai selecionar dentro os elementos de HPR um conjunto maior do que Homofc, mas com certa garantia de que não haverá falsos-negativos, os elementos-extra serão todos falsos-positivos. Desse modo é o melhor ponto de partida para se iniciar um processo formal de refinamento, com supervisão humana.

Como o Metaphone não é perfeito, sempre que os curadores perceberem alguma falha (falso-negativo) no Metaphone, revisar todos os prenomes que possam ter sido afetados pela falha.

Variantes semânticas[editar | editar código-fonte]

São variações do prenome tidas como "similares semânticas", por serem consideradas — por uma parcela relevante da comunidade de usuários — de mesma origem etimológica ou corresponderem a "traduções" do mesmo nome em diferentes em línguas.

Exemplos de traduções, e supondo línguas mais influentes (ex. inglês) ou de comunidades mais influentes (ex. imigrantes italianos),

  • George é tido como versão inglesa de Jorge.
  • Mary é certamente versão inglesa de Maria.
  • Enzo é tido no Brasil como nome italiano, e por sua vez na Itália é suposto ser tradução do germânico Heinz.
  • Heinz é tido no Brasil como nome alemão, que na Alemanha é diminutivo de Heinrich, por sua vez traduzido para Henrique no português.

Nomes de personagens universais (com traduções consensuais em todas as línguas), como Maria do mundo católico; e nomes com raiz preservada, como Flora (preserva do latim floris em diversas línguas) em diversas línguas, acabam sendo mais ... Por isso na Wikidata optou-se pro estabelecer essas relações através da propriedade said to be the same as (equivalência disputada). tendo a sua relação semântica mais evidente, principalmente quanto ao consenso na sua forma traduzida. Adotaremos o termo prenome sinônimo para esses casos com forte evidência e consenso. Podemos afirmar por exemplo que Mary e Maria são sinônimos, assim como George e Jorge.

Quanto mais longa a cadeia de derivação, menos confiável será a suposta evidência de relação semântica. Adotaremos o termo prenome afim (afinidade semântica) para esses casos onde a evidência é menos sólida. Por exemplo a relação semântica entre os nomes Heinz e Henrique existe, mas eles devem ser considerados apenas afins, não sinônimos.

Critério objetivo[editar | editar código-fonte]

As relações semânticas devem estar registradas na Wikidata:

  1. O prenome deve constar na Wikidata como pre....
  2. Pares de prenomes candidatos a uma relação semântica devem apresentar reciprocamente a vinculação na propriedade ...
  3. O critério de classificação deve seguir as seguintes considerações:
    • Prenomes sinônimos: quando ... tradução .. ou existem fontes fiáveis afirmando uma relação direta (sem encadeamentos lógicos)
    • Prenomes afins:
    • Prenomes relacionados: quando a relação não satisfaz nenhuma das duas condições anteriores.

Exemplos: ...

, pelo menos um deles (de preferência os dois) deve citar o outro na propriedade

Variantes por gênero[editar | editar código-fonte]

As "variantes do prenome pelo critério de gênero", ou simplesmente gênero complementar do prenome:

  • Joana é tido consensualmente no português como feminino de João.
  • Mário é tido consensualmente no português como masculino de Maria.

Apesar de ser uma variante semântica, na Wikidata recebe um tratamento mais específico, e a convenção foi preservada no Observatório dos Prenomes, assim como em diversas outras fontes.

Critério objetivo[editar | editar código-fonte]

Apresentar a propriedade ... na Wikidata, de preferência em ambos os prenomes.


Variantes compostas[editar | editar código-fonte]

Prenomes formados por uma só palavra são ditos atômicos, e prenomes compostos por mais de uma palavra são ditos compostos. No Brasil também são populares os prenomes compostos, por exemplo Ana Maria e Fernando Henrique, composições elas mesmas populares, de dois prenomes atômicos populares.

Apesar dos prenomes compostos não terem sido registrados pelo IBGE, podem ter uma estimativa de popularidade realizada por ferramentas (ex. Google trends) e levantamentos (ex. oficial de Portugal) complementares, e levar em conta a hipótese de que "é natural" concatenar dois prenomes populares (ou um popular e um exótico) para formar um prenome composto.

Existem também prenomes compostos tais como Maria das Dores que não são formados por prenomes atômicos. Eles requerem estimativas mais específicas. Em ambos os casos a Wikidata apresenta alguns registros, mas deve-se lançar mão de outras fontes.

Prenomes compostos ainda não possuem um critério objetivo para sua classificação e análise.

Prenome canônico[editar | editar código-fonte]

Qualquer conjunto de prenomes semelhantes pode ser representado por um "membro típico". Convencionamos no Observatório dos Prenomes que o elemento canônico de um conjunto qualquer de variantes é o mais popular, ou seja, aquele que apresenta maior número de brasileiros com aquele prenome — portanto maior multiplicidade no multiconjunto HPR ou HPR1asc do IBGE.

Como os conjuntos de variantes podem ter elementos distintos, convencionou-se que o canônico deve ser eleito entre as variantes fonéticas.


Curadoria e núcleos curadores[editar | editar código-fonte]

Mesmo apresentando critérios objetivos, diversas decisões, na hora de classificar uma variante, precisam ser tomadas em consenso com um grupo de pessoas que ensossam a decisão. Em particular as decisões "de fronteira", onde há ambiguidades e não existem fontes fiáveis reforçando com clareza uma ou outra posição, requerem opinião consensual ou votação dos curadores.

Como não existe uma curadoria permanente, adotam-se "núcleos curadores", em torno de um conjunto de prenomes ou um período de tempo.

Assinatura da curadoria[editar | editar código-fonte]

As curadorias e núcleos curadores devem ser registrados com o username-Wikiversity de seus membros, e a primeira seção da página de discussão de cada prenome, denominada Curadores responsáveis, deve apresentar edições de manifesto de endosso de pelo menos 3 curadores, incluindo o próprio redator (que já estará presente no histórico de edições do artigo).