Discussão:Observatório dos Prenomes/Lixo-1

O conteúdo da página não é suportado noutras línguas.
Fonte: Wikiversidade

A página w:Antroponímia_da_língua_portuguesa apesar de conter informações duvidosas, possui boas dicas:

  • "Em Portugal, os recém-nascidos só podem ser batizados com nomes de uma lista de nomes próprios permitida pelo Direito Civil".
  • "No Brasil, não há restrição legal sobre o batismo de recém-nascidos, a não ser que o nome próprio tenha um significado que pode humilhar ou constranger o indivíduo no futuro".
  • Teresa, Thereza, ou Tereza? "Teresa é a única forma correta na ortografia atual".
  • Fenômeno das tantas Marias: "Tradicionalmente, Maria é mais comum na primeira parte de uma combinação de dois nomes próprios; tais combinações podem ser formadas por vários elementos diferentes"...
    • Atributos religiosos: Maria da Conceição, Maria das Dores, Maria da Assunção, Maria da Natividade, Maria de Fátima, Maria de Lurdes (Lurdes / Lourdes), Maria de la Salete, Maria Aparecida.
    • Nomes de santos: Maria José.
    • Fenômenos e elementos da natureza: Maria do Céu, Maria da Luz, Maria do Mar, Maria da Graça.

...

Definição automática de conjuntos, pelos templates wdset, wdsetEq e wdsetSubOf.

texto resultante     sintaxe (template)
A = { ∀aInstancesOf(Q12308941) | predicado textual sobre a }     {{wdsetEq|A|a|Q12308941|predicado textual sobre ''a''}}
X = { ∀xInstancesOf(Q21199) | x é impar menor que 900 } {{wdsetEq|X|x|Q21199|''x'' é impar menor que 900}}
{ ∀xInstancesOf(Q21199) , ∃k | } {{wdset|x|Q21199|<math>~2k+1=x ~\land~ x<900</math>|k}}
P = { ∀pInstancesOf(Q5) | p é nascida no Brasil } {{wdsetEq|P|p|Q5| ''p'' é nascida no Brasil}}

Lembrando que o template wd é o link para classes, mas falta wdprop para link de propriedades. wdsetEq difere de wdset por incluir o "X=" na frente, requerendo o rótulo do conjunto como parâmetro... "Domínio de discurso": é o que justifica o uso do universo na contextualização do elemento, ver w:en:Domain of discourse.

Opções e decisões de rigor[editar código-fonte]

  • uso ou não do "for all" (∀ = qunatificador existencial) como quantificador da variável. Preferência por usar.
    • Não usar sem conjunto-universo (x∈U), visto que sempre é possível traduzir para conjuntos. Por exemplo "A={a | a∈X ^ a∈Y}" seria traduzido para "A={a ∈ XUY}"
  • precisa lembrar que todo elemento é minúscula e necessariamente um "atômico"? Ver w:en:Urelement, parece dispensável pois são "conjuntos-padrão".
    • Ver w:Teoria dos conjuntos ("teoria padrão" = "axiomas de Zermelo-Fraenkel com o axioma da escolha")... The "Zermelo–Fraenkel axioms plus the axiom of choice", is the canonical axiomatic set theory of contemporary mathematics.
      Convém conferir se, no Brasil, os conceitos de teoria dos conjuntos são integrados em todo currículo de Matemática.
  • uso ou não dos conversores "InstancesOf" (converte classe semântica Wikidata em conjunto de suas instâncias) e ... propriedades (permitem expressar diretamente predicados RDF). Preferir inglês para facilitar uso de outros conhecidos como Select ou Distinct, o uso de SQL pode facilitar... Ver projeções (getters) e restrições (where) abaixo.
  • uso ou não dos "getters", ex. GetNames(Q), para extração do "multiconjunto dos atributos" das instâncias de Q. Sugestão de seguir convenções CakePHP (Spring-boot ou similares) para plural e singular. Por exemplo conjunto dos prenomes das pessoas seria GetPrenomes(Q5) mas requer definição previa de prenome, daí ter seu canônico GetQ202444sOf(Q5) ou InstancesOf(Q202444 of Q5)... Requer uma definição mais rígida.
  • uso ou não mais explícito de RDF e SparQL-simplificada nas expressões puramente Wikidata... Aí trata-se de implementação formal.

Lembretes de conceitos e convenções relacionadas: w:en:Bounded quantification, w:en:Quantifier (logic), w:en:Universal quantification, w:en:Existential quantification.

Opções de layout[editar código-fonte]

Ficam ainda pendentes os comentários, uma convenção (por exemplo uso do "#") para comentários de linha, e a questão de dar preferência ao uso de termos ao invés de identificadores. Templates "_tr" (translated).

texto resultante     sintaxe (template)
A = { ∀aInstancesOf(PrenomeMasculino) | blabla1 }     {{wdsetEq_tr|A|a|PrenomeMasculino|Q12308941|blabla1}}
P = { ∀pInstancesOf(Pessoa) | p é nascida no Brasil } {{wdsetEq_tr|P|p|Pessoa|Q5| ''p'' é nascida no Brasil}}

Lembretes sobre o uso de templates:

* wd = link Wikidata com opcional de termo
* wd_showId = link com opcional de termo e ID entre parentesis
* wd2 = mostra os 2, termo Wikipedia e ID wikidata com link
..

Prenomes populares[editar código-fonte]

Consideraremos que um prenome é popular no Brasil se 0,1% ou mais dos habitantes fazem uso dele no seu nome. É um critério bastante arbitrário, uma nota de corte para tornar o conceito de "nome popular" menos vago, e os relatórios estatísticos menos áridos.

  • Exemplos: Alice é popular pois 0,11% dos habitantes fazem uso do nome; Adriana é popular, e três vezes mais frequente que Alice.
  • Contra-exmplos: Allice e Adrinéia não chegam a 0,001%.

Preomes compostos[editar código-fonte]

...

Morfologia dos prenomes[editar código-fonte]

...

Prenomes obtidos pela contração de compostos[editar código-fonte]

No Observatório de dados consideraremos a contração como um fato estatístico e ortográfico, não etimológico. Vejamos o caso do nome Marialice:

  • Se "Maria Alice" existe, "Marialice" existe, e Maria é dominante, então podemos supor a contração da raiz "Mari" com o nome Alice, resultando "Mari+Alice = Marialice".
  • Se "Maria Ana" existe, "Mariana" existe, e Maria é dominante, então podemos supor a contração da raiz "Mari" com o nome Ana, resultando "Mari+Ana = Mariana".

A hipótese da contração morfológica não precisa ser comprovada, simplesmente supomos que as pessoas aceitam com naturalidade essa hipótese, sem necessidade de demonstrações históricas (da Onomástica) ou etimológicas.

A comprovação em geral é lógica (requer apenas buscar nexo), sem dados estatísticos e com registros históricos esparços. No cado da contração Mariana, o w:Dicionário Onomástico Etimológico da Língua Portuguesa explica do ponto de vista histórico, que Mariana é a forma feminina de um derivado latino, marianu, o qual significava «relativo a Mário» (feminino como «relativo a Maria»). Historicamente este adjetivo convergiu (isto é, confundiu-se) com o composto Maria Ana.

Local onde se habita[editar código-fonte]

Idealmente a grandeza que descreve o "habitat" de uma pessoa ou animal é o seu w:en:Home range, aproximnado para um w:en:Local convex hull. As leis de cada país no entanto permitem que, para fins de realização do Censo demográfico, se defina o que é "habitante", talvez mais no sentido de "formalmente residente", do que no quanto tempo fica de fato ao longo do ano no país.

Outra questão é justamente o intervalo de tempo sobre o qual é "batida a foto" da população. Em geral uma campanha de senso pode durar meses, e vai difereir de região para região a época do ano em que é realizada a campanha (ex. inicio ou final do ano). Pode-se convencionar que a maior parte é realizada ao longo de 6 meses, sendo portanto esta a "grossura da foto" na linha do tempo. Não confundir com w:en:Demographic window.

As principais diferenças (nas leis) ocorrem quanto à contabilização ou não de "residentes temporários" e do critério para decidir se um estrangeiro é ou não contabilizado como habitante. Interessantes:

  • usar no RDF a proporiedade P19 (place of birth) para desmembrar a população em nascidos daquele ano e demais habitantes. .. Ver se existe similar, ou se pode usar noção de "ocupante do local", https://www.wikidata.org/wiki/Property:P466
  • ...

Mais lembretes[editar código-fonte]

Notação construtora de conjuntos, e predicados lógicos:

E extensão nossa de domínio do discurso quando se tratando de definições extensivas com domínio ambíguo:

é válido no Brasil ou nos EUA pois a vírgula não é ambígua.
portanto pois no Brasil 2,3 é um número decimal. A rigor deveríamos ter apresentado antes   A = {2;3}.

Para apresentar notação geral, usar A={5,6,7} e B={♠,♥} para mostrar que ♥∉A mas 6∈A ... Ver aqui.