Estatística Básica Aplicada/lixo-material-rascunho

Fonte: Wikiversidade

...

O que sabemos sobre Teoria dos Conjuntos? Teoria da Decisão? O que sabemos sobre os conceitos de Probabilidade? Qual a notação usual da álgebra de conjuntos e de probabilidades? ... O que precisamos revisar?


Lembretes e motivações[editar | editar código-fonte]

A seguir uma breve introdução de problemas que justificam o conhecimento da Teoria dos Conjuntos no contexto da estatística.

Nomes e coisas sem nome[editar | editar código-fonte]

O que são nomes?

Todas as coisas a nossa volta possuem um nome, alguém as "batizou" e justamente por isso somos capazes de falar delas... Esse alguém é a tradição e o consenso na comunidade de falantes de uma língua.

Se não sabemos o nome, apontamos com o dedo.

Quando criança, mesmo dominando a fala, ainda não conseguimos “falar de todas as coisas”, pois não sabemos o nome de todas elas... Quando crianças, levamos um tempo aprendendo e memorizando, então apontamos o dedo para aquilo que ainda não sabemos o nome.

Também aprendemos que existem contextos e sinônimos: na cozinha ao dizer “nenê qué água”, a "água" faz referência à bebida; na piscina é referência à própria piscina. Em casa o nenê sabe que Mariana é a sua babá, mas na escola é a diretora.
A cada um dos termos empregados pelo nenê existem sinônimos mais específicos, que o adulto, pelo contexto, traduz como “água do filtro”, “água da piscina”, “Mariana Eugência da Silva” e “Maria Mariana Carvalhosa”.

Diagrama ilustrando a interseção de dois conjuntos.

Ancorando nomes a exemplos concretos: a criança não deixa de se comunicar quando ela aponta com o dedo (!). De fato, está usando no lugar do nome o próprio objeto... A rigor, usando um "apontador do objeto". É o que os hiperlinks (ditos URLs) fazem na Web, apontam para o endereço do objeto, dispensando o seu nome.

Outro recurso, mental e linguístico, para "apontar com o dedo" de forma mais simbólica, são os operadores conjuntivos (operadores ⋃ e ⋂ da Teoria dos Conjuntos). Eles são usados com frequência no discurso científico para se referir a coisas complexas que não possuem nome. Exemplos em frases:

“foi obtido juntando tudo, as coisas Desse saco com Aquele”, pode ser expresso pelo operador união,
“a parte da população M dos mamíferos comum à população O dos ovíparos”, .
Podemos então dizer que o ornitorrinco está entre eles, .

As expressões de conjuntos permitem designar as coisas sem a necessidade de batizá-las com um nome (!). Por isso podemos dizer que a álgebra de conjuntos é também uma ferramenta de linguagem do cientista.

Nomes únicos e identificadores[editar | editar código-fonte]

Vimos que, conforme o contexto (case e escola no exemplo acima) um mesmo nome, Mariana, pode designar pessoas diferentes. Quanto mais abrangente o contexto, maior a necessidade de um nome mais cumprido para não confundir com outros. Os matemáticos referem-se a esse contexto como "universo". Quando o universo é o Brasil, nem mesmo o nome completo é suficiente, e a solução prática é a adoção do código de CPF.

Tanto o primeiro nome, como o nome completo e o CPF são identificadores: eles permitem identificar o objeto dentro de um certo universo.

Na simbologia matemática, na Física, nos sistemas de software, etc. também existem símbolos que fazem papel de nomes próprios para certos contextos (por exemplo a letra G num texto sobre Astronomia designa a Constante gravitacional) mas perdem o significado quando fora de contexto. As variáveis também são contextuais, requerem um enunciado explicando o que significam... E os índices das variáveis (p. ex. em a letra i é um índice), por fim, são identificadores locais.

Dar nomes, controlar termos e rotular índices e variáveis, tudo isso está relacionado com identificação e depende do contexto.

Abstraindo propriedades em catálogos[editar | editar código-fonte]

A ficha catalográfica de um livro da biblioteca, e a ficha descritiva de uma planta na coleção do Jardim Botânico, são exemplos de ferramentas (as fichas) que permitem associar nomes a respectivos identificadores e a outras características do objeto descrito, ditas propriedades. Não precisamos saber tudo de uma planta ou de um livro, bastam algumas informações básicas, elas são suficientes e nos deixam seguros de que a partir delas nos lembraremos do objeto e não nos confundiremos com outros.

Registrar ou batizar com um nome, abstrair propriedades (ex. tamanho, número de folhas, etc.) e fornecer um identificador. São tarefas usuais e ficam registradas em simples tabelas (podendo ser armazenadas em planilhas ou bancos de dados relacionais)... A esse processo chamamos "modelagem relacional" (outro apelido para "tabela" é "relação"), e a designação genérica para os itens da tabela é entidade. Como a tabela cataloga várias entidades do mesmo tipo, dizemos que as tabelas modelam tipos de entidade (ex. livros). Esses conceitos são apresentados no livro ElmNav2011.

Trata-se de um recurso sofisticado para modelar conjuntos de qualquer tipo. E, novamente, sendo conjuntos, permite-se a definição de outros a partir de operações de união, intercessão... Figuras 8.1 (pag 247), 8.2 e 8.3 mostram a modelagem de classes, superclasses e herança... PS: para modelagens mais sofisticadas, Entidade-Relacionamento, ver Figura 7.9 pag 213 ilustrando construção de relacionamentos ...

Abstraindo a realidade através de modelos[editar | editar código-fonte]

Outra importante aplicação para o uso dos conjuntos, é como ferramenta de modelagem... Um modelo matemático é uma representação ou interpretação simplificada da realidade, ou uma interpretação de um fragmento de um sistema, segundo uma estrutura de conceitos mentais ou experimentais.

Um modelo pode ajudar a explicar um sistema e a estudar os efeitos de diferentes componentes, e até fazer previsões sobre o seu comportamento.

Além de ilustrar a modelagem da escola, os seus subconjuntos de pessoas podem ser considerado um exemplo de classificação dos elementos da escola. A classificação de conjuntos em subconjuntos é outro tópico de grande importância na Estatística.

O livro ElmNav2011 no seu capítulo 8 mostra como os fatos e objetos do mundo real podem ser abstraídos e modelados como conjuntos através de diagramas.

Agrupamentos sistemáticos[editar | editar código-fonte]

Denominamos agrupamento dos elementos de um conjunto , ao processo de definir subconjuntos com as seguintes características:

Resumidamente: os grupos de são disjuntas entre si, a sua união reproduz C, e cada classe tem pelo menos um elemento.
Em estatística os grupos também são denominados classes.

Um mosaico com células coloridas.

Visualmente, se imaginarmos elementos como pontos no plano, os grupos formam um mosaico, cobrindo completamente a superfície original, sem buracos nem interseções.

Fundamentos matemáticos[editar | editar código-fonte]

Um conjunto é considerado um dos conceitos mais básicos da matemática, sendo o elemento principal da Teoria dos Conjuntos. A partir das noções de conjuntos define-se o próprio conceito de número, e organizam-se os números também em conjuntos,

A seguir uma rápida revisão dos conceitos e notações que usaremos neste curso.

Conjuntos e multiconjuntos[editar | editar código-fonte]

A Teoria dos Conjuntos é ensinada nas escolas, mas a rigor os seus fundamentos são axiomatizados como teoria dos conjuntos de Zermelo-Fraenkel, prevendo também as chamadas operações conjuntivas (interseção, união e diferença) e algumas regras, tais como a não-repetição de elementos. Na Estatística, podemos manter o uso da mesma notação e rigor da conceituação, e sem lançar mão de notações ou conhecimentos mais profundos do que aquelas que adquirimos na escola.

Conjuntos são simbolizados por letras maiúsculas em itálicos, e eventualmente por nomes iniciados por maiúsculas. Elementos são simbolizados por letras minúsculas. A relação de pertinência do elemento no conjunto é dada pelo operador .

A definição extensiva de conjuntos finitos pode ser realizada pela notação usual das chaves, por exemplo . Também é valida a definição intensiva, que descreve propriedades dos elementos na forma , onde a letra y é um "elemento genérico", dito variável descritora dos elementos.

Basta dizer que e são conjuntos... pronto, estão batizados. Em seguida podemos falar dos seus elementos: por exemplo expressa que o número 7 é um elemento do conjunto A; que sp é elemento de Brasil. No último exemplo sp é um identificador (abrev. de São Paulo). As letras minúsculas também são empregadas nas variáveis que representam "elementos quaisquer" de um conjunto.

Só declarar que alguns elementos estão no conjunto pode ser esclarecedor, mas ainda não proporciona uma definição completa do conjunto. Só com a definição completa podemos afirmar que conhecemos, fomos apresentados ao conjunto que leva aquele nome. Exemplo de definição intensiva

e pode ser lido como A é o conjunto dos elementos x tais que x é um dos 4 primeiros números primos.

Repare que um conjunto de pares ordenados pode ter mais de uma variável. Um conjunto de pontos geográfcos, por exemplo .

Domínio de uma variável descritora de elementos é o conjunto dos valores válidos para a variável.

Na expressão , onde x simboliza uma variável, o conjunto D está representando implicitamente o domínio.
Em alguns livros, como ElmNav2011, o domínio é explicitado pela função .
Nas declarações de relações e funções , dizemos que X é domínio de f, ou seja , no lugar de referenciar a variável.

Qualquer conjunto pode ser adotado como domínio. Em geral, como lidamos com variáveis quantitativas, os domínios são intervalos numéricos.

Exemplo: conjunto T das temperaturas (em graus centígrados °C) válidas é um subconjunto dos Reais limitado pelas leis da Física, ou seja, podem ser negativas mas não abaixo do "zero absoluto", -273,15°C. ou, dispensando a descrição semântica e limitando pela temperatura do sol, .

Multiconjuntos e sequências de valores observados

São estruturas matemática ligeiramente mais sofisticadas que conjuntos, permitindo expressar elementos repetidos.

Um Multiconjunto é um conjunto usual munido do operador de multiplicidade do elemento, que informa quantas vezes um elemento se repete. Na representação extensiva adota-se a mesma simbologia (elementos entre chaves) que a dos conjuntos, porém permitindo a sua repetição.

Uma Sequência formalmente é uma relação do conjunto dos Naturais com o conjunto (ex. D) dado, que fará o papel de domínio dos valores da sequência: . Cada elemento da sequência pode ser identificado por seu índice,

As observações podem se repetir, de forma que o conceito de conjunto não se presta a "guardar valores observados". Na Matemática as estruturas mais populares para se expressar observações são o multiconjunto e a sequência. O termo "multiconjunto" destaca a propriedade em que difere do conjunto:

  • O multiconjunto contém apenas elementos e , cada um tendo multiplicidade 1.
  • No multiconjunto , tem multiplicidade 2 e multiplicidade 1.
  • No multiconjunto , ambos elementos, e , tem multiplicidade 3.

Cardinalidade de um conjunto ou multiconjunto, é a quantidade o número de elementos contidos nele.

A operação concreta que leva à cardinalidade é a contagem.

A função n de um conjunto ou multiconjunto X, , retorna a sua cardinalidade.

Poderíamos usar cores ou símbolos diferentes para falar de conjuntos, multiconjuntos ou sequências, mas, infelizmente, não existem convenções ou tradições de uso para essas representações alternativas: é importante sempre estar atento (!) pois as três representações seguem praticamente a mesma notação que a de conjuntos. Na dúvida use (ou suponha) o conceito mais robusto, que é o de sequência.

Pares ordenados e produto de conjuntos[editar | editar código-fonte]

...

Observações estatísticas[editar | editar código-fonte]

...

Sumarizações

Sumarizar um resultado, no sentido de resumir, no caso de o resultado estar sendo representado por um multiconjunto, é mostrar apenas um elemento representativo desse multiconjunto. Pode ser uma amostra aleatória, ou pode ser um elemento com maior probabilidade de ser amostrado, ou ainda um elemento externo (de outro conjunto) que permita abstrair melhor a "tendência central" das amostragens.

As sumarizações de maior interesse da Estatística são aquelas que expressam tendências. Como veremos, a "tendência central" nem sempre existe numa sequência, como pode ser visto nas sequências de inteiros crescentes.

Moda É a forma mais simples de sumarizar e apresentar tendências, definida pelo elemento que ocorreu com mais frequência. No multiconjunto do exemplo acima, apenas o número 24 aparece mais de uma vez, logo ele é a moda.

Mediana É a forma mais simples de sumarizar e apresentar tendências, definida pelo elemento que ocorreu com mais frequência. No multiconjunto do exemplo acima, apenas o número 24 aparece mais de uma vez, logo ele é a moda.

A mediana não faz sentido em multiconjuntos qualitativos, tais como frutos de uma banca na feira: , com cada a representando amora, e cada b representando berinjela. Os valores observados precisam apresentar uma ordem: numérica, alfabética onde a posição na sequência destaca uma magnitude (por exemplo "nota A", "nota B"), portanto o "representante mediano" tem significado.

Quando ordenamos os elementos do multiconjunto, estamos mapeando o multiconjunto numa sequência.

Média aritmética simples

A média faz sentido quando um "valor semelhante" é uma medida aceitável, mesmo que não pertença ao multiconjunto dos valores observados. Na aritmética sabemos descrever o valor que fica "no meio", entre outros dois:

(valor m é o valor médio entre x e y)

e se acontecer de teremos que, necessariamente, .

A média aritmética simples é a mais utilizada no nosso dia-a-dia. É obtida dividindo-se a soma das observações pelo número delas. É um quociente geralmente representado pelo símbolo . Se tivermos uma série de n valores de uma variável v, a média aritmética simples será determinada pela expressão:

Revisão prática online[editar | editar código-fonte]

A caixa preta[editar | editar código-fonte]

Lição de casa[editar | editar código-fonte]