Estatística e Probabilidade Unidade 1- População e Amostra
-
Upload
wesleycamposaraujp -
Category
Documents
-
view
11 -
download
1
description
Transcript of Estatística e Probabilidade Unidade 1- População e Amostra
Estatísticaamintas paiva
afonso
Exemplos da utilização de Estatística
Exportações brasileiras de carne bovina in natura em volume (mil toneladas) e receita (US$ milhões /ton)
Exemplos da utilização de Estatística
Exemplos da utilização de Estatística
Exemplos da utilização de Estatística
PopulaçãoAmostra
Parâmetros
Estatísticas
MédiaDesvio padrãoProporção etc.
MédiaDesvio padrãoProporção etc.
InferênciaConhecim
ento da
população
Con
heci
men
to
da a
mos
tra
Processo de amostragem
IMPORTÂNCIA DA AMOSTRAGEM
Coleta de dados – Amostragem
IMPORTÂNCIA DA AMOSTRAGEM
Avaliar a temperatura da água da piscina mergulhando a ponta do pé;
Assistir um programa de tv por alguns minutos para ver se vale a pena assisti-lo até o fim;
Fabricar lotes pilotos para depois se lançar à fabricação em grande escala.
“Não é preciso comer um bolo inteiro para ver se é bom.”“Não é necessário analisar 100 toneladas de minério de ferro para saber sua composição química. Basta fazer uma boa amostragem e analisar quantidades bem menores, conhecendo-se o erro que se corre.”
Coleta de dados – Amostragem
AmostragemProblemas: quanto pesa, em média, uma folha de eucalipto?
Amostragem ou Censo?
Por que fazer amostragem?- população infinita- diminuir custo- aumentar velocidade na caracterização (medidas que variam no tempo)- aumentar a representatividade- melhorar a precisão (mais cuidado na obtenção dos dados)
- minimizar perdas por medidas destrutivas
Por que fazer censo? - população pequena ou amostragem muito grande em relação a população - precisão completa (não se permite erros) - já se dispõe da informação completa
1 kg? 1 g? 1 g
quantas folhas tem, em média, um eucalipto? 2? 1.000? 1.000.000.000?
AmostragemProblemas: quanto pesa, em média, uma folha de eucalipto?1 kg? 1 g? 1 g
quantas folhas tem, em média, um eucalipto? 2? 1.000? 1.000.000.000?
Quanto amostrar?
Depende: - da variabilidade original dos dados (maior variância maior n) - da precisão requerida no trabalho (maior precisão maior n) - do tempo disponível (menor o tempo menor n) - do custo da amostragem (maior o custo menor n)
Como amostrar? - amostragem probabilística X não probabilística
Amostragem
Amostragem Probabilística e Não Probabilística
Amostragem probabilística:cada elemento da população tem uma probabilidade (não nula) de ser escolhido
Amostragem não probabilística:- amostragem restrita aos elementos que se tem acesso (ex: drogados)- escolha a esmo (ex: coelhos numa gaiola, escolha de parafusos numa caixa)- impossibilidade de sorteio (ex: sangue)- amostragem intencional ou por julgamento (ex: escolha de elementos “típicos”)- voluntários (ex: testes de vacina)
Amostragem
Amostragem Aleatória Simples
Escolhe-se n elementos de uma população de tamanho Namostra = {X1, X2, ..., Xn}
Exemplo: escolher 10 pixels de uma imagem 13x17etapas: rotular cada pixel com um código único
sortear aleatoriamente 10 códigos (tabelas ou geradores de números aleatórios)
identificar os pixels selecionadosOBS:
método mais simplespressupõe população homogênea
AmostragemAmostragem Aleatória Estratificada
Primeiramente a população (N) é dividida em L sub-populações (estratos) com N1, N2, ..., NL elementos. Para cada estrato, escolhe-se ni elementos aleatoriamente, totalizando n elementos.
i
nn
L
ii
Nn n
N
1
i ii L
i ii
N sn n
N s
ni proporcionais a Ni
todos iguais
tamanho ótimo (considera a variabilidade)
Exemplo: escolher 10 pixels de uma imagem 13x17etapas: selecionar um estrato
rotular cada pixel com um código únicosortear aleatoriamente ni códigos
(tabelas ou geradores de números aleatórios)identificar os pixels selecionadosrepetir o processo para todos os estratos
OBS:usado para população heterogênea(estratos homogêneos)
AmostragemAmostragem Sistemática
Se os elementos da população já se encontram ordenados segundo algum critério, pode-se selecionar um elemento qualquer e escolher um “passo” que definirá qual será o próximo elemento escolhido.
1 10 20
passo = 5
Exemplo: escolher pixels de uma imagem 13x17 com passos 5 em x e 4 em yetapas: escolher aleatoriamente um pixel na janela 5x4 superior esquerda
com base nesse pixel, definir uma grade com espaçamento de 5x4 elementos
identificar os pixels selecionados
OBS:amostra-se uniformemente todo o espaço
AmostragemOutras Amostragens
Amostragem em múltiplos estágios
talhões
amostragem sistemáticadentro do talhão
Amostragem por conglomerados
conglomerados
amostra-se todos (ou alguns)elementos do conglomerado
Solução:
Inferência Estatística, que consiste na extração de pelo menos uma amostra da população, que após trabalhada terá seus resultados inferidos para a população.
Amostragem
Questões que surgem: Como obter uma boa amostra? O que trabalhar na amostra? No processo de inferência, qual o erro da
pesquisa? Quais as decorrências lógicas do processo
inferencial?
Amostragem
1.1 - AMOSTRAGEM POR CONVENIÊNCIA (NÃO PROBABILÍSTICA): a amostra é formada obedecendo a algum tipo de conveniência de quem forma a amostra ou de quem vai participar da amostra ou de ambos.
Técnicas de Amostragem
Amostragem
1.2 - AMOSTRAGEM PROBABILÍSTICA. Teoricamente é identificada pela existência de uma probabilidade conhecida associada a cada elemento de participar da amostra. Alguns exemplos clássicos são:
amostragem aleatória simples, amostagem sistemática, amostragem estratificada e amostragem por conglomerado.
Técnicas de Amostragem
Amostragem
Técnicas de Amostragem
1.2.1 – AMOSTRAGEM ALEATÓRIA SIMPLES ( AAS )
Todos os elementos da população tem mesma probabilidade de pertencer à amostra, isto é, 1/N.
A amostragem pode ser feita com ou sem reposição.
Usa-se a Tabela de Números Aleatórios.
1.2.2 – AMOSTRAGEM SISTEMÁTICA
Determina-se a cota amostral pela fórmula, k = N/n. Escolhe-se aleatoriamente um elemento no intervalo; este será o primeiro elemento da amostra. O segundo elemento será o primeiro mais k, e assim sucessivamente.
Técnicas de Amostragem
Amostragem
1.2.3 – AMOSTRAGEM ESTRATIFICADA
Divide-se a população em subgrupos (estratos) de itens similares, procedendo-se à amostragem em cada estrato, proporcional ao tamanho do estrato. Como os subgrupos são relativamente homogêneos, a variabilidade é menor, necessitando de um tamanho menor de amostra.
Exemplo: estratos por idade, renda, ...
Técnicas de Amostragem
Amostragem
1.2.3 – AMOSTRAGEM ESTRATIFICADAPara determinar o número de elementos da população
no i-ésimo estrato que irá participar da amostra (ni )
podemos usar a seguinte fórmula:
n
ni = -------- Ni
N
onde n é o tamanho da amostra, N é o tamanho da população e Ni é o tamanho do estrato. O quociente
n/N é denominado fração amostral e notado por f.
Técnicas de Amostragem
Amostragem
1.2.4– AMOSTRAGEM POR CONGLOMERADOS
Dispõem-se os itens da população em subgrupos fisicamente próximos e heterogêneos, representativos da população global.
Exemplo: um quarteirão de uma cidade, bairros, municípios.
Técnicas de Amostragem
Amostragem
De maneira geral, quando trabalha-se com variáveis qualitativas, o tamanho da amostra varia de 100 a 2000; se a variável é quantitativa o número de elementos da amostra varia de 30 a 100.
Estes valores são estabelecidos de acordo com as restrições de tempo e de custo de cada pesquisa.
Se não houver restrição de nenhuma natureza faz-se n=2000 (qualitativa) ou n=100 (quantitativa).
Se a população é homogênea com cadastro, recomenda-se usar a amostragem aleatória simples.
2. COMPONENTES BÁSICOS DA REPRESENTATIVIDADE DE UMA AMOSTRA
Amostragem
a) População única com cadastro.
Ex : População dos funcionários das Agências Publicitárias no R.S.
Usar a técnica de AAS.
b) População única volúvel.
Ex : População de clientes de um shopping, de um super-mercado, etc.
Usar Amostragem Sistemática.
3. Plano Amostral
Amostragem
Ex.: Suponhamos que se quer fazer uma pesquisa de opinião em uma população de tamanho 40.000 (N=40.000) vamos tomar uma amostra de tamanho 2.000 (n=2.000) pois a variável é qualitativa e não há restrição de tempo, custo, etc.
Quota amostral: k = N / n = 40.000 / 2.000 = 20.
A cada 20 clientes, 1 será investigado.
O 1º elemento da amostra é escolhido aleatoriamente na população, suponhamos o 12º cliente ; o 2º elemento será o 32º cliente (12 + 20) ; o 3º elemento será o 52º cliente (32 + 20) e, assim sucessivamente.
3. Plano Amostral
Amostragem
a) População segmentada. Ex : População de clientes de uma empresa que possui várias filiais.
Usar Amostragem Estratificada. Ex.:Suponhamos que quer se fazer uma pesquisa de
opinião sobre o atendimento, ou a aceitabilidade de um produto, em uma empresa que possui 4 filiais tal que
Filial 1 : N1 = 5.000 clientes
Filial 2 : N2 = 12.000 clientes
Filial 3 : N3 = 8.000 clientes 40.000 clientes
Filial 4 : N4 = 15.000 clientes
3. Plano Amostral Amostragem
Como é uma pesquisa de opinião sem restrições de tempo, custo, etc, vamos tomar n = 2.000.
Fração amostral : f = n / N = 2.000 / 40.000 = 0,05 (constante).
Composição da amostra:
n1 = 0,05 x 5.000 = 250
n2 = 0,05 x 12.000 = 600
n3 = 0,05 x 8.000 = 400
n4 = 0,05 x 15.000 = 750
3. Plano Amostral Amostragem
Exemplo 1: Comparação: Testes sobre medicamentos
Avaliação sobre novo analgésico
20 indivíduos selecionados
RemédioQuantos relataram diminuição da dor
Novo 8
Padrão 5
A diferença observada é
real ou aleatória?
10 tomam novo medicamento
10 tomam remédio padrão
Amostragem
Exemplo 2: Previsão: Demanda por produtos e serviços
Quantos leitos hospitalares serão necessários?
Quantas vagas serão necessárias nas diferentes séries escolares?
Quanto um supermercado venderá nas festas de fim de ano?
(Métodos estatísticos de previsão)
Amostragem
Exemplo 3. Explicação de resultados
Fatores de prognóstico para pacientes
Fatores de risco para doenças
Determinantes de desempenho escolar
Amostragem
Dados qualitativos Dados quantitativos
Ou dados categóricos ou atributos (podem ser distribuídos em categorias mutuamente exclusivas.
Se distinguem por alguma característica não-numérica
Consistem em números que representam contagens ou medidas
Exemplos: idade, estatura, peso, etc.
Ordinais: tem ordenação natural. Ex: grau de instrução (1a , 2a, etc.)Nominais (Sexo, cor, causa de morte, grupo sanguíneo, etc.)
Discretos (inteiros)
Contínuos (cm, kg, etc.)
Coleta de Dados – Tipos de dados
DADOS
DADOS CONTÍNUOS
DADOS DISCRETOS
São os dados referentes às variáveis contínuas que podem assumir qualquer valor num intervalo contínuo São dados quantitativosRepresentam mensurações (medidas)
São dados referentes às variáveis discretas que assumem valores inteiros e são resultantes de uma contagem de itens Representam contagemSão dados quantitativos
Coleta de Dados – Tipos de Dados
Como são classificados os dados quantitativos?
Coleta de Dados – Tipos de Dados
velocidade dos carros de fórmula 1
tempo de aula
número de carros fabricados em abril
densidade dos fluidos de petróleo
número de animais do pasto abatidos
altura dos edifícios do centro de BH
número de pedestres/min na passarela
dureza dos materiais ferrosos
número de cds vendidos no shopping
peso de bêbes recém-nascidos
Dado contínuo discreto
X
X
X
X
X
X
X
X
X
X
DADOS
QUALITATIVOS: ou dados categóricos ou atributos
QUANTITATIVOS: são números que representam contagens ou medidas
Discretos
Resultam de um conjunto finito de valores possíveis,
sendo dados normalmente
inteiros. Representam
contagens.
Nominais
São nomes, rótulos ou
categorias. Não podem estar
dispostos num esquema ordenado.
Ordinais
São dados que podem estar dispostos em
alguma ordem, mas as diferenças entre os valores não podem ser determinadas.
Contínuos
Resultam de um conjunto infinito de valores que podem estar associados
numa escala contínua;
Representam mensurações.
Ex.: Bebida preferida, tipos de
falhas, etc..
Ex.: Níveis de avaliação de um
serviço.
Ex.: número de falhas de cada
máquina da linha.
Ex.: Variações do diâmetros de um eixo fabricado.
Coleta de Dados – Tipos de Dados
idades, pesos
nº alunos menino/menina 2º grau
velocidade Km/h
nº defeitos / carro
cores grau de limpeza
valor em R$ nº ofertas acima do preço muito dispendioso
Dados da mesma população originam diferentes tipos de dados.
natureza dos dados
alunos 2º
grau
automóveis
vendas de imóveis
populaçõescontínuo discreto nominal
por postos ou ordinal
Coleta de Dados – Tipos de Dados
INFORMAÇÕES, DADOS..........
Coleta de dados Organização Análise
Tomada de decisão
Dados primários Dados coletados por você
Dados secundários Dados coletados por outros
A quantidade de erros podem até destruir ou prejudicar a validade dos resultados
O bom planejamento da coleta (amostragem)
qualidade dos dados
Coleta de Dados - Introdução
Quando os dados secundários não estão disponíveis ou eles são inadequados
Coletamos os nossos próprios dadosO que fazemos
toda a população
amostra
coleta
levantamento do dinheiro contido nos caixas do banco no final do dia
Exame de fezes, de sangue, urina
Coleta de Dados - Introdução
PopulaçãoAmostra
Parâmetros
Estatísticas
MédiaDesvio padrãoProporção etc.
MédiaDesvio padrãoProporção etc.
Inferência
Conhecimento da
população
Con
heci
men
to
da a
mos
tra
Processo de amostragem
AMOSTRAGEM
Coleta de Dados - Amostragem
POPULAÇÃO
É uma coleção completa de todos elementos (valores, pessoas, medidas etc.) a serem estudados.
CENSO
É uma coleção de dados relativos a todos elementos de uma população.
AMOSTRA
É uma parte extraída dos elementos da população.
Coleta de Dados – Conceitos Importantes
População Amostra
Altura de todos alunos do colégio Altura dos alunos da turma 23 do colégio
Carros que passam no posto de pedágio no período de 24:00h
Carros que passam no posto de pedágio no período de 11:00 às 12:00h
Produção de 30 dias de uma fábrica Produção de 1 dia de uma fábrica
Número de notas fiscais emitidas em 2006
Número de notas fiscais emitidas em 1 mês do ano de 2006
PH dos vinhos produzidos na safra de 2006 no Brasil
PH dos vinhos de 800 garrafas da safra de 2006 no Brasil
Peso dos pacotes (1Kg) de macarrão produzidos em dez/2006
Peso de 300 pacotes de macarrão (1 kg) da produção de dez/2006
POPULAÇÃO, AMOSTRA E CENSO
Coleta de Dados – Conceitos Importantes
www.matematiques.com.bramintas paiva
afonso