Apostila de Estatística Para Engenharia

49
APOSTILA DE ESTATÍSTICA Aluno: ______________________________________

description

Apostila de Estatística Para Engenharia1

Transcript of Apostila de Estatística Para Engenharia

  • APOSTILA

    DE

    ESTATSTICA

    Aluno: ______________________________________

  • A arte de descobrir novos horizontes Cristiane Sander *

    Se todos ns temos perguntas/problemas e buscamos alternativas para os mesmos e, se a pesquisa nos leva a desenvolver o conhecimento, criar alternativas para problemas e a descobrir novos horizontes, ento todos podemos ser pesquisadores.

    Geralmente, quando ouvimos falar em pesquisa, nos reportamos a laboratrios cheios de aparelhos sofisticados, tubos de ensaio, produtos qumicos etc, ou ento a nmeros, dados, porcentagem, ou ainda, a pessoas importantes, cientistas, doutores, professores e outros. No entanto, a pesquisa no tem endereo certo, quer dizer, no s em laboratrios que ela se encontra. A pesquisa est prxima de ns, ela faz parte do nosso dia-a-dia. Para pesquisar necessrio, em primeiro lugar, ter um problema ou uma pergunta a resolver. Ou seja, quando nos dispomos conscientemente a resolver um problema, estamos dando incio a uma pesquisa. Passos para a pesquisa Para realizar uma pesquisa no h uma receita pronta para seguir. H, no entanto, alguns elementos importantes a observar, dos quais destacamos: Problema: Na vida, no dia-a-dia, nos deparamos com vrios problemas, somos desafiados sempre a tomar decises e definir rumos. Por exemplo, se estamos desempregados, vamos fazer o levantamento de quais so as qualificaes, capacidades, habilidades que possumos e onde podemos ir buscar trabalho dentro dessas condies. Mas buscamos tambm saber por que estamos desempregados, se este um problema que apenas ns estamos enfrentando ou se mais pessoas esto nesta situao. A partir disto, levantamos vrias hipteses, respostas, alternativas para resolver nosso problema. Temos que ter presente que problema na pesquisa no se refere a uma coisa negativa e sim a algo que nos ajuda a construir e encontrar sadas. A forma de levantar um problema, de fazer a pergunta, define de certa maneira a perspectiva que daremos pesquisa. Por isso importante saber fazer as perguntas, ver quem faz as perguntas e para quem e por que estas perguntas/problemas so considerados importantes. Ou seja, quais so os objetivos que pretendemos atingir com a pesquisa. Hipteses: So as vrias possibilidades de soluo que levantamos para responder o problema, ou seja, so respostas antecipadas que imaginamos a partir do conhecimento que j possumos acerca do objeto a ser investigado. No entanto precisamos comprovar ou refutar nossas hipteses para ter um resultado da pesquisa, pois

    no podemos ficar no achismo, em opinies, precisamos ter bases concretas, provas para realizar nossas pesquisas. Para tanto, precisamos buscar dados, o que implica em ver onde podemos busc-los, o que precisamos para comprovar nossas hipteses e qual ser o mtodo que vamos usar. Podemos buscar dados, respostas para nossas pesquisas em vrios lugares: em livros, revistas, jornais(dados bibliogrficos); em arquivos; em fotografias, objetos, ou junto s pessoas, atravs de entrevistas, questionrios etc. Ou seja, s vezes as respostas podem estar onde menos esperamos. Podemos, por exemplo, chegar ao trmino da pesquisa e concluir que as hipteses que levantamos no incio da pesquisa no eram verdadeiras. Isso no quer dizer que a pesquisa no tenha sido vlida, ao contrrio, ela pode nos mostrar justamente por onde no devemos andar, ou ainda, nos mostrar caminhos que antes no havamos pensado em seguir. Por que importante pesquisar? Quando realizamos qualquer pesquisa, precisamos sempre ter presente por que vamos faz-la, em que ela vai contribuir para melhorar a vida das pessoas na sociedade. A pesquisa, antes de tudo, gera conhecimento, pois leva-nos a refletir, pensar, ler, escrever e descobrir novos horizontes. importante que tornemos pblicos os resultados aos quais chegamos, pois se guardamos o conhecimento adquirido para ns, ele no ter importncia nenhuma para a sociedade. A pesquisa nos possibilita tambm a olhar de forma crtica a realidade, na medida em que ela nos instiga busca do novo, para a formulao de novas perguntas e para a produo prpria e criativa do conhecimento. Poderamos iniciar a pesquisa nas escolas e tambm fora dela, para torn-la mais presente em nossa vida. No entanto, a proposta da pesquisa quebra com a lgica pedaggica de muitas escolas, que se preocupam somente em dar respostas aos alunos. Pois, a pesquisa preocupa-se em fazer perguntas e levar os prprios alunos a buscar solues, instigando sua criatividade que leva a questionar aquilo que muitos no querem que seja questionado. * Cristiane Sander, licenciada em histria-UNIJU, mestranda em Servio Social-PUCRS. Abril/2000

  • 3

    Introduo

    PROBABILIDADE

    A histria da teoria das probabilidades teve incio com os jogos de cartas, dados e de roleta. Esse o motivo da grande existncia de exemplos de jogos de azar no estudo da probabilidade. A teoria da probabilidade permite que se calcule a chance de ocorrncia de um nmero em um experimento aleatrio. A estatstica surgiu muito antes da probabilidade e tratava principalmente da coleta, organizao e apresentao de dados por meio de tabelas e cartas. Com o advento da probabilidade, foi constatado que a estatstica poderia ser utilizada para extrair concluses vlidas e tomar decises razoveis com base na anlise de dados, como em teoria da amostragem e previses.

    Experimento Aleatrio

    aquele experimento que quando repetido em iguais condies, podem fornecer resultados diferentes, ou seja, so resultados explicados ao acaso. Quando se fala de tempo e possibilidades de ganho na loteria, a abordagem envolve clculo de experimento aleatrio Exemplos : - Retirar uma carta de um baralho com 52 cartas e observar seu naipe, sua cor ou seu nmero / letra. - Jogar uma moeda 50 vezes e observar o nmero de caras ou coroas obtidas - Retirar com ou sem reposio, bolas de uma caixa que contenha determinadas quantidades de bolas pretas e brancas - Arremessar um dado e observar o nmero da face de cima.

    Espao Amostral

    o conjunto de todos os resultados possveis de um experimento aleatrio. A letra que representa o espao amostral, S. Exemplo: Lanando uma moeda e um dado, simultaneamente, sendo S o espao amostral, constitudo pelos 12 elementos: S = {K1, K2, K3, K4, K5, K6, R1, R2, R3, R4, R5, R6}

    1. Escreva explicitamente os seguintes eventos: A = {caras e um nmero par aparece},

    B = {um nmero primo aparece}, C = {coroas e um nmero mpar aparecem}.

    2. Idem, o evento em que: a) A ou B ocorrem; b) B e C ocorrem; c) Somente B ocorre.

    3. Quais dos eventos A, B e C so mutuamente exclusivos

    Resoluo:

  • 4

    1. Para obter A, escolhemos os elementos de S constitudos de um K e um nmero par: A={K2, K4, K6}; Para obter B, escolhemos os pontos de S constitudos de nmeros primos: B={K2,K3,K5,R2,R3,R5} Para obter C, escolhemos os pontos de S constitudos de um R e um nmero mpar: C={R1,R3,R5}.

    2. (a) A ou B = AUB = {K2,K4,K6,K3,K5,R2,R3,R5} (b) B e C = B C = {R3,R5} (c) Escolhemos os elementos de B que no esto em A ou C; B Ac Cc = {K3,K5,R2}

    3. A e C so mutuamente exclusivos, porque A C =

    Conceito de probabilidade

    Se num fenmeno aleatrio as possibilidades so igualmente provveis, ento a probabilidade de ocorrer um evento A :

    Por, exemplo, no lanamento de um dado, um nmero par pode ocorrer de 3 maneiras diferentes dentre 6 igualmente provveis, portanto, P = 3/6= 1/2 = 50% Dizemos que um espao amostral S (finito) equiprovvel quando seus eventos elementares tm probabilidades iguais de ocorrncia. Num espao amostral equiprovvel S (finito), a probabilidade de ocorrncia de um evento A sempre:

    Propriedades Importantes:

    1. Se A e A so eventos complementares, ento:

    P( A ) + P( A' ) = 1

    2. A probabilidade de um evento sempre um nmero entre (probabilidade de evento impossvel) e 1 (probabilidade do evento certo).

  • 5

    Probabilidade Condicional

    Antes da realizao de um experimento, necessrio que j tenha alguma informao sobre o evento que se deseja observar. Nesse caso, o espao amostral se modifica e o evento tem a sua probabilidade de ocorrncia alterada. Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se ocorrer um sorteio de 2 bolas, uma de cada vez e sem reposio, qual ser a probabilidade de a primeira ser vermelha e a segunda ser azul?

    Resoluo:

    Seja o espao amostral S=30 bolas, bolinhas e considerarmos os seguintes eventos: A: vermelha na primeira retirada e P(A) = 10/30 B: azul na segunda retirada e P(B) = 20/29 Assim: P(A e B) = P(A).(B/A) = 10/30.20/29 = 20/87

    Eventos independentes

    Dizemos que E1 e E2 e ...En-1, En so eventos independentes quando a probabilidade de ocorrer um deles no depende do fato de os outros terem ou no terem ocorrido. Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se sortearmos 2 bolas, 1 de cada vez e respondo a sorteada na urna, qual ser a probabilidade de a primeira ser vermelha e a segunda ser azul? Resoluo: Como os eventos so independentes, a probabilidade de sair vermelha na primeira retirada e azul na segunda retirada igual ao produto das probabilidades de cada condio, ou seja, P(A e B) = P(A).P(B). Ora, a probabilidade de sair vermelha na primeira retirada 10/30 e a de sair azul na segunda retirada 20/30. Da, usando a regra do produto, temos: 10/30.20/30=2/9. Observe que na segunda retirada foram consideradas todas as bolas, pois houve reposio. Assim, P(B/A) =P(B), porque o fato de sair bola vermelha na primeira retirada no influenciou a segunda retirada, j que ela foi reposta na urna.

    Probabilidade de ocorrer a unio de eventos

    Exemplo: Se dois dados, azul e branco, forem lanados, qual a probabilidade de sair 5 no azul e 3 no branco? Considerando os eventos: A: Tirar 5 no dado azul e P(A) = 1/6 B: Tirar 3 no dado branco e P(B) = 1/6 Sendo S o espao amostral de todos os possveis resultados, temos: n(S) = 6.6 = 36 possibilidades. Da, temos:P(A ou B) = 1/6 + 1/6 1/36 = 11/36

    Exemplo: Se retirarmos aleatoriamente uma carta de baralho com 52 cartas, qual a probabilidade de ser um 8 ou um Rei? Sendo S o espao amostral de todos os resultados possveis, temos: n(S) = 52 cartas. Considere os eventos: A: sair 8 e P(A) = 4/52

  • 6

    B: sair um rei e P(B) = 4/52 Assim, P(A ou B) = 4/52 + 4/52 0 = 8/52 = 2/13. Note que P(A e B) = 0, pois uma carta no pode ser 8 e rei ao mesmo tempo. Quando isso ocorre dizemos que os eventos A e B so mutuamente exclusivos.

    Porque a estatstica importante? Os mtodos estatsticos so usados hoje em quase todos os campos de investigao cientfica, j que eles nos capacitam a responder a um vasto nmero de questes, tais como: 1) Como os cientistas avaliam a validade de novas teorias?

    2) Como os pesquisadores mdicos testam a eficincia de novas drogas?

    3) Como os demgrafos prevem o tamanho da populao do mundo em qualquer tempo futuro?

    4) Como pode um economista verificar se a mudana atual no ndice de Preos ao Consumidor

    a continuao de uma tendncia secular, ou simplesmente um desvio aleatrio?

    5) Como possvel para algum predizer o resultado de uma eleio entrevistando apenas

    algumas centenas de eleitores?

    Estes so poucos exemplos nos quais a aplicao da estatstica necessria. Por isso, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em

    contato com dados quantitativos ou tiram concluses a partir destes.

    Definio de Estatstica

    Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta,

    organizao, descrio, anlise e interpretao de dados. Ela dividida em:

    Estatstica Descritiva: parte da Estatstica que apenas coleta, descreve, organiza e

    apresenta os dados. Nela no so tiradas concluses.

    Estatstica Indutiva ou Inferncia: analisa os dados e obtm-se as concluses.

    Estatstica Descritiva

    Fases do Mtodo Estatstico

    Coleta de Dados

    Aps a definio do problema a ser estudado e o estabelecimento do planejamento da

    pesquisa (forma pela qual os dados sero coletados; cronograma das atividades, custos

    envolvidos; exame das informaes disponveis; delineamento da amostra etc.), o passo seguinte

    a coleta de dados, que consiste na busca ou compilao dos dados das variveis, componentes

    do fenmeno a ser estudado.

    A coleta de dados pode ser direta ou indireta.

    Coleta de

    dados

    Crtica dos

    dados

    Apresentao

    dos dados

    Tabelas

    Grficos

    Anlises

  • 7

    - coleta direta: quando os dados so obtidos na fonte originria. Os valores assim

    compilados so chamados de dados primrios, como, por exemplo, nascimentos,

    casamentos e bitos, registrados no Cartrio de Registro Civil; opinies obtidas em

    pesquisas de opinio pblica; ou ainda, quando os dados so coletados pelo prprio

    pesquisador.

    A coleta direta pode ser classificada relativamente ao fator tempo em:

    contnua quando feita continuamente, como por exemplo, nascimentos e bitos,

    freqncia dos alunos s aulas;

    peridica quando feita em intervalos constantes de tempo, como os censos (de

    10 em 10 anos);

    ocasional quando feita sem poca preestabelecida.

    - coleta indireta: quando os dados obtidos provm da coleta direta. Os valores assim

    compilados so denominados de dados secundrios, como, por exemplo, o clculo do

    tempo de vida mdia, obtido pela pesquisa, nas tabelas demogrficas publicadas pela

    Fundao Instituto Brasileiro de Geografia e Estatstica, se constitui em uma coleta

    indireta.

    Crtica dos Dados

    Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis

    falhas e imperfeies, eliminando os erros capazes de provocar futuros enganos de apresentao

    e anlise.

    Apresentao dos Dados

    Aps a crtica, os dados devem ser apresentados sob forma adequada (tabelas ou

    grficos), para o melhor entendimento do fenmeno que est sendo estudado.

    Caractersticas Importantes dos Dados 1- A natureza ou forma de distribuio dos dados como forma de sino, uniforme ou assimtrica. 2- Um valor representativo como uma mdia 3- Uma medida de disperso ou variao. Podemos conhecer alguma coisa da natureza ou forma da distribuio organizando os dados e construindo grficos. Estatstica Descritiva: Tabelas, Sries Estatsticas e Grficos Estatsticos

    Tabelas

    Tabela um quadro que resume um conjunto de observaes.

    Ela composta de:

    - ttulo: conjunto de informaes, as mais completas possveis, respondendo s perguntas: O que?

    (referente ao fato), Quando? (relativo ao lugar), Onde? (correspondente poca);

    - corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;

    - cabealho: parte superior da tabela que especifica o contedo das colunas;

  • 8

    - rodap: reservado pare as observaes pertinentes, bem como a identificao da fonte dos dados .

    Sries Estatsticas

    toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo

    da poca, do local ou da espcie.

    Conforme o critrio de agrupamento as sries classificam-se em:

    a) Srie Cronolgica, Temporal, Evolutiva ou Histrica: a srie estatstica em que os

    dados so observados segundo a poca de ocorrncia. Exemplo:

    Vendas da Companhia Alfa - 1990-1994

    Ano Vendas (em R$ 1.000,00)

    1990 2.181

    1991 3.948

    1992 5.642

    1993 7.550

    1994 10.009

    Fonte: Departamento de Marketing da Companhia Alfa.

    b) Srie Geogrfica ou de Localizao: a srie estatstica em que os dados so

    observados segundo a localidade de ocorrncia. Exemplo:

    INAMPS - Empresas fiscalizadas em 1998

    Regies Empresas fiscalizadas Norte 7.495

    Nordeste 107.783

    Sudeste 281.207

    Sul 53.661

    Centro-Oeste 15.776

    Fonte: Mensrio Estatstico do IBGE

    c) Srie Especfica: a srie estatstica em que os dados so agrupados segundo a

    modalidade de ocorrncia. Exemplo:

    Matriculas no Ensino de Terceiro Grau

    Brasil1995 (ciclo bsico)

    reas de ensino Matrculas

    Cincias Biolgicas 62.109

    Cincias Exatas e Tecnologia 95.949

    Cincias Agrrias 32.419

    Cincias Humanas 178.842

    Letras 39.883

    Artes 37.464

  • 9

    Duas ou mais reas 46.323

    Fonte: Servio de Estatstica do Ministrio da Educao e Cultura.

    d) Distribuio de Freqncias. a srie estatstica em que os dados so agrupados com suas

    respectivas freqncias. Ser vista com mais detalhes a seguir. Exemplo:

    Nmero de Acidentes por Dia na Rodovia X em Janeiro de 2003

    Nmero de acidentes por dia Nmero de dias

    0 10

    1 7

    2 4

    3 5

    4 3

    5 2

    Fonte: DNER.

    Grficos Estatsticos A representao grfica das sries estatsticas tem por finalidade dar uma idia, a mais

    imediata possvel, dos resultados obtidos, permitindo chegar-se a concluses sobre a evoluo do

    fenmeno ou sobre como se relacionam os valores da srie. No h apenas uma maneira de

    representar graficamente uma srie estatstica. A escolha do grfico mais apropriado ficar a

    critrio do analista.

    Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados

    quando da elaborao de um grfico.

    Os principais tipos de grficos.

    a) Grfico em Colunas

    Populao

    Grfico em Colunas

    Ano

    Pop

    ula

    o d

    o B

    rasi

    l (m

    ilhe

    s)

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    1940 1950 1960 1970

    Populao Brasileira

    1940 1970

    Ano Populao

    1940 41 236 315

    1950 51 944 397

    1960 70 119 071

    1970 93 139 037

    Fonte: Anurio Estatstico

    - 1974 -

  • 10

    b) Grfico em Barras: semelhante ao grfico em colunas, porm os retngulos so dispostos

    horizontalmente. Eis a configurao do mesmo grfico anterior:

    Esses dois tipos de grficos so geralmente utilizados para comparar diferentes variveis ou

    diferentes valores da mesma varivel.

    b) Grficos em Setores: a representao grfica de uma srie estatstica, em um crculo,

    por meio de setores. utilizado principalmente quando se pretende comparar cada valor

    da srie com o total. Para constru-lo, divide-se o crculo em setores, cujas reas sero

    proporcionais aos valores da srie. Essa diviso poder ser obtida pela soluo da regra

    de trs.

    Total _____ 360 o

    Parte _____ x o

    Populao

    Grfico em Barras

    Populao do Brasil (milhes)

    Ano

    1940

    1950

    1960

    1970

    0 10 20 30 40 50 60 70 80 90 100

    Grfico em Setores

    RECEITA DO MUNICPIO X DE 1996 a 1998 (milhes)

    (1996), 90,0

    (1998), 150,0

    (1997), 120,0

  • 11

    c) Grfico em Curvas ou Linear: utilizado para representar o crescimento ou o

    decrescimento da varivel. Exemplo:

    Dicas para a Apresentao dos Dados

    Grfico Linear

    Anos

    VE

    ND

    AS

    0

    100

    200

    300

    400

    500

    1991 1992 1993 1994 1995 1996 1997

    Dados

    Dados Qualitativos

    Dados Quantitativos

    Mtodos Tabulares

    Mtodos Grficos

    Mtodos Tabulares

    Mtodos Grficos

    Distribuies de freqncias

    Grficos de barras e pizza

    Distribuies de freqncias

    Histograma

    Vendas da Companhia

    Beta

    1991 a 1997

    Ano Vendas

    R$ 1.000,00)

    1991 230

    1992 260

    1993 380

    1994 300

    1995 350

    1996 400

    1997 4500

    Fonte: Departamento de Marketing

    Companhia Beta

  • 12

    Tabela de Dados Relaciona TODOS os dados levantados na pesquisa, independentemente de ordem. Tabela de Dados Ordenados (Rol) Relaciona TODOS os dados levantados na pesquisa, ordenados de alguma forma. Tabela de Freqncia Relaciona classes e freqncia do nmero de valores que se enquadram em cada categoria. Amplitude de Amostra ( Amplitude Total) (Range) Diferena entre o maior e o menor valores encontrados na Tabela de dados. Amplitude de Classe Diferena entre os limites superior e inferior de cada classe.

    Freqncia Absoluta

    o nmero de vezes que o elemento aparece na amostra, ou o nmero de elementos pertencentes a uma classe. Freqncia Relativa

    totalfreqncia

    classe de freqnciaou

    totalfreqncia

    absoluta

    freqnciarelativafreqncia =

    As freqncias relativas tambm podem ser apresentadas como porcentagens. Quando calculada corretamente e, a menos dos erros de arredondamento, a soma das freqncias relativas deve ser igual a 1 (ou 100%).

    Freqncia Acumulada A freqncia acumulada de uma classe a soma das freqncias daquela classe e de todas as classes que a antecedem.

    Freqncia Absoluta Acumulada

    a soma da freqncia absoluta do elemento ou da classe com a freqncia absoluta dos

    elementos anteriores ou das classes anteriores.

    Freqncia Relativa

    A freqncia relativa o valor da freqncia absoluta dividido pelo nmero total de

    observaes: n

    ffr i= .

    Freqncia Acumulada Relativa ou Freqncia Relativa Acumulada

    A freqncia acumulada relativa o valor da freqncia acumulada dividido pelo nmero total

    de observaes: n

    ffar ac= .

    Anlise dos Resultados

  • 13

    Realizadas as fases anteriores, faz-se uma anlise dos resultados obtidos, atravs dos mtodos da

    Estatstica Indutiva ou Inferncia, e tiram-se as concluses e previses.

    Tipos de Variveis

    Varivel o conjunto de resultados possveis de um fenmeno. Por exemplo:

    - Para o fenmeno sexo so dois os resultados possveis: sexo masculino e sexo feminino;

    - Para o fenmeno nmero de filhos h um nmero de resultados possveis expressos atravs

    dos nmeros naturais: 0, 1, 2, 3, ... n;

    - Para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um

    nmero infinito de valores numricos dentro de um determinado intervalo.

    As variveis, desta forma, podem ser:

    Variveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala

    numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos. Elas

    subdividem-se em dois grupos:

    - Variveis quantitativas discretas: so aquelas que assumem apenas determinados

    valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus valores.

    Normalmente referem-se a contagens. Por exemplo: nmero de ovos produzidos por uma

    granja, nmero de pessoas por famlia, quantidade de doentes por hospital.

    - Variveis quantitativas contnuas: so aquelas cujos valores assumem uma faixa

    contnua e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o

    peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um

    produto agrcola, a produo de leite de uma fazenda.

    Variveis Qualitativas - refere-se a dados no numricos. Exemplos dessas variveis so o sexo

    das pessoas, a cor, o grau de instruo. Elas subdividem-se tambm em dois grupos:

    - Variveis qualitativas ordinais: so aquelas que definem um ordenamento ou uma

    hierarquia. Exemplos so o grau de instruo, a classificao de um estudante no curso de

    estatstica, as posies das 100 empresas mais lucrativas, etc.

    - Variveis qualitativas nominais: por sua vez no definem qualquer ordenamento ou

    hierarquia. So exemplos destas a cor, o sexo, o local de nascimento, etc.

    Populao

    o conjunto de elementos a serem observados. Exemplo: alunos de uma escola.

    Amostra

    uma pequena parte selecionada de uma populao que se pretende estudar. Fazemos uma

    amostragem quando:

  • 14

    - o nmero de elementos da populao muito grande;

    - queremos economizar tempo e dinheiro.

    Distribuio de Freqncias e Histograma para Dados sem Intervalo de Classe

    Utilizamos esse tipo de distribuio quando o nmero de elementos distintos da amostra for

    pequeno.

    Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25,

    25, 26, 26, 26, 28, 30. Construa uma distribuio com todas as freqncias.

    X fi fac fr far fr % far %

    21 3 3 3/17 3/17

    22 2

    23 2

    24 1

    25 4

    26 3

    28 1

    30 1

    17 |||||||||||||||||||||| ||||||||||||||||||||||| |||||||||||||||||||||

    Histograma

    Histograma uma representao grfica de uma tabela de distribuio de freqncias.

    Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas) colocamos os valores da

    varivel em estudo e no eixo vertical (ordenadas) colocamos os valores das freqncias. O

    histograma tanto pode ser representado para as freqncias absolutas como para as freqncias

    relativas. No caso do exemplo anterior, o histograma seria:

  • 15

    Histograma

    0

    1

    2

    3

    4

    5

    21 22 23 24 25 26 28 30 Mais

    valores

    Fre

    q

    nci

    a A

    bso

    luta

    Ogiva

    Ogiva uma representao grfica de uma tabela de distribuio de freqncias acumuladas.

    No caso exemplo anterior, a ogiva seria:

    Ogiva

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    21 22 23 24 25 26 28 30

    Valores de x

    Fre

    qu

    enci

    as A

    cum

    ula

    das

  • 16

    Distribuio de Freqncia e Histograma para Dados com Intervalo de Classe

    Quando o nmero de elementos distintos da amostra for grande, os dados devem ser

    tabulados em intervalos de classes. Para a determinao dessas classes no existe uma regra pr-

    estabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais adequada.

    Suponhamos que as safras agrcolas de um determinado produto, em uma determinada regio

    sejam dadas pela tabela a seguir:

    Ano Safra (1000 t) Ano Safra (1000 t)

    1 280 10 365 2 305 11 280 3 320 12 375 4 330 13 380 5 310 14 400 6 340 15 371 7 310 16 390 8 340 17 430 9 369 18 370

    Lembrando os passos que devem ser seguidos para a tabulao de freqncias de dados.

    - Sempre comear por ordenar os dados. Obter o Rol(Tabela de dados ordenados) antes de

    comear a construir as Tabela de Freqncias

    - Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem muito alto.

    Um nmero de classes pequeno gera amplitudes de classes grandes o que pode causar distores

    na visualizao do histograma. Um nmero de classes grande gera amplitude de classes muito

    reduzidas. Foram definidas regras prticas para a determinao do nmero de classes, sendo que

    este deve variar entre 5 e 20 (5 para um nmero muito reduzido de observaes e 20 para um

    nmero muito elevado). Se n representa o nmero de observaes (na amostra ou na populao,

    conforme for o caso) o nmero aproximado de classes pode ser calculado por Nmero de

    Classes(k), k = n , arredondando os resultados. No caso do exemplo anterior temos n = 18 e

    k= 18 4 24= , e podemos adotar um nmero de 5 classes, que ser razovel. Lembrar que o

    valor adotado para k deve ser SEMPRE INTEIRO

    - Calcular a amplitude das classes(h). A amplitude ser obtida conhecendo-se o nmero de

    classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados o resultado da subtrao

    valor mximo - valor mnimo da srie de dados. A amplitude de classe ser:k

    TA =h

    O valor do resultado tambm poder ser arredondado para um nmero inteiro mais adequado.

    No nosso exemplo temos: 305

    280-430 =h =

  • 17

    Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo apresentamos

    para os dados do nosso exemplo os limites inferior(Linf) e superior (Lsup) de cada uma das 5 classes

    de freqncia.

    Classe Limite inferior Limite Superior

    1 280 310

    2 310 340

    3 340 370

    4 370 400

    5 400 430

    Observa-se na tabela acima que o limite superior de cada classe coincide com o limite inferior

    da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao seja

    exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de incluso. Para

    evitar esse tipo de dificuldade normalmente se estabelece que o limite superior de cada classe

    aberto (e consequentemente, o limite inferior de cada classe fechado), ou seja, cada intervalo

    de classe no inclui o valor de seu limite superior, com exceo da ltima classe.

    Tabular os dados por classe de freqncia. A partir da listagem de dados seleciona-se para

    cada um deles qual a sua classe de freqncia e acumula-se o total de freqncia de cada

    classe. De acordo com nosso exemplo, teremos:

    Classe fi fac fr far fr % far % 280 |--- 310 3

    310 |--- 340 4

    340 |--- 370 4

    370 |--- 400 5

    400 |---| 430 2

    Total 18

  • 18

    Histograma

    0

    1

    2

    3

    4

    5

    6

    280 - 310 310 - 340 340 - 370 370 - 400 400 - 430classes

    Fre

    q

    nci

    a

    Polgono de Freqncia

    0

    1

    2

    3

    4

    5

    6

    280 - 310 310 - 340 340 - 370 370 - 400 400 - 430

    classes

    Fre

    q

    nci

    a

    Estatstica Descritiva: Medidas de Tendncia Central (ou de Posio) As medidas de tendncia central so usadas para indicar um valor que tende a representar

    melhor um conjunto de dados. Geralmente localizam-se em torno do meio ou do centro de uma

    distribuio, onde a maior parte dos dados tende a se concentrar. As principais medidas de

    tendncia central so: mdia, mediana e moda.

    Mdia Aritmtica ( X ), ou simplesmente Mdia A mdia definida como a soma das observaes dividida pelo nmero de observaes.

    Se tivermos, por exemplo, n valores, temos: n

    x

    Xi

    =

    Exemplo: Calcule a mdia da varivel x: 3, 5, 8, 12, 7, 12, 15, 18, 20, 20.

  • 19

    ...............10

    .................

    10

    ...................................853==

    +++=X

    Mdia para Dados Agrupados sem Intervalos de Classe ( X )

    A mdia para dados agrupados sem intervalo de classe obtida por:

    =i

    ii

    f

    fxX

    onde fi a freqncia absoluta

    Exemplo: Determinar a mdia da distribuio:

    xi fi xifi

    2 1

    5 4

    6 3

    8 2

    fi = 10 xifi =

    Ento: ..................10

    ...................X ===

    i

    ii

    f

    fx

    Mdia para Dados Agrupados com Intervalos de Classe ( X ) Para o clculo da mdia para dados agrupados com intervalos de classe, necessrio

    calcular o ponto mdio de cada classe. A mdia obtida por:

    =i

    im

    f

    fPX

    onde: Pm o ponto mdio de cada classe.

    O ponto mdio de cada classe definido por:

    2supinf

    m

    LLP

    +=

    Exemplo: Calcular a mdia da distribuio:

    classes fi Pm Pmfi

    2 |------ 5 1

    5 |------ 8 10

    8 |------ 11 6

    11 |------ 14 1

    14 |------17 2

    fi = 20 Pmfi = ........

  • 20

    Ento: ...........................

    ................X ===

    i

    im

    f

    fP

    Mdia Geomtrica (G)

    A mdia geomtrica de uma amostra definida como a raiz ensima do produto dos n

    valores amostrais.

    G = n ( )( )...( )x x xn1 2

    Por exemplo, a mdia geomtrica de 5, 9 e 13 :

    ........... = .......).......)(.(.......)(=G ....

    Mdia Harmnica (H)

    A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados.

    Simbolicamente, para uma amostra, temos:

    Hx x x

    n

    x

    n

    n

    x

    n=+ + +

    = =

    11 1 1

    1

    1

    11 2

    ... ( / )

    ( / )

    Exemplo: A mdia harmnica dos trs valores 2, 5 e 10 :

    ..................

    ..........

    ........................

    .........

    .......

    .......

    ......

    .......

    ......

    ................

    ==++

    =

    ++

    =H

    Mdia Quadrtica (Q) E a raiz quadrada da mdia dos quadrados dos valores observados

    n

    x

    Q

    n

    i

    i== 1

    2

    Exemplo: a mdia quadrtica dos trs valores 2 , 5 e 10 :

    .....................

    ........

    .......

    .....................

    ......

    ................. 222===

    ++=

    ++=Q

    Mdia Ponderada

    Tomemos um conjunto de n dados... nxxxx ..,,.........,, 321

  • 21

    Se, para cada dado ix associarmos respectivamente um peso ip , a mdia ponderada ser dada

    por :

    =

    ==n

    i

    i

    n

    i

    ii

    p

    px

    P

    1

    1

    .

    Exemplo : A mdia ponderada dos valores 5, 7, 9, 11sabendo-se que tm, respectivamente,

    pesos 2, 3, 3 e 4 : ................................

    ................

    4332

    411393725==

    +++

    +++=

    xxxxP

    Mediana (Md) A mediana um valor real que separa o rol em duas partes deixando sua esquerda o mesmo

    nmero de elementos que a sua direita. Portanto, a mediana um valor que ocupa a posio

    central em uma srie. Ela denotada por: Md.

    Inicialmente devemos ordenar os elementos, em seguida determinamos o nmero n de elementos.

    Se n mpar: a mediana o termo central, aquele que divide o rol em duas partes iguais.

    Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.

    Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.

    A mediana ser o nmero 12, pois ele divide o conjunto em duas partes iguais. Portanto, Md = 12.

    Se n par: a mediana ser a mdia aritmtica dos dois termos centrais.

    Exemplo: Determinar a mediana da srie: x: 7, 21, 13, 15, 10, 8, 9, 13.

    Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.

    A mediana ser: Md = 5,112

    1310=

    +

    Moda (Mo)

    o valor de maior freqncia em um conjunto de dados. Ela denotada por Mo.

    Exemplos: Determinar a moda dos conjuntos de dados:

    a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.

    O elemento de maior freqncia 5. Portanto, Mo = 5. uma seqncia unimodal, pois s

    temos uma moda.

    b) X: 6, 10, 5, 6, 10, 2.

    Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior freqncia.

    Portanto, Mo = 6 e Mo = 10. Por isso chamada de bimodal.

    Quando no houver elementos que se destaque pela maior freqncia, dizemos que a

    srie amodal.

    Exemplo: x: 3, 3, 3, 4, 4, 4.

  • 22

    No h moda, pois os elementos tm a mesma freqncia.

    Utilizao das Medidas de Tendncia Central

    Na maioria das situaes, no necessitamos calcular as trs medidas de tendncia central.

    Normalmente precisamos de apenas uma das medidas para caracterizar o centro da srie.

    A medida ideal em cada caso aquela que melhor representa a maioria dos dados da srie.

    Quando houver forte concentrao de dados na rea central da srie, devemos optar pela Mdia.

    Quando houver forte concentrao de dados no incio e no final da srie, devemos optar pela

    Mediana.

    A Moda deve ser a opo como medida de tendncia central apenas em sries que apresentam

    um elemento tpico, isto , um valor cuja freqncia muito superior freqncia dos outros

    elementos da srie.

    Estatstica Descritiva: Medidas de Disperso

    As medidas de disperso so medidas que mostram o grau de disperso ou de concentrao em

    torno da mdia. As principais medidas de disperso so: varincia, desvio padro e coeficiente de

    variao.

    Varincia e Desvio Padro para Dados Agrupados sem Intervalos de Classe

    A varincia uma mdia aritmtica calculada a partir dos quadrados dos desvios obtidos

    entre os elementos da srie e a sua mdia.

    O desvio padro a raiz quadrada positiva da varincia.

    populao. a para ,

    amostra; a para ,

    2

    2

    =

    = SS

    O desvio-padro de um conjunto de valores amostrais uma medida de variao dos valores em relao mdia.

    Frmulas : desvio-padro populacional ( )

    =

    =

    n

    i

    i

    n

    xx

    1

    2

    desvio-padro amostral ( )

    =

    =

    n

    i

    i

    n

    xxs

    1

    2

    1

    Notao s = desvio-padro de um conjunto de dados amostrais = desvio-padro de um conjunto de dados populacionais s = varincia de um conjunto de dados amostrais

    2 = varincia de um conjunto de dados populacionais

  • 23

    OBS : Em artigos de revistas e relatrios profissionais costuma-se indicar o desvio-padro por SD(Standard Deviation) e a varincia por Var.

    Maneira de se calcular o desvio-padro

    Eemplo : Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao.

    xi fi xifi (xi - )2 fi(xi - )

    2

    2 3

    3 5

    4 8

    5 4

    20

    Primeiro, calculamos a mdia: ...................

    .........===

    i

    ii

    f

    fx

    Como estamos trabalhando com uma populao a varincia dada por:

    ........................

    ..............)(2

    2 ==

    =

    N

    xf ii

    O desvio padro ser: ............................... ==

    Varincia e Desvio Padro para Dados Agrupados com Intervalos de Classe

    A varincia para dados agrupados com intervalos de classe dada por:

    populao. a para , )(

    amostra; a para , 1

    )(

    22

    22

    N

    Pf

    n

    XPfS

    mi

    mi

    =

    =

    O desvio padro dado por:

    populao. a para , amostra; a para , 22 == SS

    Exemplo: Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao:

  • 24

    classes fi Pm Pmfi 2)( mP 2)( mi Pf

    2 |------ 5 1 3,5

    5 |------ 8 10

    8 |------ 11 6

    11 |------ 14 2

    14 | ------ | 17 1

    20

    Primeiramente calculamos o ponto mdio de cada classe e em seguida a mdia:

    ...............

    ...........===

    i

    im

    f

    fP

    Como estamos trabalhando com uma populao a varincia dada por:

    .................

    ..............)(2

    2 ==

    =

    N

    Pf mi

    O desvio padro ser:

    ......................... ==

    Coeficiente de Variao (CV)

    uma medida relativa de disperso, til para a comparao em termos relativos do grau

    de concentrao em torno da mdia.

    100

    =mdia

    padrodesvioCV

    Se: CV 15% Baixa disperso Homognea, estvel, regular.

    15% < CV< 30% Mdia disperso.

    CV > 30% Alta disperso Heterognea.

    Exemplo: Determine o coeficiente de variao para o exemplo anterior:

  • 25

    .%..........100......

    ............==CV

    Quartis, Decis e Percentis(ou Centis)

    Assim como a mediana divide os dados em duas partes iguais, os trs quartis,

    denotados por 321Q e ,QQ

    , dividem as observaes ordenadas(dispostas em ordem crescente) em quatro partes iguais.

    Grosso modo, 1Q separa os 25% inferiores dos 75% superiores dos valores ordenados ; 2Q a

    mediana e 3Q

    separa os 75% inferiores dos 25% superiores dos dados. Mais precisamente, ao

    menos 25% dos dados sero no mximo iguais a 1Q e, ao menos 75% dos dados sero no mnimo

    iguais a 1Q . Da mesma forma, 75% dos dados sero no mximo iguais a 3Q

    , enquanto ao menos 25%

    sero, no mnimo, iguais a 3Q

    .

    Analogamente h nove decis, denotados por 9321,.......,,, DDDD

    , que dividem os dados em 10 grupos com cerca de 10% deles em cada grupo. H, finalmente, 99 percentis(ou centis), que dividem os dados em 100 grupos com cerca de 1% em cada grupo. Os quartis, decis e percentis(centis) so exemplos de fractis, que dividem os dados em partes aproximadamente iguais. Exemplo : Um estudante que se submeteu ao vestibular para ingresso em uma faculdade informado que est no 92 percentil. Isso no significa, entretanto, que ele tenha obtido 92% no exame; indica apenas que, qualquer que tenha sido a nota obtida, ela foi superior a 92%(e inferior a 8%) das notas de toda a turma. O 92 percentil , portanto, uma excelente classificao em relao aos outros que fizeram o exame.

    O processo de determinao do percentil kP , correspondente a um determinado valor x

    bastante simples, como pode ser visto na expresso seguinte :

    100 valoresde totalnmero

    x a inferiores valoresde nmerok valor xdo percentil do ndice ==

    nk

    n

    Lxk .

    100Lou

    100

    ==

    Onde L = nmero de valores inferiores a x ( O endereo do percentil na tabela) k = ndice do percentil kP

    n = nmero total de valores ( nmero de elementos da tabela) Fluxograma para determinao do k-simo percentil

  • 26

    Exemplo : Determine o 40 percentil ( 40P

    ) dos valores da tabela de dados ordenados abaixo :

    TABELA DE DADOS ORDENADOS (Rol)

    01 200 201 204 204 206 206 208 02 208 209 215 217 218 220 223 03 225 228 230 234 236 241 242 04 242 248 250 251 251 252 252 05 254 256 256 256 257 257 258 06 259 259 260 261 262 262 262 07 262 262 263 263 263 263 263 08 263 264 265 265 265 266 267 09 267 268 268 268 268 268 268 10 268 268 268 269 269 269 269 11 270 270 270 270 270 270 270

    Ordenar os dados, do menor para o maior.

    Calcular L = (k/100).n , n = nmero de valores k = percentil desejado

    L um nmero inteiro?

    O valor do k-simo percentil est a meio caminho entre o L-simo valor e o prximo valor mais alto no conjunto

    original de dados. Obtm-se kP ,

    somando-se o L-simo valor ao prximo valor mais alto e dividindo-se o resultado por 2.

    Sim

    Modificar L, arredondando seu valor para o maior inteiro mais prximo

    O valor de kP o L-simo valor a

    contar do mais baixo

    No

    Incio

  • 27

    12 270 271 271 272 272 272 272 13 272 273 273 273 273 273 273 14 274 274 274 274 275 275 275 15 275 276 276 276 276 276 277 16 277 277 277 277 277 277 277 17 278 278 278 278 278 278 278 18 279 279 279 280 280 280 281 19 281 281 281 281 282 282 282 20 282 282 282 282 283 283 283 21 283 283 284 284 284 284 285 22 285 285 286 286 286 286 287 23 287 288 289 289 289 289 289 24 290 290 290 291 291 292 292 25 292 293 293 294 295 295 297

    Soluo : Acompanhando o fluxograma, calculamos : 70175

    100

    40

    100=

    =

    = n

    kL

    Sendo 70 um nmero inteiro , segundo o fluxograma, 40P

    est a meio caminho entre o 70 e o 71 valores. E como esses valores so, respectivamente, 269 e 270, conclumos que o 40 percentil (269 + 270) / 2 = 269,5. Exemplo 2 : Determine o 71 Percentil.

    Soluo : 25,124175100

    71

    100=

    =

    = n

    kL (valor no inteiro).

    Neste caso, simplesmente se arredonda para o nmero inteiro superior mais prximo, ou seja, L = 125. E, assim, o nmero que est no espao 125 o 280 e, portanto, 28071 =P Treino : Determine todos os Quartis Determine todos os Decis pares Descubra qual o Percentil dos dados : 208, 252, 278, 287 e 294

    Escores z

    Quase todos ns estamos familiarizados com a sigla QI(coeficiente de inteligncia) e reconhecemos que um QI de 102 bastante comum enquanto um QI de 170 raro. Esse QI de 102 bastante comum porque est prximo da mdia de 100, mas o QI de 170 raro porque est bem acima de 100. Esta circunstncia pode sugerir uma diferena entre os valores tpicos e os valores raros, com base em sua

    diferena em relao mdia ( )xx . Mas o tamanho dessa diferena depende da escala que estamos utilizando. Com os valores de QI, uma diferena de 2 pontos insignificante mas, para mdias de notas de uma faculdade, uma diferena de 2 pontos, entre 2,00 e 4,00, altamente significativa. Seria muito melhor se dispusssemos de um padro que no levasse em conta a escala utilizada. Com

    o valor, ou escore padronizado, dividimos a diferena ( ) ( )-xou xx pelo desvio-padro para chegarmos a esse resultado. DEFINIO : O escore padronizado, ou escore z , o nmero de desvios-padro pelo qual um valor x dista da mdia (para mais ou para menos) . Obtm-se como se segue : Amostra Populao

  • 28

    s

    xxz

    =

    =

    xz

    NOTA : Arredondar z para duas casas decimais

    Exemplo : As alturas da populao de homens adultos tm mdia 75,1= m, desvio-padro 07,0= m e distribuio em forma de sino. Um jogador de basquete com 1,98 m pode ser

    considerado excepcionalmente alto, comparado com a populao geral de homens adultos ? Determine o escore z para a altura de 1,98 m. Soluo : Como estamos lidando com parmetros populacionais, o escore z se calcula como segue :

    29,307,0

    75,198,1=

    =

    =

    xz .

    Podemos interpretar este resultado dizendo que a altura do jogador de basquete est 3,29 desvios- padro acima da mdia. A importncia dos escores z na estatstica reside no fato de que eles permitem distinguir entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados estejam entre 2,00 e 2,00 e incomuns os valores com escore z inferior a 2,00 ou superior a 2,00 . Assim, a altura do jogador de basquete do exerccio anterior corresponde a um escore z de 3,29, que consideramos incomum por ser superior a 2,00. Em comparao com a populao geral, o jogador pode ser considerado, excepcionalmente alto. Fig 01 - Interpretao do escore z

    Testes de Hipteses e Significncia

    Decises Estatsticas

    Quando somos levados a tomar decises com base em informaes sobre amostras elas so chamadas de decises estatsticas. Hipteses Estatsticas e Hipteses Nulas. Na tentativa de se chegar a decises, conveniente fazer suposies ou conjeturas sobre as populaes envolvidas. Estas suposies, que podem ser verdadeiras ou no, so chamadas de hipteses estatsticas e, em geral, so afirmaes sobre as distribuies de probabilidade das populaes. Por exemplo : a) Se queremos decidir se uma moeda viciada, formulamos a hiptese de que a moeda honesta, ou seja, p=0,5 onde p a probabilidade de dar cara no lanamento da moeda. b) Se queremos decidir se um procedimento melhor do que outro, formulamos a hiptese de que no h diferena entre os procedimentos( i.e., quaisquer diferenas observadas so meramente devido a flutuaes na amostragem de uma mesma populao). Tais hipteses, muitas vezes chamadas de hipteses nulas ou simplesmente hipteses, so

    Valores Incomuns Valores usuais

    Valores Incomuns

    -3 -2 -1 0 1 2 3

  • 29

    denotadas 0H .

    Quaisquer outras hipteses que difiram de uma dada hiptese nula so chamadas de hipteses alternativas e so denotadas por 1H . Por exemplo : Se a hiptese nula p = 0,5, hipteses alternativas podem ser

    5,0 , 5,0 , 7,0 >= ppp .

    Testes de Hipteses e Significncia

    Se, sob a suposio de uma hiptese particular ser verdadeira, concluirmos que os resultados observados em uma amostra aleatria diferem muito daqueles esperados, diramos que as diferenas observadas so significantes e estaramos inclinados a rejeitar a hiptese. Por exemplo : Se 20 lanamentos de uma moeda do 16 caras, estaramos inclinados a rejeitar a hiptese de que a moeda honesta, apesar de admitirmos que podemos estar equivocados. Os procedimentos que nos capacitam a decidir se aceitamos ou rejeitamos uma hiptese ou a determinar se a amostra observada difere significativamente dos resultados esperados so chamados de testes de hipteses, testes de significncia ou regras de deciso.

    Erros do Tipo I e Do Tipo II

    Se rejeitamos uma hiptese quando ela de fato verdadeira, dizemos que foi cometido um erro do Tipo I . Se aceitamos uma hiptese quando ela deveria ser rejeitada, dizemos que foi cometido um erro do Tipo II . Em ambos os casos ocorreu uma deciso errada ou um erro no julgamento. Para que um Teste de hipteses (ou uma regra de deciso) seja bom, precisa ser construdo de modo a minimizar erros de deciso. Este no um problema simples pois, em geral, para um dado tamanho de amostra, a tentativa de diminuir um tipo de erro acompanhada por um aumento no outro tipo de erro. Na prtica, um tipo de erro pode ser mais srio do que o outro e ento deveria ser assumido um compromisso em favor de uma limitao no erro mais srio. A nica maneira de reduzir ambos os tipos de erros, aumentar o tamanho da amostra, o que nem sempre possvel.

    Nvel de Significncia

    Ao testar uma dada hiptese, a probabilidade mxima com a qual queremos arriscar cometer erro do Tipo I chamada de nvel de significncia do teste. Esta probabilidade em geral especificada antes de qualquer amostra ser extrada para que os resultados obtidos no venham a influenciar nossa deciso. Na prtica so usuais nveis de significncia de 0,05 ou 0,01 , apesar de outros valores tambm serem usados. Se, por exemplo, um nvel de significncia de 0,05 (ou 5%) for escolhido na construo de um teste de hipteses, ento h em torno de 5 chances em 100, da hiptese ser rejeitada quando ela deveria ter sido aceita, isto , sempre que a hiptese nula for verdadeira, estaremos em torno de 95% confiantes de que tomamos a deciso correta. Em tais ocasies dizemos que a hiptese foi rejeitada ao nvel de significncia de 0,05, o que significa que podemos estar errados com probabilidade de 5%.

  • 30

    Testes envolvendo a Distribuio Normal Para ilustrar as idias recm apresentadas, suponhamos que sob uma dada hiptese, a distribuio amostral de uma estatstica S uma distribuio normal com mdia s e desvio-

    padro s . Alm disso, suponhamos que decidimos rejeitar a hiptese de S se for muito pequena

    ou muito grande. A distribuio da varivel padronizada ( )

    s

    sSZ

    = a distribuio normal

    padro (mdia 0, varincia 1) mostrada na figura abaixo e valores extremos de Z nos levariam rejeio da hiptese. z = - 1,96 z = 1,96 Como est indicado na figura, podemos estar 95% confiantes de que, se a hiptese for verdadeira, o escore z de uma estatstica amostral verdadeira S estar entre 1,96 e 1,96 (pois a rea sob a curva normal entre estes valores 0,95). Entretanto, se ao escolher uma nica amostra aleatoriamente encontramos o escore z desta estatstica fora do intervalo de 1,96 a 1,96, concluiramos que tal evento aconteceria somente com probabilidade de 0,05(rea sombreada total na figura) se a hiptese fosse verdadeira. Diramos ento que este escore z difere significativamente do que seria esperado sob a hiptese e estaramos inclinados a rejeitar a hiptese. A rea 0,05 da regio sombreada total o nvel de significncia do teste. Este nvel representa a probabilidade de estarmos errados em rejeitar a hiptese, isto , a probabilidade de cometer o erro do Tipo I. Portanto dizemos que uma hiptese rejeitada ao nvel de significncia de 0,05 ou que o escore z de uma dada estatstica amostral significante ao nvel de significncia de 0,05. O conjunto de escores z fora do intervalo de 1,96 a 1,96 constitui o que chamado de regio crtica ou regio de rejeio da hiptese ou regio de significncia. O conjunto dos escores z dentro do intervalo de 1,96 a 1,96 pode ser chamado de regio de aceitao da hiptese ou regio de no-significncia. Com base nestas observaes podemos formular as seguintes regras de deciso : a) Rejeito a hiptese ao nvel de significncia de 0,05 se o escore z da estatstica S

    estiver fora do intervalo de 1,96 a 1,96 (isto , z > 1,96 ou z < -1,96 ). Isto equivale dizer que a estatstica amostral observada significante ao nvel de 0,05.

    b) Aceito a hiptese( ou, se desejado, no tomo qualquer deciso) em caso contrrio.

    IMPORTANTE : Deve-se destacar que outros nveis de significncia poderiam ter sido usados. Por exemplo : se um nvel de 0,01 fosse usado, substituiramos 1,96 por 2,58 em todos os lugares acima. Vide as Tabelas abaixo. Clculo do Desvio-Padro A mdia pode ser encontrada fazendo-se np=

    0,025 0,95

    Regio crtica Regio

    crtica 0,025

  • 31

    O desvio-padro pode ser encontrado aplicando-se a frmula qpn ..= onde : n = quantidade de dados utilizados na pesquisa p = probabilidade de sucesso do evento analisado q = probabilidade de fracasso do evento analisado Observe-se que, SEMPRE, p + q = 1 Exemplos : Moedas.... p = 0,5 = q = 0,5 = Dados ..... p = 1/6 q = 5/6 Tabelas de valores crticos de Escore Z Nvel de Confiana

    99,73 % 99 % 98 % 96 % 95,45 % 95 % 90 % 80 % 68,27 % 50 %

    Valores

    crticos cz 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745

    Nvel de significncia

    0,10 0,05 0,01 0,005 0,002

    Valores crticos de z para testes unilaterais

    -1,28 ou

    1,28

    -1,645 ou

    1,645

    -2,33 ou

    2,33

    -2,58 ou

    2,58

    -2,88 ou

    2,88 Valores crticos de z para testes bilaterais

    -1,645 e

    1,645

    -1,96 e

    1,96

    -2,58 e

    2,58

    -2,81 e

    2,81

    -3,08 e

    3,08

    Teste do Qui Quadrado Este teste objetiva verificar se a freqncia absoluta observada de uma varivel

    significativamente diferente da distribuio de freqncia absoluta esperada. Aplica-se o teste do

    qui quadrado para uma amostra quando se quer estudar a dependncia entre duas variveis

    atravs de uma tabela de dupla entrada, tambm conhecida como tabela de contingncia.

    Para que se possa executar o teste do qui quadrado h de se observar algumas condies como :

    a) Exclusivamente para variveis nominais e ordinais b) Somente para observaes independentes

    c) No se aplica se 20% das observaes forem inferiores a 5.(Amostras muito

    pequenas)

    d) No pode haver freqncias inferiores a 1

  • 32

    e) Nos dois ltimos casos, caso haja incidncia, aconselha-se agrupar os dados segundo algum critrio especfico.

    Passo-a-Passo para a Execuo do Teste Qui Quadrado Passo 01 : Determinar a hiptese nula 0H que dever ser a negativa da existncia de diferenas

    entre a distribuio de freqncia observada e a esperada. Passo 02 : Estabelecer o nvel de significncia ( ) Passo 03 : Determinar a regio de rejeio da hiptese nula 0H atravs da determinao dos

    graus de liberdade ( ) sendo 1= k onde k o nmero de classes(categorias). A determinao feita atravs da tabela de contingncia onde se localiza o valor do qui quadrado

    tabelado ( )2tx .

    Passo 04 : Determinar o valor do qui quadrado calculado ( )2cx atravs da frmula : ( )

    =i

    ii

    ce

    eox

    22

    Passo 05 : Comparar os valores do qui quadrado tabelado ( )2tx e do qui quadrado calculado ( )2cx . Sendo o valor do segundo maior do que o primeiro, isto , ( )2cx > ( )2tx , rejeita-se a hiptese nula 0H em favor da hiptese alternativa 1H .

    Exemplo : Um vendedor trabalhou comercializando um produto em cinco bairros residenciais de uma mesma cidade, num mesmo perodo do ano. O gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, ou seja, se as diferenas eram significativas entre os bairros trabalhados. A partir deste estudo o gerente pretendia elaborar uma estratgia comercial especfica para cada bairro ou manter uma mesma estratgia para todos.

    Bairro 1 2 3 4 5 Total Valores

    Observados

    9

    11

    25

    20

    15

    80

    Valores Esperados

    16

    16

    16

    16

    16

    80

    Soluo :

    Passo 01 : A hiptese nula 0H ser : No h diferenas significativas entre os 5 bairros

    estudados e, assim, uma hiptese alternativa 1H poder ser As diferenas observadas entre os bairros mais discrepantes ( 3 e 4) so significativamente diferentes para melhor em relao aos demais bairros

  • 33

    Passo 02 : Nvel de significncia escolhido %505,0 ==

    Passo 03 : Sendo k = 5 ( nmero de bairros estudados, classes, categorias), teremos

    4151 === k e a tabela de contingncia nos oferece ( )2tx =9,488 9,49

    Passo 04 :

    ( ) ( ) ( ) ( ) ( ) ( )[ ]

    ( ) ( ) ( )...........

    ........

    .........

    ........

    .........................

    ..........

    .........................

    ...........

    ..................................................

    22222

    222222

    ==++++

    =++++

    =

    =++++

    =cx

    Passo 05 : Observa-se que, de fato, ( )2cx > ( )2tx pois 10,75 > 9,49 e, assim, rejeita-se 0H em

    favor de 1H . Desta forma a concluso final a de que h diferena significativa, ao nvel de 5%

    de significncia para os bairros 3 e 4 e o gerente dever mesmo elaborar uma estratgia comercial

    para cada bairro.

    Teste do Qui Quadrado para Independncia (Duas Amostras) A utilizao do presente teste em pesquisa visa verificar se as distribuies de duas ou mais amostras no relacionadas diferem significativamente em relao determinada varivel. CONDIES PARA A EXECUO DO TESTE

    a)Exclusivamente para variveis nominais e ordinais; b)Preferencialmente para amostras grandes, n

  • 34

    sendo = (L 1) (C 1), onde L = nmeros de linhas da tabela e C = ao nmero de colunas.. Encontrar portanto, o valor do qui-quadrado tabelado; Passo 04 : Para encontrar o valor esperado (E), utilizar a frmula a seguir:

    ( )( )

    sobservae das Total

    i coluna i linha da daSomaSomaE =

    Passo 05 : Sendo o qui quadrado calculado, maior do que o tabelado, rejeita-se H0 em favor de H1. H dependncia ou as variveis no esto associadas. Exemplo: Um pesquisador deseja identificar se h dependncia no consumo de seus chocolates e as cidades de sua regio. Cidades do Vale do Taquari Sabor do chocolate Lajeado Santa Cruz Estrela Taquari Chocolate com caju 60 30 20 40 150 Chocolate com amendoim 45 35 20 10 110 Chocolate com flocos 55 25 47 13 140 Chocolate com passas 70 35 25 20 150 230 125 112 83 550 Passo 01 : H0: A preferncia pelos sabores independe da cidade H1: A preferncia pelos sabores depende da cidade. Passo 02 : = 0,05 = 5% Passo 03 : = (4 1) (4 1) = 9, onde qui quadrado tabelado igual a 16,919.(Vide Tabela A-4) Passo 04 : Calculo dos valores esperados (E)

    Cidades do Vale do Taquari

    Sabor do chocolate Lajeado Santa Cruz Estrela Taquari Chocolate com caju 62,7 Chocolate com amendoim 46,0 Chocolate com flocos 58,5 Chocolate com passas 62,7 Passo 05 : -qui quadrado para a linha Chocolate com caju

    ( ) ( ) ( ) ( )

    ....................

    ............

    .........

    ............

    .........

    ............

    .........

    ............ 22222 =

    +

    +

    +

    =X

    - qui quadrado para a linha Chocolate com amendoim

    ( ) ( ) ( ) ( )

    ...................

    ............

    .........

    ............

    ........

    ...........

    ........

    ........... 22222 =

    +

    +

    +

    =X

  • 35

    - qui quadrado para a linha Chocolate com flocos

    ( ) ( ) ( ) ( )

    .................

    ............

    .........

    ...........

    .........

    ............

    .........

    ............ 22222 =

    +

    +

    +

    =X

    -qui quadrado para a linha Chocolate com passas

    ( ) ( ) ( ) ( )

    ....................

    ............

    .........

    ............

    .........

    ............

    .........

    ............ 22222 =

    +

    +

    +

    =X

    -qui quadrado total calculado = ............. + ............. + ............. + ............. = ................ Conclui-se que o qui quadrado calculado (..............) maior do que o tabelado (.............) e, assim, rejeita-se H0 em favor de H1. CONCLUSO : Portanto ............... diferena significativa, ao nvel de 0,05 ou (5%), entre as cidades.

    Correlao

    Existe uma correlao entre duas variveis quando uma delas est, de alguma forma, relacionada com a outra. O coeficiente de correlao linear r mede o grau de relacionamento linear entre os valores emparelhados x e y em uma amostra. O coeficiente de correlao linear chamado s vezes de coeficiente momento-produto de Pearson.

    TABELA PARA CLCULO DE r

    x y x.y X Y - - - - - - - - - - - - - - -

    x y yx. 2x 2y

    Frmula para clculo de r ( )( )

    [ ( ) ( ) ] [ ( ) ( ) ]2222 yn

    =

    yxxn

    yxxynr

  • 36

    Deveremos arredondar o coeficiente de correlao linear r para trs casas decimais, a fim de que seu valor possa ser comparado com os valores crticos da Tabela de Valores Crticos do Coeficiente de Correlao r de Pearson, encontrada na maioria dos livros de Estatstica.

    Interpretao do Coeficiente de Correlao Linear

    Se o valor de r est prximo de 0, conclumos que no h correlao linear significativa entre x e y, mas se r est prximo de 1 ou +1, conclumos pela existncia de correlao linear significativa entre x e y . Como a interpretao da expresso prximo de 0, ou 1, ou +1 vaga, adota-se o critrio de deciso seguinte, bastante especfico : Se o mdulo do valor calculado de r excede o valor na Tabela A-6,

    conclumos que h correlao linear significativa. Em caso contrrio, no h evidncia suficiente para apoiar a existncia de uma correlao linear significativa.

    Regresso Linear

    A expresso xbby 10 += chamada de : Equao da Regresso ou, Reta de Regresso ou, Regra de melhor ajuste ou, Reta de mnimos quadrados Onde x = varivel independente ou varivel preditora y = varivel dependente ou varivel resposta 0b = intercepto y

    1b = coeficiente angular OBS : 1)- Os valores 10 e bb so estatsticas amostrais usadas para estimar os parmetros

    populacionais 10 e . 2)- A Equao da Regresso s poder ser usada para relaes lineares 3)- A Equao da regresso s poder ser usada para variveis aleatrias de distribuio normal(em forma de sino) Objetivo O objetivo utilizar dados amostrais emparelhados para estimar a equao de regresso. Dispondo apenas de dados amostrais, no poderemos achar os valores exatos dos parmetros populacionais 10 e mas, com os dados amostrais, podemos estim-los com 1 0 beb , que se obtm com as frmulas : Regras de Arredondamento :

    1) - De modo geral, para arredondar, utilize um decimal a mais do que os que aparecem nos dados originais. 2) - Arredondar apenas a resposta final e no os valores intermedirios. Exemplos : 1)- A mdia de (2), (3) e (5) 3,33333333............. , que pode ser

  • 37

    ( )( ) ( )( )( ) ( )22

    2

    0

    =

    xxn

    xyxxyb

    ( ) ( )( )( ) ( )221

    =

    xxn

    yxxynb

    TABELA DE DISTRIBUIO QUI QUADRADO (x) rea direita do valor crtico

    Graus de

    liberdade

    0,995

    0,99

    0,975

    0,95

    0,90

    0,10

    0,05

    0,025

    0,01

    0,005

    1 ---- ---- 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 5 0,412 0,554 0,831 1,145 1,610 9,236 11,071 12,833 15,086 16,750 6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,578 8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589

    10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,299 13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819 14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 22 8,643 9,542 10,982 12,338 14,042 30,813 33,924 36,781 40,289 42,796 23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559 25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 27 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,194 46,963 49,645 28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993

  • 38

    29 13,121 14,257 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,336 30 13,787 14,954 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 50 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 60 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 70 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,425 104,215 80 51,172 53,540 57,153 60,391 64,278 96,578 101,879 106,629 112,329 116,321 90 59,196 61,754 65,647 69,126 73,291 107,565 113,145 118,136 124,116 128,299 100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169

    De Donald B. Owen, Hanbook of Statistical Tables, @ 1962 Addison-Wesley Publishing Co. , Reading, MA

    TABELA Valores Crticos do Coeficiente de

    Correlao r de Pearson n 05,0= 01,0= 4 0,950 0,999 5 0,878 0,959 6 0,811 0,917 7 0,754 0,875 8 0,707 0,834 9 0,666 0,798

    10 0,632 0,765 11 0,602 0,735 12 0,576 0,708 13 0,553 0,684 14 0,532 0,661 15 0,514 0,641 16 0,497 0,623 17 0,482 0,606 18 0,468 0,590 19 0,456 0,575 20 0,444 0,561 25 0,396 0,505 30 0,361 0,463 35 0,335 0,430 40 0,312 0,402 45 0,294 0,378 50 0,279 0,361 60 0,254 0,330 70 0,236 0,305 80 0,220 0,286

  • 39

    90 0,207 0,269 100 0,196 0,256

    NOTA : Para testar Ho : p = 0 contra H1 : 0p , rejeite Ho se o valor absoluto de r for maior do que o valor crtico da tabela (a) Correlao positiva entre x e y (b) (c) (d) Correlao negativa entre x e y (e)

    * ** * * * * ** * ** ** *** * ** * * * * * **** * * * * * ** ****** * * * * **

    *** *** *** **** *** **** *** *** **** *** **** ** *

    y

    x

    y

    x

    * * * * * * * * * * * *

    Correlao positiva

    perfeita entre x e y

    Forte Correlao

    positiva entre x e

    * ** * * * * * * * * * ** ** ** * * ** *** * * * ** *** * * ** * ** * * **

    * *** ** *** ** ** *** ** *** * ***

    Forte Correlao negativa entre x e y

    * * * * * * * * * * *

    (f) Correlao negativa perfeita entre x e y

    y

    x

  • 40

    (g) No h correlao entre x e y

    Exerccios sobre Sries e Grficos

    1. Montar uma srie cronolgica para representar os valores das exportaes de acar, fornecidas pelo Instituto do Acar e do lcool nos anos de 1965 a 1971 em milhares de dlares: 60193 80114 812826 106879 112064 126740 149548.

    2. Idealizar uma srie geogrfica para representar o seguinte fato: populao da regio Norte

    do Brasil em 1970, sabendo-se que em Rondnia, Acre, Amazonas, Roraima, Par e Amap temos, respectivamente, 116620 218006 960934 41638 2197072 e 116480 habitantes, segundo dados da Fundao IBGE.

    3. Fazer uma tabela estatstica para representar o movimento religioso de certo municpio no

    perodo 1975-1977, que apresentou os seguintes dados: em 1975 houve 56738 habitantes batizados (dos quais 26914 do sexo feminino), 15884 casamentos e 13678 extremas-unes. Em 1976, houve 33915 batizados do sexo masculino e 29568 do sexo feminino; os casamentos foram em nmero de 17032 e as extremas-unes, 14328. Em 1977, em um total de 71232 batizados, 34127 eram do sexo masculino; as extremas-unes foram 16107 e os casamentos 16774.

    4. A tabela a seguir mostra as reas, em milhes de km, dos oceanos. Representar

    graficamente os dados, usando: a) um grfico de colunas ; b) um grfico de setores.

    Oceano Antrtico rtico Atlntico ndico Pacfico

    * * * * * *

    * * * * * * * * * * * *

    * *** *** *** *** * * * ** ** ** * *

    (h) Correlao no linear entre x e y

    * ** * * * * *

    y

    x

    (i) Grfico da Equao de Regresso entre x e y

  • 41

    rea (milhes km)

    36,8 23,2 199,4 137,9 342,7

    Exerccio de Estatstica Completar as Tabelas de Distribuio de Freqncias abaixo.

    iX aF aFa rF aFr

    21 3 22 2 23 2 24 1 25 4 26 3 28 1 30 1 31 3 32 1 33 3 34 3 35 2 36 1

    ||||||||||||||||||||||||||| ||||||||||||||||||||||||||||

    Classe aF aFa rF aFr

    45 |--- 55 15 55 |--- 65 20 65 |--- 75 35

  • 42

    75 |--- 85 20 85 |--- 95 10

    ||||||||||||||||||||||| |||||||||||||||||||||||

    EXERCCIO DE ESTATSTICA - Mdias

    Um levantamento feito nas idades dos atletas participantes de um determinado torneio de futebol produziu a tabela abaixo. 21 22 21 20 23 23 23 19 30 25 23 25 23 34 32 23 24 26 23 21 32 35 21 21 20 21 24 25 23 24 26 27 28 23 25 24 42 28 28 29 22 17 21 21 21 21 22 22 24 23 28 29 29 30 23 21 26 26 27 28 29 32 31 29 18 17 30 31 24 24 40 19 20 21 23 26 23 22 28 19 23 32 22 23 22 21 20 26 27 29 22 21 22 18 22 33 21 18 31 30 19 23 24 25 26 21 21 19 23 34 23 24 19 18 30 30 18 19 27 21 21 21 22 21 28 25 21 22 21 23 25 18 28 20 23 20 23 23 23 27 19 20 17 25 26 40 29 19 24 20 23 22 21 24 16 21 27 27 28 24 30 20 25 21 24 22 20 28 21 20 34 23 30 25 30 23 28 27 25 22 17 29 20 22 23 21 27 26 29 24 26 24 25 25 34 28 Pede-se : Calcular a mdia de idade dos jogadores utilizando-se uma Tabela de Freqncias com intervalo de Classes em uma das seguintes situaes :

    1) Descartando a menor idade encontrada 2) Descartando a maior idade encontrada 3) Descartando a maior e a menor idade encontradas 4) Considerando todas as idades encontradas

  • 43

    Utilizar K = K / Situao 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

    EXERCCIOS SOBRE VARINCIA E DESVIO PADRO

    1 A tabela abaixo representa os dados coletados de uma amostra.

    20 26 26 22 26 29 27 26 21 29 23 27 30 28 28 23 25 28 21 28 29 20 27 29 25 29 20 23 25 20 29 20 27 28 22 26 28 23 20 23 27 24 25 26 25 25 20 25 28 25 29 25 27 30 29 27 28 26 28 30

    1- a Qual a Amplitude desta amostra? 1- b Qual o valor da Mediana? 1- c Qual a sua Moda? 1- d Calcule a Mdia da terceira coluna. 1- e Calcule a Mdia Geomtrica da quarta coluna 1- f Calcule a Mdia Harmnica da sexta coluna 1- g Calcule a Mdia Quadrtica da ltima coluna 1- h Qual a Varincia da amostra? 1 - i Qual o Desvio Padro da amostra? 1- j Qual o Coeficiente de Variao da amostra?

    2 A tabela abaixo representa o Rol de uma Populao.

    200 201 204 204 206 206 208 208 208 208 208 209 215 217 218 220 223 224 225 225 225 228 230 234 236 241 242 242 242 242 242 248 250 251 251 252 252 253 254 254 254 256 256 256 257 257 258 259 259 259 259 259 260 261 262 262 262 262 262 262 262 262 263 263 263 263 263 263 263 263 263 264 265 265 265 266 267 267 267 267 267 268 268 268 268 268 268 268 268 268 268 268 268 269 269 269 269 269 269 269 269 270 270 270 270 270 270 270 270 270 270 271 271 272 272 272 272 272 272 272

  • 44

    272 273 273 273 273 273 273 273 274 274 274 274 274 274 275 275 275 275 275 275 275 276 276 276 276 276 277 277 277 277 277 277 277 277 277 277 277 277 278 278 278 278 278 278 278 278 278 279 279 279 279 279 279 280 280 280 281 281 281 282 282 283 283 284 284 284 285 285 286 286 286 286 287 287 288 288 288 289 289 290

    2 a Transforme este Rol numa Tabela com dados agrupados com Intervalos de classe 2 b Calcule a Varincia desta Populao 2 c Calcule o Desvio-Padro desta Populao 2 d Calcule o Coeficiente de Variao (CV ) desta pesquisa.

    Exerccios sobre FRACTIS

    200 201 204 204 206 206 208 208 208 208 208 208 209 215 217 218 220 223 224 225 225 225 225 228 230 234 236 241 242 242 242 242 242 242 248 250 251 251 252 252 253 254 254 254 254 256 256 256 257 257 258 259 259 259 259 259 259 260 261 262 262 262 262 262 262 262 262 262 263 263 263 263 263 263 263 263 263 263 264 265 265 265 266 267 267 267 267 267 267 268 268 268 268 268 268 268 268 268 268 268 268 268 269 269 269 269 269 269 269 269 269 270 270 270 270 270 270 270 270 270 270 270 271 271 272 272 272 272 272 272 272 272 272 273 273 273 273 273 273 273 274 274 274 274 274 274 274 275 275 275 275 275 275 275 275 276 276 276 276 276 277 277 277 277 277 277 277 277 277 277 277 277 277 278 278 278 278 278 278 278 278 278 278 279 279 279 279 279 279 279 280 280 280 280 280 281 281 281 281 281 281 281 282 282 282 282 282 282 282 282 282 282 282 283 283 283 283 283 283 283 283 283 284 284 284 284 285 285 285 285 285 285 285 286 286 286 286 287 287 287 287 287 287 288 289 289 289 289 289 289 290 290 290 290 290 290 291 291 292 292 292 292 292 292 292 293 293 294 295 295 297 297 297 300 300

    Com base na Tabela de Dados Ordenados(Rol) Acima, pede-se:

  • 45

    a) Os Percentis 774837 P , P , P

    b) Os Quartis 321 Q , Q , Q

    c) Os Decis 753 D , D , D d) Determine o Percentil correspondente a 252 , 279 , 287

    e) Qual a diferena entre 202 P e D ?

    f) Qual o Percentil correspondente a 321 Q e Q , Q ? g) Qual a Amplitude da Amostra ? h) Como faria para escolher o nmero de classes ? i) Adotado um nmero de classes, qual seria a amplitude de classe ?

    Exerccios de Estatstica Mdias

    01 Determine as mdias aritmtica, geomtrica, harmnica e quadrtica das seguintes sries :

    a) 3, 4, 1, 3, 6, 5, 6 b) 7, 8, 8, 10, 12 c) 3,2; 4; 0,75; 5; 2,13; 4,75 d) 70, 75, 76, 80, 82, 83, 90

    02 A mdia mnima para aprovao em determinada disciplina 5,0. Se um estudante obtm as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questo, pergunta-se se ele foi ou no aprovado. 03 Calcule para cada uma das distribuies abaixo, sua respectiva mdia. a) ix | 3 4 7 8 12 b) ix | 10 11 12 13

    if | 2 5 8 4 3 if | 5 8 10 6

    c) ix | acf d) ix | if e) ix | if

    2 | 3 7 | 1/16 85 | 5 3 | 9 8 | 5/18 87 | 1 4 | 19 9 | 1/3 88 | 10 5 | 25 10 | 2/9 89 | 3 6 | 28 11 | 5/48 90 | 5

  • 46

    04 Dadas as estaturas, em cm, de 140 alunos, conseguiu-se a distribuio abaixo. Calcular a mdia. Estat.| 145|---150 | 150|---155 | 155|---160 | 160|---165 | 165|---170 | 170|---175 | 175|---180 | 180|---185 N | 2 | 10 | 27 | 38 | 27 | 21 | 8 | 7 05 Turmas que possuem determinada disciplina em comum apresentam, nessa disciplina: Turma A (40 alunos) - mdia 6,5 Turma B (35 alunos) - mdia 6,0 Turma C (35 alunos) - mdia 4,0 Turma D (20 alunos) - mdia 7,5 Determine a mdia geral.

    Exerccios sobre ESCORE Z 01 Os carros dos estudantes de uma faculdade tm idade mdia de 7,93 anos, com desvio-padro de 3,68 anos. Determine o escore z para os seguintes carros : a) Um GM Corsa 1994 b) Um FIAT Plio 2003 c) Um FORD Focus 0 Km 02 Uma pesquisa realizada no Japo detectou que o nmero de horas que os estudantes universitrios passam estudando fora da escola, cada semana, tm mdia de 8,03 h e desvio-padro 4,97 h. Determine o escore z para um aluno que estuda 20 horas por semana. 03 Uma mulher alegou ter dado luz uma criana, 305 dias aps a visita de seu marido, que estava servindo na Marinha em misso no exterior. Os tempos de durao da gravidez, acusam uma mdia de 269 dias, com desvio-padro de 15,5 dias. Determine o escore z correspondente aos 305 dias e comente: a) Esse prazo pode ser considerado fora do comum ? b)Que se pode concluir ? 04 Certa mquina automtica aceita moedas de 50 centavos que no fujam ao padro comum. Ache o escore z para uma moeda de 50 centavos que pesa 7,37 g. Sabe-se que os pesos das moedas de 50 centavos tm mdia de 7,60 g com desvio-padro de 0,009 g e pergunta-se : a) Qual o escore z desta moeda b) Esta moeda ser aceita pela mquina ? 05 Para os homens com idade entre 18 e 24 anos, os nveis de colesterol ( em mg / ml ) tm mdia de 178,1 e desvio-padro de 40,7.

  • 47

    a) Determine o escore z para um homem de 22 anos de idade, que tem um ndice de colesterol de 274,9 mg / ml.

    b) Esse nvel pode ser considerado muito elevado ? 06 ) Trs candidatos a um emprego fazem testes equivalentes de desempenho em pensamento crtico e voc o encarregado de decidir qual deles contratar. A. da Silva acertou 38 questes em um teste onde a mdia era de 29 e o desvio-padro, 6. B. dos Santos acertou 399 questes no teste de mdia 313 e desvio-padro, 56 C. Oliveira teve nota 4,11 em teste de mdia 2,76 e desvio-padro 0,91. a) Qual deles seria o seu escolhido ? b) Por que ? 07) Em exame de estatstica a mdia foi de 78 e o desvio-padro foi 10. a) Determine os escores z de dois alunos cujas notas foram 93 e 62, respectivamente. b) Determine as notas de dois alunos cujos escores z foram -0,6 e 1,2, respectivamente 08) Encontre a mdia e o desvio-padro em um exame onde as notas 70 e 88 correspondem a escores z de -0,6 e 1,4, respectivamente.

    Exerccios de fixao sobre TESTES DE HIPTESE E SIGNIFICNCIA

    01 ) Para testar uma hiptese de que uma moeda honesta, a seguinte regra de deciso tomada:

    (1) Aceito a hiptese se o nmero de caras em uma nica amostra de 100 lanamentos est entre 40 e 60 inclusive

    (2) Rejeito a hiptese caso contrrio. a)- Encontre a probabilidade de rejeitar a hiptese quando ela, de fato, correta b)- Interprete graficamente a regra de deciso e o resultado da pergunta anterior c)- Que concluses voc tiraria se a amostra de 100 fornecesse 53 caras ? d)- E se fornecesse 60 caras ? e)- Voc poderia estar errado em suas concluses da pergunta c) ? 02) Crie uma regra de deciso para testar a hiptese de que uma moeda honesta se uma amostra de 64 lanamentos da moeda obtida e se um nvel de (a) 0,05, (b) 0,01 usado. 03) Em um experimento sobre percepo extra sensorial (PES), uma pessoa em uma sala questionada sobre a cor(vermelha ou azul) de uma carta escolhida de um baralho de 50 cartas embaralhadas por um indivduo em outra sala. A pessoa desconhece quantas cartas vermelhas ou azuis tm no baralho. Se a pessoa identifica 32 cartas corretamente, determine se os resultados so significantes ao nvel de (a) 0,05 de significncia (b) 0,01 de significncia. 04) Em 200 lanamentos de uma moeda, 115 caras e 85 coroas foram observadas. Teste a hiptese de que a moeda honesta usando um nvel de significncia de: (a) 0,05 (b) 0,01 05) A tabela abaixo mostra as freqncias observadas e esperadas no lanamento de um dado 120 vezes.

    (a) Teste a hiptese de que o dado honesto, usando um nvel de significncia de 0,05.

    Face 1 2 3 4 5 6 Freqncia Observada

    25

    17

    15

    23

    24

    16

    Freqncia Esperada

    20

    20

    20

    20

    20

    20

  • 48

    06) Considere dois grupos, A e B, cada um consistindo de 100 pessoas portadoras de uma doena. Um soro dado ao Grupo A, mas no ao Grupo B(o qual chamado grupo de controle); caso contrrio, os dois grupos so tratados identicamente. constatado que nos Grupos A e B, 75 e 65 pessoas, respectivamente, se recuperaram da doena. Teste a hiptese de que o soro ajudou a curar a doena usando um nvel de significncia de: (a) 0,01 (b) 0,05 (c) 0,10.

    07) Em 60 lanamentos de uma moeda, 37 caras e 23 coroas foram observadas. Teste a hiptese da moeda ser honesta usando um nvel de significncia de : (a) 0,05 (b) 0,01. 08) Em um longo perodo de tempo as notas atribudas por um grupo de instrutores em determinado curso tm sido em mdia, 12% As, 18% Bs, 40% Cs, 18% Ds e 12% Es. Um novo instrutor atribuiu 22 As, 34 Bs, 66 Cs, 16 Ds e 12 Es durante dois semestres. Determine, ao nvel de significncia de 0,05, se o novo instrutor est seguindo o padro de notas dos outros instrutores. 09) O nmero de livros emprestados por uma biblioteca pblica durante uma certa semana dado pela tabela abaixo. Teste a hiptese de que o nmero de livros emprestados no depende do dia da semana, usando um nvel de significncia de (a) 0,05 (b) 0,01.

    Segunda Tera Quarta Quinta Sexta N de livros emprestados

    135