Reve Statistic a Probab Il i Dade

download Reve Statistic a Probab Il i Dade

of 117

Transcript of Reve Statistic a Probab Il i Dade

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    1/117

    Reviso estatstica e

    probabilidadeProf. Anderson Almeida Ferreira

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    2/117

    Populao

    Populao o conjunto de elementos (indivduos, objetos,etc.) que formam o universo de nosso estudo e que sopassveis de serem observados, sob as mesmas condies.

    Num processo de inspeo da qualidade, a populao podeser considerada como o conjunto de todos os itens que saemda linha de produo.

    Numa pesquisa de mercado, apopulao o conjunto de possveis

    consumidores.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    3/117

    Amostragem Grande parte das pesquisas cientficas ou de resolues de

    problemas de engenharia so feitos por amostragem, ou seja,observamos apenas um subconjunto de elementos dapopulao.

    A amostragem particularmente interessante quando: a populao grande ou infinita.

    as observaes ou mensuraes tm alto custo.

    as medidas exigem testes

    destrutivos. necessidade de rapidez, etc.

    POPULAO: todos os

    possveis consumidores

    Amostra: um subconjunto dosconsumidores

    inferncia

    amostragem

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    4/117

    Populao e Amostra

    Populao (ou universo): todos os Nmembros deuma classe ou grupo. Ex.: todos os processos executados numa mquina

    durante o perodo que esteve ativa.

    Amostra uma parte da populao, denotadapor n. Ex.: todos processos executados pela mquina em

    18/03/2006

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    5/117

    Variveis

    Normalmente, estamos interessados em certascaractersticas dos objetos de uma populao.Por exemplo:

    Nmero de falhas; Espessura de cada parede;

    Sexo de um formando;

    Idade com que um indivduo se formou

    Uma caracterstica pode ser categorizada, comosexo ou tipo de defeito, ou pode ser de naturezanumrica.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    6/117

    Variveis

    Uma varivel qualquer caracterstica que cujo valor podemudar de um objeto para outro da populao.

    Ou seja, uma varivel, o nome que se d a um fenmenoque pode ser medido e que varia conforme a medio.

    Se no variasse seria uma constantee no teria maiorinteresse para a pesquisa. Normalmente, identificamos as variveis com letras

    minsculas do final do alfabeto. Exemplo: x = marca da calculadora de um estudante

    y = nmero de defeitos graves em um automvel recentementefabricado z = distncia de frenagem de um automvel sob condies

    especficas

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    7/117

    Variveis

    Os dados resultam da observao de uma, ou de duas oumais variveis simultaneamente.

    Univariadosobservaes sobre uma nica varivel.Exemplos:

    Tipo de transmisso (A, M) de cada um dentre 10 automveisrecentemente comprados Vida til (horas) de baterias da marca D colocadas em

    determinado uso

    Bivariadosobservaes feitas em cada uma de duasvariveis. Exemplo: O par (altura, peso) de cada jogador de basquete de um time.

    Multivariadosquando so feitas observaes sobre maisde duas variveis

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    8/117

    Pesquisa Observacional e Experimental

    Numapesquisa observacional(ou de levantamento) ascaractersticas de uma populao so levantadas (observadas oumedidas), mas sem manipulao. o caso de um censo demogrfico, pesquisas eleitorais, pesquisas de

    mercado, inspeo da qualidade, etc.

    Em todos esses casos, se quer ter idia de uma certa populao tal qual ela na natureza ou no processo.

    Naspesquisas experimentais, grupos de indivduos (ou animais, ouobjetos) so manipulados para se avaliar o efeito de diferentes

    tratamentos. o caso de se verificar o rendimento de um processo qumico para diferentes

    temperaturas de reao, as quais so manipuladas de acordo com o interesseprtico.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    9/117

    Os mtodos no so os mesmos

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    10/117

    Estatstica Descritiva

    utilizada quando se deseja simplesmente resumir edescrever caractersticas importantes de dados coletados

    Envolve: Coletar dados

    Apresentar dados

    Caracterizar dados

    Finalidade:

    Descrever dados

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    11/117

    Estatstica Inferencial

    utilizada quando um investigador usa as informaes daamostra para tirar algum tipo de concluso sobre a populao

    Envolve: Estimativas

    Testes de Hiptese

    Finalidade:

    Tomar decises sobre caractersticas da populao de uma coleta

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    12/117

    Terminologia

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    13/117

    Varivel Aleatria

    Uma varivel aleatria (VA)x em um espao amostralS umafunox: Sque atribui um nmero real acada ponto amostral em S

    Ou seja, uma varivel aleatria uma varivel querecebe um valor numrico como resultado de umexperimento.

    Ex. Atrasos numa rede, tempo de resposta de um servidor,tempo entre chegadas de clientes em um servidor, nmero

    de tweets recebidos por uma conta experimental do Twitter

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    14/117

    Mdia

    A mdia amostral Para um conjunto de nmeros x1, x2, x3, ...xn,

    Para informar a mdia amostral recomenda-se o usode preciso decimal de um dgito a mais do que a

    preciso dosxi. Mdia da populao

    = (soma dos N valores da populao)/N

    n

    x

    x

    n

    i

    i 1

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    15/117

    Mas cuidado com Mdia

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    16/117

    Varincia

    Considere-se as trs sries de valores abaixo:

    possvel notar certa semelhana entre elas?

    Aparentemente so conjuntos bem diferentes. Mas todos tm a mesma mdia: 11,25.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    17/117

    Varincia

    Essa observao do distanciamento doselementos em relao mdia chamada de

    varincia. Ento, alm da mdia, o pesquisador deve

    ficar atento tambm varinciado conjunto

    de valores, j que esta complementa acaracterizao do conjunto.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    18/117

    Clculo da varincia

    Para cada elemento, subtraia a mdia doconjunto deste elemento: = =

    =

    Agora, cada valor representa a distncia do elemento para a mdia doconjunto

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    19/117

    Eleve os valores resultantes ao quadrado:

    =

    = =

    Isso faz com que todas as distncias fiquem positivas e aumenta a influncia deelementos mais distantes da mdia.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    20/117

    Some os resultados:

    1,5625+0,5625+7,5625+5,0625 = 14,75105,0625+76,5625+85,5625+115,5625 = 382,75

    0,0625+0,0625+0,0625+0,5625 = 0,75

    Isso gera um valor absoluto da varincia acumulada

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    21/117

    Divida pelo nmero de elementos do conjuntomenos 1:

    14,75/3 = 4,9166...

    382,75/3 = 127,5833...0,75/3 = 0,25

    Isso gera a distncia mdia, ou seja, independente do

    nmero de elementos no conjunto.Poderia ser nao invs de n-1, mas a varincia de umconjunto com apenas 1 elemento deve serindeterminada.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    22/117

    Frmula da Varincia

    a varincia do conjunto X

    representa cada um dos elementos do conjunto X

    a mdia do conjunto X

    o nmero de elementos do conjunto X

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    23/117

    Desvio-Padro

    O desvio-padro uma medida tambmbastante utilizada para analisar conjuntos e

    definido simplesmente como a raiz quadradada varincia

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    24/117

    Indices de Disperso

    Medem qual a variao de conjunto de dados Intervalo (minmo e mximo)

    Variancia da amostra

    E os derivados da varincia da amostra:

    Desvio Padro, S

    COV = Razo da mdia da amostra e o desvio padros / x

    Percentis

    Especificao de quantas observaes caem nos intervalos

    sn

    x xii

    n2 2

    1

    1

    1

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    25/117

    Sumarizao de DadosDado uma amostra {x1, x2,..., xn} de no

    observaes. No caso da mediana,x(i) o i-esimoelemento da listaordenada

    4. Mediana

    5. Moda: observao com maior

    frequncia

    6. Varincia da amostra

    parsexx

    imparsex

    nn

    n

    )(5.0 )2/)1(()2/(

    )2/1((

    n

    i

    i xxn

    s1

    22 )(1

    1

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    26/117

    Sumarizao de Dados

    Dado uma amostra {x1, x2,..., xn} de noobservaes.

    7. Desvio Padro

    8. Coeficiente de Variao =

    n

    i

    i xx

    n

    s

    1

    2)(

    1

    1

    xs /

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    27/117

    Mediana

    Mediana amostral: Valor tal que 50% dos pontos esto abaixo dele

    Ordene as observaes em ordem crescente

    = ao (n+1)/2esimo valor se n impar

    = mdia do (n/2)-esimo e do (n/2+1)-esimovalores, se n par

    Divide as observaes em duas partes

    x~

    x~

    x~

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    28/117

    Quartis e Percentis

    Quartis: Divide as observaes em 4 partes

    O 2 quartil a mediana

    Percentis: Divide as observaes em 100 partes

    99-esimo percentil separa as 1% maiores observaesdo restante

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    29/117

    Exerccio

    O artigo The Pedaling Technique of Elite EnduranceCyclists (Int. J. of Sport Biomechanics, 1991, p.29-53)relatou os dados a seguir sobre a potncia de uma nicaperna de um ciclista em alta carga de trabalho:244 191 160 187 180 176 174 205 211 183 211 180 194 200

    Calcule a mdia e a mediana amostral. Suponha que a primeira observao tenha sido 204 em vez de

    244. Como a mdia e a mediana seriam afetadas? Calcule uma mdia aparada, eliminando a maior e a menor

    observao da amostra O artigo tambm relatou valores sobre a potncia uma nica

    perna para uma carga de trabalho baixa. A mdia amostralpara 13 observaes foi 119,8 e a 14 observao foi 159.Qual o valor da mdia para a amostra toda?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    30/117

    Exerccio

    O artigo Oxygen Consumption During FireSuppression: Error of Heart Rate Estimation(Ergonomics, 1991, p. 1469-1474) informou osdados a seguir sobre consumo de oxignio

    (mL/kg/min) para uma amostra de 10 bombeirosem uma simulao de supresso de incndio:29,5 49,3 30,6 28,2 28,0 26,3 33,9 29,4 23,5 31,6

    Calcule: A amplitude amostral A varincia amostral O desvio padro

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    31/117

    Exerccio

    Em uma amostra foram observados os seguintesvalores para uma caracterstica: 116,4 115,9114,6 115,2 115,8

    Calcule a mdia amostral e os desvios em relao amdia

    Use os desvios calculados para obter a varinciaamostral e o desvio padro amostral

    Subtraia 100 de cada observao para obter uma novaamostra de valores transformados. Calcule a varinciaamostral desses valores e a compare a varincia dosdados originais.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    32/117

    Probabilidade

    Probabilidadese refere ao estudo daaleatoriedade e da incerteza

    A teoria da probabilidade oferece mtodos dequantificao das chances ou possibilidadesde ocorrncia associadas aos diversosresultados

    Experimentoqualquer ao ou processocujo resultado est sujeito a incerteza.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    33/117

    Espao Amostral

    O espao amostral de um experimento,representado por S, o conjunto de todos osresultados possveis desse experimento.

    Exemplos: Examinar um fusvel para verificar se funciona

    S={N, D}N representa sem defeito e D com defeito

    Examinar trs fusveis em sequncia S={NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    34/117

    Exemplo

    Dois postos de gasolina esto localizados emuma determinada interseo. Cada um possuiseis bombas. Considere o experimento em

    que o nmero de bombas em uso emdeterminada hora do dia determinado paracada posto.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    35/117

    Exemplo

    Se uma bateria de lanterna nova, tipo D, tiveruma voltagem fora de certos limites, serclassificada como falha (F); se a voltagem

    estiver dentro dos limites especificados, serclassificada como sucesso (S). Suponha queum experimento consista em testar cada

    bateria quando sai de uma da linha demontagem at que seja observado umsucesso.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    36/117

    Evento

    Evento qualquer grupo (subconjunto) deresultados contidos no espao amostral S.

    Simplesse possui um nico resultado

    Compostose possui mais de um resultado

    Quando um experimento realizado,determinado eventoAocorre se o resultado

    experimental estiver contido emA.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    37/117

    Exemplo

    Considere um experimento em que cada umde trs veculos que trafeguem em umadeterminada estrada siga ela sada esquerda

    (E) ou direita (D) no final da rampa de sada. Alguns eventos compostos:

    O evento em que exatamente um dos trs veculos vira direita

    O evento em que no mximo um dos veculos vira direita

    O evento em que os trs veculos viram na mesmadireo

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    38/117

    Exemplo

    Para o exemplo das bombas em uso em cadaum de dois postos

    Exemplos de eventos compostos

    O evento em que o nmero de bombas em uso omesmo nos dois postos;

    O evento em que o nmero total de bombas em uso 4;

    O evento em que no mximo uma bomba est em usoem cada posto.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    39/117

    lgebra de Eventos

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    40/117

    lgebra de Eventos

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    41/117

    lgebra de Eventos

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    42/117

    lgebra de Eventos

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    43/117

    Trs axiomas da probabilidade Dado um experimento e um espao amostral S, o objetivos da

    probabilidade atribuir a cada eventoAum nmero P(A),denominado probabilidade do eventoA, quefornecer umamedida precisa da chance de ocorrncia de A.

    Para assegura que as atribuies de probabilidades sejam

    consistentes, todas as atribuies devem satisfazer os axiomasa seguir:

    Para qualquer evento A, P(A) >= 0

    P(S) = 1 (Normalizao)

    Se A e B so mutuamente exclusivosP (A + B) = P(A) + P(B)

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    44/117

    Exemplo

    Representando os seis eventos simplesassociados ao lanamento de um dado de seislados por E1, E2, E3, E4E5e E6.

    Se o dado for construdo de tal forma quequalquer um dos trs resultados pares tenha odobro de probabilidade de ocorrer em relao aosmpares, como seria uma atribuio apropriada de

    probabilidades a cada evento simples? Qual seria a probabilidade do evento A =

    resultado par?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    45/117

    Tcnicas de contagem

    Quando os diversos resultados so igualmenteprovveis, a tarefa de calcular probabilidadesse reduz a contagem. Em particular se N for a

    quantidade de resultados de um espaoamostral e N(A) for a quantidade deresultados contidos em um evento A, ento

    P(A) = N(A)/N

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    46/117

    Tcnicas de Contagem

    Regra do produto Se o primeiro elemento ou objeto de um par

    ordenado puder ser selecionado de n1formas e paracada uma das n1formas, o segundo elemento do par

    pode se selecionado de n2formas, o nmero de pares n1n2.

    Exemplo: Uma famlia se mudou para uma cidade eprecisa dos servios de um obstetra e de um pediatra.

    H duas clnicas de fcil acesso e cada uma tem doisobstetras e trs pediatras. De quantas formas a famliapode escolher os dois especialistas na mesma clnica.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    47/117

    Exemplo

    H 10 professores disponveis para correode provas de um determinado curso. Oprimeiro exame consiste em quatro questes

    e deseja-se selecionar um professor diferentepara corrigir cada uma (apenas um porquesto). De quantas formas diferentes os

    professores podem ser escolhidos para acorreo?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    48/117

    Combinao

    Definio

    Dado um conjunto de nobjetos diferentes,qualquer subconjunto no-ordenado de tamanho

    k denominado combinao. O nmero decombinaes de tamanho kque podem serformadas a partir de nobjetos representadopor

    k

    n

    )!(!

    !

    !

    ,

    knk

    n

    k

    P

    k

    n nk

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    49/117

    Exemplo

    Um depsito de uma universidade recebeuuma entrega de 25 impressoras, das quais 10so impressoras a laser e 15 so a jato de

    tinta. Se 6 das 25 forem selecionadasaleatoriamente para serem verificadas por umtcnico, qual ser a probabilidade de queexatamente 3 delas sejam a laser?

    E a probabilidade de ao menos 3 impressorasa jato de tinta serem selecionadas?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    50/117

    Probabilidade Condicional

    Exemplo Componentes complexos so montados em uma fbrica

    que usa duas linhas de montagem diferentes: A e A. A linhaA usa equipamentos mais antigos que A, de forma que mais lenta e um pouco menos confivel. Suponha que emdeterminado dia, a linha A tenha montado 8 componentes,dos quais 2 foram identificados como defeituosos e 6 nodefeituosos, ao passo que a linha A produziu 1 defeituoso e9 no defeituosos.

    O gerente de vendas seleciona aleatoriamente 1 dos 18componentes para uma demonstrao.

    Antes da demonstrao, qual a probabilidade do componenteselecionado ser na linha A?

    Se o componente tiver defeito, qual a probabilidade docomponente selecionado ser na linha A?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    51/117

    Probabilidade condicional

    A probabilidade condicionaltrata da probabilidade de ocorrer um evento A, tendoocorrido um evento B, ambos do espao amostral S, ou seja, ela calculada sobre oevento B e no em funo o espao amostral S.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    52/117

    Probabilidade condicional

    Exemplo

    Uma pesquisa realizada entre 1000

    consumidores,registrou que 650 deles trabalham

    com cartes de crdito da bandeira MasterCard,

    que 550 trabalham com cartes de crdito da

    bandeira VISA e que 200 trabalham com cartes

    de crdito de ambas as bandeiras. Qual aprobabilidade de ao escolhermos deste grupo

    uma pessoa que utiliza a bandeira VISA, ser

    tambm um dos consumidores que utilizam

    cartes de crdito da bandeira MasterCard?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    53/117

    Probabilidade condicional

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    54/117

    Exerccio

    Suponha que, de todos os indivduos quecompram uma determinada cmera digital,60% incluem um carto de memria opcional

    na compra, 40% incluem uma pilha extra e30% incluem um carto e uma pilha. Dado queo indivduo selecionado comprou uma pilha

    extra, qual a probabilidade de compra deum carto opcional?

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    55/117

    Variveis Aleatrias

    Def.: Para um dado espao amostral Sde umexperimento, uma varivel aleatria (va) qualquerregra que associe um valor a cada resultado de S. Emtermos matemticos, uma varivel aleatria umafuno cujo domnio o espao amostral e ocontradomnio um conjunto de nmeros reais.

    Exemplo: Quando um estudante tenta acessar umcomputador em um sistema de compartilhamento detempo, toda as portas esto ocupadas (F), caso em que

    o aluno no ter sucesso, ou haver ao menos umaporta livre (S), caso em que o estudante conseguiracessar o sistema. Com S= {S, F}, defina uma va X X(S) = 1 X(F)=0

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    56/117

    Variveis aleatrias

    Varivel aleatria de Bernoulli Qualquer varivel aleatria cujos nicos valores possveis

    so 0 e 1.

    Variveis aleatrias discretas, quando os valores

    possveis constituem um conjunto finito ou podem serrelacionados em uma sequncia infinita na qual hajaum primeiro elemento, segundo elemento e assim pordiante.

    Variveis aleatrias contnuas, quando o seu conjuntode valores possveis consiste em um intervalo completoda reta de nmeros (Reta real).

    Di t ib i d b bilid d

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    57/117

    Distribuio de probabilidade paravariveis aleatrias discretas

    Exemplo: Seis lotes de componentes esto prontos para

    embarque em um fornecedor. O nmero decomponentes com defeito em cada lote mostrado a

    seguir:

    Seja X o nmero de peas com defeito no lote

    selecionado. Sendo os eventos igualmente provveis p(0) = P( X=0 ) =

    p(1) = P( X=1 ) =

    p(2) = P( X=2 ) =

    Lote 1 2 3 4 5 6

    Nmero de peas com defeito 0 2 0 1 2 0

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    58/117

    Funo de massa de probabilidade

    Def.: A funo distribuio de probabilidade oufuno de massa de probabilidade (fmp ou pmf)de uma va discreta definida para cada nmeroxpor p(x) = P(X=x)=P(todos os sS: X(s)=x).

    Exemplo 1:Suponha que visitemos uma lojadurante uma semana e observemos se a prximapessoa a comprar um computador comprar umlaptop ou um desktop.

    Se 20% de todos os computadores duranteaquela semana selecionaram um laptop, a fmp deX ser:

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    59/117

    Exemplo 2: Considere um grupo de cincodoadores de sangue potenciais: A, B, C, D e E.Desses apenas A e B possuem O+. Cinco

    amostras de sangue, uma de cada indivduo,sero testadas em ordem aleatria at queseja identificado um indivduo O+. Seja va

    Y=nmero de testes necessrios paraidentificar um indivduo O+. Ento a fmp de Y:

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    60/117

    PDF (probability distribution function) ou pmf

    Seja X o nmero de visitas que cada requisiofaz ao disco

    p(X): p(0) = 0.25 p(1) = 0.5 p(2) = 0.25

    Funo de Probabilidade de Massa

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0 1 2

    # visitas ao disco

    p(x)

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    61/117

    Histograma

    Outra representao grfica equivalente Plota o nmero de vezes que a sada de um experimento

    aleatrio foi igual a cada ponto amostral

    Ex: se total de requisies ao servidor = 1000

    Histograma

    0

    100

    200300

    400

    500

    600

    0 1 2

    # visitas ao disco

    #Requisies

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    62/117

    Distribuies Discretas

    Zipf() Comumente usada quando a distribuio altamente

    concentrada em poucos valores Popularidade de arquivos em servidores Web/multimdia

    90% dos acessos so para 10% dos arquivos Popularidade de palavras na lngua inglesa

    Seja i, o elemento que ocupa a i-esima posio no rankingde concentrao

    C a constante de normalizao

    Zipf: lei das Potncias

    ,...2,1)( iiCiXP

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    63/117

    Distribuio Zipf Modela popularidade dos remetentes de e-mails

    Parmetro de uma distribuio de

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    64/117

    Parmetro de uma distribuio deprobabilidade

    No exemplo 1, tnhamos p(0)=0,8 e p(1)=0,2.Em outra loja temos p(0)=0,9 e p(1) = 0,1. Deforma geral, a fmp de qualquer va Bernoulli

    pode ser expressa na forma

    aqui um parmetrocontrrio

    x

    x

    caso

    se

    se

    xp 1

    0

    0

    1

    );(

    Funo de distribuio acumulada

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    65/117

    Funo de distribuio acumulada(FDA ou CDF)

    A FDA F(x)de uma va discreta X com fmp p(x) definida para cada valor de x po

    Para qualquer valor x, F(x) a probabilidadede o valor X observado ser no mximo x.

    xyy

    ypxXPxF

    :

    )()()(

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    66/117

    Exemplo: Para a fmp

    F(y) para cada valor de {1,2,3,4} :

    F(2,7)= F(3,9999)=

    y 1 2 3 4

    P(y) 0,4 0,3 0,2 0,1

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    67/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    68/117

    Valor Esperado

    Seja X uma va discreta com conjunto devalores possveis D e fmpp(x). O valoresperado ou valor mdio de X denotado por

    E(X) ou x

    Qual o valor esperado de uma va Bernoulli X?

    Dxx xpxXE )()(

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    69/117

    Distribuio de probabilidade binomial

    H diversos experimentos que satisfazem exatamente ouaproximadamente a seguinte lista de requisitos: O experimento consiste em uma sequncia de n experimentos

    menores denominados tentativas, onde n estabelecido antes doexperimento.

    Cada tentativa pode resultar em um de dois resultados possveis,

    chamados de sucesso (S) ou falha (F). As tentativas so independentes, de forma que o resultado de

    qualquer tentativa particular no influencia o resultado de qualqueroutra tentativa.

    A probabilidade de sucesso constante de uma tentativa para a outra.Denominamos essa probabilidadep.

    Um experimento para o qual essas condies so satisfeitas denominado experimento binomial.

    Exemplo: A mesma moeda lanada sucessiva eindependentemente n vezes.

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    70/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    71/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    72/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    73/117

    Exerccio

    Calcule usando a frmula b(3; 8, 0,6)=

    b(5; 8, 0,6)=

    P(3 X 5) quando n=8 e p=0,6 P(1 X) quando n=12 e p=0,1

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    74/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    75/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    76/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    77/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    78/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    79/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    80/117

    Exerccio Seja X o nmero de falhas na superfcie de

    uma caldeira de um determinado tiposelecionada aleatoriamente, com distribuiode Poisson de parmetro =5. Calcule

    P(X8)= P(X=8)=

    P(X9)=

    P(5 X 8)=

    P(5

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    81/117

    E l

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    82/117

    Exemplo

    A probabilidade de X ter um valor no intervalo[a, b] a rea contida entre o intervalo e

    abaixo da curva da funo de densidade. Ogrfico de f(x) normalmente denominadocurva de densidade.

    Funo de distribuio acumulada e

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    83/117

    Funo de distribuio acumulada evalores esperados

    A funo de distribuio acumulada F(x) de uma vacontnua X definida para cada nmero x por

    a rea abaixo da curva de densidade esquerda de x.

    O valor mdio ou esperado de uma va contnua X comfdp f(x)

    A varincia de uma va contnua X com fdp f(x) e mdia

    x

    dyyfxXPxF )()()(

    dxxfxXEx )()(

    ])[()()()( 222 xEdxxfxXVX

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    84/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    85/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    86/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    87/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    88/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    89/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    90/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    91/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    92/117

    Exemplo

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    93/117

    Exemplo Suponha que o tempo de resposta X em um terminal

    de computador on-lineespecfico tenha distribuioexponencial com tempo de resposta esperado igual a 5segundos. Qual a probabilidade de o tempo deresposta ser no mximo 10 segundos?

    A probabilidade de o tempo de resposta estar entre 5 e10

    865,0135,0111)2,0;10()10(

    2,0,5

    1

    )(

    2)10)(2,0(

    eeFXP

    XE

    233,0)1()1(

    )2,0;5()2,0;10()105(

    12

    ee

    FFXP

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    94/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    95/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    96/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    97/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    98/117

    Intervalos de confiana

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    99/117

    Intervalos de confiana

    Estimando a Populao a Partir das Amostras Quo alto so os humanos?

    Medir todos nesta sala (amostra) Calcular a mdia da amostra

    Assumir que a mdia da populao igual da amostra . Uma estimativa pontual no diz nada sobre o

    quanto pode estar prxima de Uma alternativa para apresentar um nico valor

    sensato para o parmetro que est sendoestimado calcular e relatar um intervalocompleto de valores plausveis.

    x

    x

    Intervalos de confiana

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    100/117

    Intervalos de confiana

    Valor da mdia da amostra apenas umaestimativa da verdadeira mdia da distribuio.

    Os limite c1e c2tais que existe uma altaprobabilidade, 1-, que a mdia da populaoest no intervalo (c1,c2):

    Pr{ c1< m < c2} =1-

    onde o nvel de significncia e

    100(1- ) o nvel de confiana

    2]Pr[]Pr[ 21

    cxcx

    I l d C fi

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    101/117

    Intervalos de Confiana

    Quo alto Jos? Suponha que a mdia da altura humana seja 1,70 m

    Jos mede 1,70 mcerto?

    Suponha que 90% dos humanos esto entre 1,55 e 1,90 m

    Jos est entre 1,55 e 1,90 m Ento estamos 90% confiantesque Jos est entre 1,55 e

    1,90 cm

    Estimando os Intervalos de

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    102/117

    Confiana Duas frmulas para intervalo de confiana

    Acima de 30 amostras de qualquerdistribuio: distribuio-z

    Pequenas amostras de populaesnormalmente distribudas: distribuio-t

    Distribuio Z

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    103/117

    Distribuio Z

    O intervalo de confiana 100(1-)% da mdiade uma populao normal, quando o valorde e conhecido, dado por

    Teorema do limite central: A mdia amostral

    de observaes distribudas identicamente eindependentes:

    nzx /2/1

    )/;(~ nNx

    Distribuio-z

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    104/117

    Distribuio-z

    Intervalo em cada lado da mdia:

    O nvel de significncia pequenopara nveis maiores do intervalo deconfiana.

    Existem tabelas para a varivel z!

    x z

    s

    n

    1 2n

    xxz /

    645.12

    1.01

    z 960.1

    205.01

    z

    Exemplo da Distribuio z

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    105/117

    Exemplo da Distribuio z

    35 amostras: 10 16 47 48 74 30 81 42 57 67 7 13 56 44 54 17 60 32 45 2833 60 36 59 73 46 10 40 35 65 34 25 18 48 63

    Mdia da amostra = 42,1Desvio padro s= 20,1 n = 35

    Calcule o intervalo com 90% de confiana

    x

    42 1 1 645 20 1

    3536 5 47 7. ( . )

    .( . , . )

    645.12

    1.01

    z 960.1

    205.01

    z

    x z s

    n

    12

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    106/117

    Definindo o tamanho da amostra

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    107/117

    Definindo o tamanho da amostra

    Quantas observaes n para obter umaacurcia de r% e um nvel de confiana100(1-)%?

    r% de acurcia implica em

    CI =

    nszx

    ))100/1(),100/1(( rxrx

    Distribuio t

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    108/117

    Distribuio t

    Frmula quase a mesma:

    Usvel para populaes normalmente distribudas!

    Mas funciona para pequenas amostras

    n-1 indica o grau de liberdade

    x ts

    nn 1 2 1 ;

    Exemplo da Distribuio t

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    109/117

    Exemplo da Distribuio t

    10 amostras de chegada de transaes: 148 166 170 191 187 114 168180 177 204

    Mdia da amostra = 170.5.Desvio padro s= 25.1, n = 10

    Calcule o intervalo de confiana de 90%:

    Quanto

    x

    x t

    s

    nn

    1 2 1 ;

    110;2

    1.01 t

    Exemplo da Distribuio t

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    110/117

    Exemplo da Distribuio t

    x

    170 5 1 833 25 1

    10156 0 185 0. ( . )

    .( . , . )

    Exemplo da Distribuio t

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    111/117

    Exemplo da Distribuio t

    10 amostras de chegada de transaes: 148 166 170 191 187 114 168180 177 204

    Mdia da amostra = 170.5.Desvio padro s= 25.1, n = 10

    Calcule o intervalo de confiana de 90%:

    Calcule agora o intervalo de 99% de confiana

    x

    170 5 1 833 25 1

    10156 0 185 0. ( . )

    .( . , . )

    x t

    s

    nn

    1 2 1 ;

    Exemplo da Distribuio t

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    112/117

    Exemplo da Distribuio t

    x

    170 5 1 833 25 1

    10156 0 185 0. ( . )

    .( . , . )

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    113/117

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    114/117

    Tomando decises sobre os dados

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    115/117

    experimentais

    Por que usamos intervalos de confiana?

    Sumarizar o erro na mdia da amostra

    Prover elementos para saber se a amostra significativa

    Permitir comparaes luz dos erros

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    116/117

    Referncias

  • 7/21/2019 Reve Statistic a Probab Il i Dade

    117/117

    Referncias

    Raj Jain. The Art of Computer SystemPerformance Analysis: Techniques forExperimental Design, Measurement, Simulationand Modeling, John Wiley & Sons, Inc., 1991.

    Jay L. Devore, PROBABILIDADE E ESTATSTICAPARA ENGENHARIA E CINCIAS. CengageLearning, 2006.

    Material didtico do prof. Fabrcio Benevenuto. Material didtico da profa. Jussara Almeida

    DCC/UFMG