Características Peculiares dos Dados Estatísticosarmandomanuel.pro/metodos_de_previsao/Cap...

21
Características Peculiares dos Dados Estatísticos 1 2.1.SUMÁRIOS GRÁFICOS 2.2.ESTATÍSTICAS DESCRITIVAS 2.3.TRANSFORMAÇÕES E AJUSTAMENTOS DOS DADOS ARMANDO MANUEL, MSC 8/16/17

Transcript of Características Peculiares dos Dados Estatísticosarmandomanuel.pro/metodos_de_previsao/Cap...

CaracterísticasPeculiaresdosDadosEstatísticos

1

2 . 1 . S UMÁR I O S G R Á F I CO S 2 . 2 . E S TAT Í S T I C A S D E S C R I T I VA S 2 . 3 .T R AN S FO RMAÇÕ E S E A J U S TAMENTO S DO S DADO S

ARMANDOMANUEL,MSC8/16/17

SeriesTemporaiseDadosdeCorte1. Paraoexercíciodaprevisãopoderálidarcomdoisgrupospontuais

dedados.a) Seriestemporaiseoub) Dadosdecorte.

2. Geralmenteosdadoshistóricosconsistiramnumasequenciadeobservaçõesnotempo,aestasequenciachamaremosdeseriestemporais.Exemplodevendasmensais,estoquesdiáriosdabolsa,taxasdejurosemanais,lucrosanuais,temperaturasmáximas,colheitasanuaisdecereais;

3. Naprevisão,procuramosdeterminarcomoasequenciatemporaldosdadossevaicomportarnofuturo.Paratornarsimplesaapreciação,assumiremoscomohipótesebásica,dequeotempodasobservaçõeséigualmenteespaçado.Nãoécriticoconsiderarestahipótesenamedidaemquegrandepartedasseriestemporaissãomedidasdiária,mensal,trimestralouanualmente.

8/16/17 ARMANDOMANUEL,MSC 2

SeriesTemporaiseDadosdeCortePaíses/Gruposregionais Unidade Valor

Sub-SaharanAfrica UnitsCEMAC Units ...WestAfricanEconomicandMonetaryUnion(WAEMU)

Millions 44.792.230,00

Angola Millions 13.195.004,00Botswana Millions 125.158,30Burundi Millions 3.812.500,00CapeVerde Millions 153.723,17Comoros Millions 243.606,32Congo,DemocraticRepublicof Thousands 36.984.800.000,00

Ethiopia Millions 866.921,10Gambia,The Millions 32.498,19Ghana Millions 93.415,89Kenya Millions 4.730.801,00Lesotho Millions 21.416,00Madagascar Billions 23.397,00Malawi Millions 1.924.110,08Mauritius Millions 366.228,00Mozambique Millions 482.233,43Namibia Millions 122.817,06Nigeria Millions 81.009.964,62Rwanda Billions 4.929,00Seychelles Millions 17.014,69SierraLeone Millions 21.317.382,46SouthSudan Millions 40.396,90Swaziland Millions 44.645,98Tanzania Millions 70.953.227,35Uganda Billions 67.248,84Zambia Billions 143,45

8/16/17 ARMANDOMANUEL,MSC 3

ExemplodedadosdeCorte:PIBdepaísesegruposregionaisdaAfricaSubSahara,medidosemdiferenteunidadesde2013

SeriesTemporaiseDadosdeCorte

8/16/17 ARMANDOMANUEL,MSC 4

ExemplodeSeriesTemporais:ExportaçõesMensaisdeAngola

Pais Valor dasExportaçõesdeAngola2013M12 5.514.074.619,582014M01 5.277.300.072,292014M02 5.210.805.608,982014M03 5.289.142.347,052014M04 5.046.155.128,942014M05 5.536.603.446,922014M06 5.580.511.954,852014M07 5.046.488.899,442014M08 5.671.504.947,672014M09 4.885.966.194,842014M10 4.686.746.762,982014M11 3.772.108.957,262014M12 3.246.228.173,932015M01 2.725.053.680,242015M02 2.754.730.798,462015M03 2.757.660.174,422015M04 3.299.174.096,592015M05 3.402.082.486,242015M06 3.362.165.772,552015M07 3.157.363.579,272015M08 2.502.962.976,412015M09 2.514.561.028,562015M10 2.492.654.370,182015M11 2.274.753.960,872015M12 1.914.329.823,922016M01 1.619.154.103,532016M02 1.556.594.146,352016M03 2.047.438.354,442016M04 2.095.447.359,13

0.00

1.00

2.00

3.00

4.00

5.00

6.00

Billion

s

ExportaçõesMensaisdeAngola

SeriesTemporaiseDadosdeCorteMarcas Milhas Preço

ChevroletCapriceV8 USA 18 14525ChevroletLuminaAPVV6 USA 18 13995DodgeGrandCaravanV6 USA 18 15395FordAerostarV6 USA 18 12267FordMustangV8 USA 19 12164MazdaMPVV6 Japan 19 14944NissanVan4 Japan 19 14799ChevroletCamaroV8 USA 20 11545AcuraLegendV6 Japan 20 24760FordLTDCrownVictoriaV8 USA 20 17257MitsubishiWagon4 Japan 20 14929NissanAxxess4 Japan 20 13949MitsubishiSigmaV6 Japan 21 17879NissanStanza4 Japan 21 11650BuickCentury4 USA 21 13150Mazda929V6 Japan 21 23300OldsmobileCutlassCiera4 USA 21 13150OldsmobileCutlassSupremeV6 USA 21 14495ChryslerLeBaronCoupe USA 22 12495ChryslerNewYorkerV6 USA 22 16342EaglePremierV6 USA 22 15350FordTaurusV6 USA 22 13195NissanMaximaV6 Japan 22 17899BuickSkylark4 USA 23 10565OldsmobileCalais4 USA 23 9995FordThunderbirdV6 USA 23 14980ToyotaCressida6 Japan 23 21498

8/16/17 ARMANDOMANUEL,MSC 5

Marcas Milhas PreçoBuick Le SabreV6 USA 23 16145Nissan240SX4 Japan 24 13249FordTempo4 USA 24 9483SubaruLoyale4 Japan 25 9599ChryslerLeBaronV6 USA 25 10945MitsubishiGalant4 Japan 25 10989PlymouthLaser USA 26 10855ChevroletBeretta4 USA 26 10320DodgeDaytona USA 27 9745HondaPreludeSi4WS4 Japan 27 13945SubaruXT4 Japan 28 13071FordProbe USA 30 11470MazdaProtege4 Japan 32 6599EagleSummit4 USA 33 8895FordEscort4 USA 33 7402HondaCivicCRXSi4 Japan 33 9410SubaruJusty3 Japan 34 5866ToyotaTercel4 Japan 35 6488

Dadosdecorte.Preço,milhas,paisdeorigemde45automóveisdorelatóriodeconsumidores

OsSumáriosGráficosVisualizacao de1. Oexercíciosimplesemaisimportanteafazerquandoexploramosa

naturezadedados,consistenaproduçãodegráficosdosdadosemcausa.Ascaracterísticasbásicasdosdados,incluindoopadrãoeconstataçõesincomunsnosdadossãofacilmenteobservadasnumgráfico.Algumasvezesográficospermitem-nosdiscernirasvariaçõesdecorrentesnosdadosaolongodotempo.

2. Exemplo,disputasindustriais,mudançasnogoverno,facilmentepodemseridentificadasnasseriestemporais.Osgráficossãoomelhorinstrumentoparaidentificaroefeitodesteseventos.Consequentemente,conhecendo-osincorporamo-losnosnossosmodelosprevisionais.

3. Anaturezadedadosvaideterminarquetipodegráficosserãomaisapropriados.

8/16/17 ARMANDOMANUEL,MSC 6

Representaçõesdedadosnotempoepadrõesespecíficosdasseriestemporais1. Umaformapraticadeproduzirgráficosépresenta-losaolongodo

tempo.Osexemplosapresentadosnaaulapassada,constituemumreferencia.

2. Apresentaçãodosdadosolongodotempo (timeplot),imediatamentepermite-nosidentificarumpadrãoespecificodosdados,tendênciaaolongodotempo,comportamentossazonais,eououtroscomportamentossistemáticosaolongodotempo.Anecessidadedeidentificarosváriospadrões,permiteincorporarestainformaçãonomodeloestatístico.

3. Afiguradaproduçãodecervejanoslideseguinteilustraotamanhodedadoseosperíodosespecíficosemqueospicosocorrem.

8/16/17 ARMANDOMANUEL,MSC 7

Representaçõesdedadosnotempoepadrõesespecíficosdasseriestemporais

8/16/17 ARMANDOMANUEL,MSC 8

120

130

140

150

160

170

180

190

200

ProduçãomensaldeCervejanaAustráliadeJan1991aAgostode1995

Representaçõesdedadosnotempoepadrõesespecíficosdasseriestemporais1. Umespectoimportantenaescolhadométododeprevisão,consiste

noconhecimentodopadrõesespecíficosdosdados,detalmodoqueseescolhaométodomaisapropriado.Podemosdistinguirquatro(4)tipologiasdepadrõesnosdadosestatísticos,horizontal,sazonal,cíclicoetendencial.

2. Opadrãohorizontalconsistenoperfildedadosqueflutuamemtornodeumamédia.Estasseriasãoigualmentedenominadasporseriesestacionarias.Exemplodosprocessosdeproduçãocontínuos.

3. EstamosempresençadeumpadrãoSazonal,quandoaserieéinfluenciaporfatoressazonais,(exemplo,trimestralmente,mensalmente,diariamente,semanalmente).Vendascomogelados,consumodomiciliardeeletricidade,consumodeperuoubacalhauemdeterminadasculturas.Nográficoseguinte,aproduçãodecerveja,eleva-senosmesesdenovembroedezembro,repetindo-setodososanos

8/16/17 ARMANDOMANUEL,MSC 9

Representaçõesdedadosnotempoepadrõesespecíficosdasseriestemporais1. Umpadrãocíclicoocorrequandoosdadosapresentamaltose

baixosaolongodotempo,quenãoocorrememperíodosfixosAsserieseconómicasgeralmenteestãoassociadasflutuaçõesquerefletemcomportamentoscíclicosaolongodotempo.Exemploaconstruçãodecasas,ofabricoouvendadeautomóveis.

2. Adistinçãoentredadoscompadrãodenaturezacíclicaedadosdenaturezasazonal,équeoultimoapresentaumpadrãodeespaçamentoconstanteeocorredemodoregular,enquantoqueospadrõesciclosobservamumespaçamentovariável.Geralmenteespaçamentosdospadrõescíclicoschegamasermuitomaislongos.

3. Opadrãodetendênciatemporal(trend),existequandoocorreumcrescimentodelongoprazonaserie,ouumdecréscimodelongoprazo.Exemplo,vendasdeumacompanhia,variáveisdascontasnacionaiscomoPNB(ProdutoNacionalBruto)dentreoutras.

8/16/17 ARMANDOMANUEL,MSC 10

Representaçõesdedadosnotempoepadrõesespecíficosdasseriestemporais1. Algunsdadosestatísticossãocapazesdeapresentarpadrõesmistos,

tendência,sazonalidade,comportamentocíclico.Umdosgrandesdesafiosnoprocessodeprevisãoélidarcomseriesqueapresentamumavariedadedepadrões.

2. Ográficodoslideseguinte,consistenadecomposiçãoanualdaserieestatísticadoslideanterior,comopodeobservar,comadecomposiçãoanual,consegue-seperceberdecomsuficientecompressãoospicosemnovembroedezembro

8/16/17 ARMANDOMANUEL,MSC 11

Representaçõesdedadosnotempoepadrõesespecíficosdasseriestemporais

8/16/17 ARMANDOMANUEL,MSC 12

115

125

135

145

155

165

175

185

195

205

Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec

Megalitros

1991 1992 1993 1994 1995

RepresentaçãodaSazonalidade relativaaproduçãodecerveja.Reparequeaproduçãoeleva-seemnovembroedezembroempreparaçãodoversãodohemisfériosul,depoisdoinverno.

RepresentaçõesSazonaisParaseriessazonais,recomenda-seidentificaranaturezadasazonalidadeproduzirumarepresentaçãográficasazonal(Seasonalplot),consistenaprojeçãográficadosdadosemrelaçãoaosperíodosespecíficosemqueseobservaocomportamentosazonal.

Arepresentaçãográficadasazonalidade,permiteidentificardemodoclaroaocorrênciadasazonalidade.

8/16/17 ARMANDOMANUEL,MSC 13

115

125

135

145

155

165

175

185

195

205

Jan FebMar AprMay Jun Jul Aug Sep Oct Nov Dec

Megalitros

1991 1992 1993 1994 1995120

130

140

150

160

170

180

190

200

GráficosdeDispersão(Scatter plots)1. Osdadosdeautomóveisexpressosnoslide#5,nãosãoseries

temporais.Paraestesdados,asrepresentaçõessazonais,nãosãográficosapropriadosparaanalise.Paraestescasos,usamososgráficosdedispersão.

2. Assimnográficodedispersãonapaginaseguinte,cadapontonográficorepresentaumatipologiadeveículos.Assimdepreende-sequeveículoscomelevadasmilhasporgalão,sãogeralmentebaratosqueosveículosmenoseficientesemtermosdecombustíveleinversamenteosveículoscombaixamilhasporgalãosãogeralmentequotados apreçossuperiorescorrespondenteaointervalode$12mila$18mil.

3. Osdadosdedispersãopermitem-nosexploraarelaçãoentreasvariáveisoquenossugerequeosmodelosautilizartenhamdeincluirnomodelodeprevisão,asmilhascomovariávelexplanatória

8/16/17 ARMANDOMANUEL,MSC 14

GráficosdeDispersão(Scatter plots)

8/16/17 ARMANDOMANUEL,MSC 15

1,000

6,000

11,000

16,000

21,000

26,000

18 23 28 33 38

PreçoUS

$

Milhas(mpg)

Scatterplot dopreçoversusmilhasdeestatísticasautomóveis

SumáriosNumericos

8/16/17 ARMANDOMANUEL,MSC 16

SumárioGráficoeEstatísticasdescritivascomputadasnoGretl1. Emcomplementoaosgráficos,édeigualmodoimportanteproduzir

umsumárionuméricodeestatísticasdescritivas.

2. Paraumaserieunivariavel ouumaserietemporalsingular,asmaiscomunsestatísticadescritivassão:

a) Mediab) Odesviopadrãoc) Variância

8/16/17 ARMANDOMANUEL,MSC 17

SumárioGráficoeEstatísticasdescritivascomputadasnoGretl

8/16/17 ARMANDOMANUEL,MSC 18

20 40 60 80

100 120 140 160 180 200 220

1973 1977 1981 1985 1989

PAU

30 40 50 60 70 80 90

100 110 120 130

1973 1977 1981 1985 1989

PUS

0,6 0,7 0,8 0,9

1 1,1 1,2 1,3 1,4 1,5

1973 1977 1981 1985 1989

E

4 6 8

10 12 14 16 18

1973 1977 1981 1985 1989

IAU

4 6 8

10 12 14 16

1973 1977 1981 1985 1989

IUS

0,04 0,06 0,08 0,1

0,12 0,14 0,16

1973 1977 1981 1985 1989

ius2

0,04 0,06 0,08 0,1

0,12 0,14 0,16 0,18

1973 1977 1981 1985 1989

iau2

0,6 0,7 0,8 0,9

1 1,1 1,2 1,3 1,4 1,5 1,6

1973 1977 1981 1985 1989

e2

3,6 3,8

4 4,2 4,4 4,6 4,8

5

1973 1977 1981 1985 1989

lpus

-0,4-0,3-0,2-0,1

0 0,1 0,2 0,3 0,4 0,5

1973 1977 1981 1985 1989

le

3,6 3,8

4 4,2 4,4 4,6 4,8

5 5,2 5,4

1973 1977 1981 1985 1989

lpau

SumárioGráficoeEstatísticasdescritivascomputadasnoGretl

8/16/17 ARMANDOMANUEL,MSC 19

Estatísticas Descritivas, usando as observações 1972:1 - 1991:1

Variável Média Mediana Mínimo MáximoPAU 113,345 105,500 39,3000 214,500PUS 80,3195 86,5000 38,5000 125,500E 1,01974 1,08600 0,627400 1,48700IAU 11,4181 11,9500 5,20000 16,4000

Variável Desvio Padrão C.V. Enviesamento Curtose Ex.PAU 52,6322 0,464352 0,317924 -1,07758PUS 26,7756 0,333364 -0,0747622 -1,35128E 0,242478 0,237784 0,137463 -1,09661IAU 2,70077 0,236535 -0,510428 -0,386265

Variável Perc. 5% Perc. 95% intervalo IQ Observações omissasPAU 40,5600 207,550 87,1500 0PUS 39,4600 121,140 48,0500 0E 0,676030 1,48700 0,400050 0IAU 5,49000 14,9750 4,09000 0

IdentidadesbásicasdodasEstatísticasDescritivas(seriesunivariáveis)

Media

8/16/17 ARMANDOMANUEL,MSC 20

𝑌 = 12%𝑌&

valorqueseparaametademaioreametademenordeuma amostraObservaçãomédiaseimpar;Mediadasduasobservaçõesmédiassepar.

𝑀𝐴𝐷 =12% 𝑌& − 𝑌-

𝑀𝑆𝐷 = 12% 𝑌& − 𝑌- /

𝑆/ = 1

𝑛 − 1% 𝑌& − 𝑌- /�

𝑆 = 𝑆/� =1

𝑛 − 1% 𝑌& − 𝑌- /�

Mediana

Desvioabsolutodamedia(mean absolute deviation)

Quadradododesviodamedia(Mean square deviation)

Variância

Desviopadrão

IdentidadesbásicasdodasEstatísticasDescritivas(Seriesbivariáveis)

Covariância

8/16/17 ARMANDOMANUEL,MSC 21

CoeficientedeCorrelação

𝐶𝑜𝑣45 = 1

𝑛 − 1% 𝑋& − 𝑋- 𝑌& − 𝑌-7

&89

𝑟45 = 𝐶𝑣𝑣45𝑆4𝑆5

=∑ 𝑋& − 𝑋- 𝑌& − 𝑌-7&89

∑ 𝑋& − 𝑋-7&89

� ∑ 𝑌& − 𝑌-7&89