íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de...

5
íNDICE Os Autores Prólogo XI XIII PARTE 1- O Sistema R 1. Introdução ao Sistema R 1.1. O que é o R? 1.2. Instalar o R 1.3. Edição de Comandos e Ambientes de Desenvolvimento 1.4. Objetos, Funções e Packages 1.5. Ajuda e Documentação 1.6. Gravar e Recuperar uma Sessão 3 4 4 4 6 7 8 2. Vetores e Tipos Primitivos 2.1. Atribuição de Valores a um Objeto 2.2. Valores Numéricos e Operadores Aritméticos 2.3. Vetores Numéricos 2.4. Acesso aos Elementos de Vetores 2.5. Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de Strings 2.8. Fatores 2.9. Valores Omissos Exercícios Resolvidos 9 10 10 11 15 16 20 22 24 25 26

Transcript of íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de...

Page 1: íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de Strings 2.8. Fatores 2.9. ... Exercícios Resolvidos 236 PARTE 111-Casos de Aplicação

íNDICE

Os Autores

Prólogo

XI

XIII

PARTE 1- O Sistema R

1. Introdução ao Sistema R

1.1. O que é o R?

1.2. Instalar o R

1.3. Edição de Comandos e Ambientes de Desenvolvimento

1.4. Objetos, Funções e Packages

1.5. Ajuda e Documentação

1.6. Gravar e Recuperar uma Sessão

3

444678

2. Vetores e Tipos Primitivos

2.1. Atribuição de Valores a um Objeto

2.2. Valores Numéricos e Operadores Aritméticos

2.3. Vetores Numéricos

2.4. Acesso aos Elementos de Vetores

2.5. Funções sobre Vetores Numéricos

2.6. Vetores Lógicos

2.7. Strings e Vetores de Strings

2.8. Fatores

2.9. Valores Omissos

Exercícios Resolvidos

9

10

10

11

15

162022242526

Page 2: íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de Strings 2.8. Fatores 2.9. ... Exercícios Resolvidos 236 PARTE 111-Casos de Aplicação

VI Análise e Exploração de Dados com R

3. Estruturas de Dados e Funções 31

3.1. Matrizes 32

3.2. Arrays 36

3.3. Lists 37

3.4. Data Frames 39

3.5. Datas e Horas 44

3.6. Conversões entre Estruturas de Dados 45

Exercícios Resolvidos 46

4. Leitura e Escrita de Dados 51

4.1. Definição da Diretoria de Trabalho 52

4.2. Leitura de Dados 53

4.3. Escrita de Dados no Ecrã e em Ficheiro 55

Exercícios Resolvidos 57

5. Programação em R 59

5.1. Definição de Novas Funções 60

5.2. Instruções Condicionais 61

5.3. Instruções Cíclicas 62

Exercícios Resolvidos 65

6. R Markdown 71

6.1. Introdução ao R Markdown 72

6.2. Linguagem R Markdown 72

6.3. Exemplo 74

Exercícios Resolvidos 77

PARTE 11- Análise de Dados com o Sistema R 81

7. Representação, Sumariação e Pré-Processamento dos Dados 83

7.1. Estrutura e Representação dos Dados 84

7.2. Verificação da Estrutura dos Dados 86

7.3. Estatística Descritiva para Sumariação dos Dados 88

7.4. Tratamento de Valores Omissos 90

7.5. Discretização de Variáveis Numéricas 93

7.6. Estandardização dos Dados 94Exercícios Resolvidos 95

Page 3: íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de Strings 2.8. Fatores 2.9. ... Exercícios Resolvidos 236 PARTE 111-Casos de Aplicação

índice VII

8. Visualização Gráfica de Dados 101

8.1. Gráficos de Dispersão 102

8.2. Boxplots 107

8.3. Histogramas 1118.4. Gráficos de Barras e Pie Charts 113

8.5. Sobreposição de Objetos Gráficos 115

8.6. Formatação e Exportação de Gráficos 118

8.7. Package ggplot2 120

Exercícios Resolvidos 126

9. Inferência e Modelação Estatística 131

9.1. Distribuições de Probabilidade em R 132

9.2. Verificar a Normalidade dos Dados 142

9.3. Amostragens 144

9.4. Intervalos de Confiança 145

9.5. Testes Estatísticos 146

9.6. Análise de Variância 155

9.7. Análise de Regressão 158

Exercícios Resolvidos 166

10. Redução de Dimensionalidade 173

10.1. Análise de Componentes Principais 174

10.2. Decomposição em Valores Singulares 176

10.3. Análise Multidimensional 179

Exercícios Resolvidos 181

11. Clustering 187

11.1. Clustering Hierárquico 188

11.2. Clustering K-Means 192

Exercícios Resolvidos 194

12. Análise Preditiva e Aprendizagem Máquina: Conceitos Básicos 197

12.1. Introdução 198

12.2. Métricas de Erro 200

12.3. Método dos K-Vizinhos Mais Próximos 203

~12.4. Árvores 205

e 12.5. Modelos de Regressão para Análise Preditiva 208

Page 4: íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de Strings 2.8. Fatores 2.9. ... Exercícios Resolvidos 236 PARTE 111-Casos de Aplicação

VIII Análise e Exploração de Dados com R

12.6. Máquinas de Vetar de Suporte

12.7. Redes Neuronais Artificiais

12.8. Métodos Probabilísticos: Naive Bayes

Exercícios Resolvidos

210

212

213

214

13. Aprendizagem Máquina: Tópicos Complementares 221

13.1. Estimação do Erro com Validação Cruzada 222

13.2. Comparação de Modelos e Algoritmos 224

13.3. Otimização de Modelos 225

13.4. Sobreajustamento e Subajustamento: Complexidade dos Modelos 226

13.5. Seleção de Atributos 227

13.6. Conjuntos de Modelos 228

13.7. Package caret 230

Exercícios Resolvidos 236

PARTE 111- Casos de Aplicação 239

14. Reconhecimento de Atividades Humanas Usando Telemóveis 241

14.1. Descrição dos Dados

14.2. Pré-Processamento dos Dados

14.3. Análise Exploratória dos Dados

14.4. Análise Estatística Univariada

14.5. Análise de Regressão

14.6. Análise Estatística Multivariada

14.7. Análise Preditiva

242

243

247

252254

257

263

15. Análise da Qualidade de Vinhos

15.1. Descrição dos Dados

15.2. Pré-Processamento e Análise Exploratória dos Dados

15.3. Análise de Regressão

15.3.1. Modelo de Regressão

15.3.2. Avaliação do Modelo

15.3.3. Importância de Cada Variável

15.3.4. Potenciais Problemas

15.4. Comparação de Modelos de Aprendizagem Máquina

269

270

271

274

274

277

278

282

284

Page 5: íNDICE · Funções sobre Vetores Numéricos 2.6. Vetores Lógicos 2.7. Strings e Vetores de Strings 2.8. Fatores 2.9. ... Exercícios Resolvidos 236 PARTE 111-Casos de Aplicação

índice IX

16. Análise de Dados de Crédito Bancário

16.1. Descrição e Carregamento dos Dados

16.2. Análise Exploratória dos Dados

16.3. Análise Estatística dos Dados

16.4. Análise Agregada dos Dados

16.5. Aprendizagem Máquina

297

298

300

309311

318

17. Análise de Dados de Expressão Genética em Pacientes com Cancro 325

17 .1. Descrição dos Dados 326

17.2. Representação e Acesso aos Dados: O Projeto Bioconductor 327

17.3. Filtragem por Variabilidade 332

17.4. Identificação de Genes Diferencialmente Expressos 334

17.5. Clustering 338

17.6. Classificação de Amostras 340

Recursos e Conjuntos de Dados Adicionais 343

Livros 343

Repositórios de Dados e Coleções de Dados 345

Propostas Complementares de Análise de Dados 347

Ferramentas 348

Bibliografia 351

índice Remissivo 353