Relatório Final da disciplina de Probabilidades e...

148
Relatório Final da disciplina de Probabilidades e Estatística Economia Gestão Informática e Gestão Docentes: Paulo Infante (responsável) Gonçalo Jacinto Ano Lectivo 2005/2006

Transcript of Relatório Final da disciplina de Probabilidades e...

Relatório Final da disciplina de

Probabilidades e Estatística

Economia Gestão

Informática e Gestão

Docentes: Paulo Infante (responsável)

Gonçalo Jacinto

Ano Lectivo 2005/2006

Índice • Relatório Crítico de Leccionação • Relatório Crítico de Leccionação em inglês • Programa detalhado e informação da disciplina • Programa detalhado e informação da disciplina em

inglês • Programa da disciplina resumido • Programa da disciplina resumido em inglês • Sumários das aulas teóricas • Sumários das aulas práticas • Material de apoio às aulas teóricas • Material de apoio às aulas práticas • Provas de avaliação • Resultados de avaliação • Inquérito anónimo realizado aos alunos

Relatório Crítico de Leccionação

Probabilidades e Estatística

Economia, Gestão, Informática e Gestão

Ano Lectivo 2005/2006

Relatório Crítico de Leccionação

Este relatório será um relatório crítico sobre o ano lectivo de 2005/2006. Será

também um relatório de evolução da disciplina nos últimos 3 anos lectivos.

A disciplina de Probabilidades e Estatística é ministrada aos Cursos de

Licenciatura em Economia, Gestão (caso em que funciona também para os inscritos em

Estatística I) e Informática e Gestão. Trata-se de uma disciplina semestral, sendo

leccionada no 3º Semestre destes Cursos e que veio substituir as disciplinas semestrais

Estatística I e Estatística II ministradas antes da revisão curricular.

Neste ano lectivo todo o material de apoio foi melhorado. O programa aprovado

pelas Comissões de Curso foi inteiramente cumprido. Podemos concluir que os

objectivos inicialmente propostos foram amplamente atingidos.

Todo o material de apoio foi colocado à disposição dos alunos numa página

própria da disciplina na Internet. Para além de diversas informações também se

disponibilizavam nesta página os sumários das aulas. Além disso, pelo facto das aulas

serem leccionadas no Colégio do Espírito Santo e os gabinetes dos docentes se

localizarem no Colégio Luís António Verney, a existência da página na Internet

permitiu uma melhor acessibilidade por parte dos alunos ao material de apoio. Neste

semestre lectivo esta página teve mais de 17200 visitas, o que demonstra a importância

da informação aí disponibilizada. Recorde-se que no primeiro ano de criação do site se

registaram quase 3000 visitas e que no 2º ano se registaram mais de 5000, pelo que

podemos constatar um crescimento quase exponencial no número de acessos à página.

Esta é a primeira disciplina da área das Probabilidades e Estatística destes cursos e

tem apenas como suporte de base, em termos teóricos e metodológicos, alguns

conceitos de Estatística Descritiva e de Introdução às Probabilidades leccionados no

Ensino Secundário. Em alguns pontos foi possível fazer apenas uma revisão de

conhecimentos, mas noutros a matéria foi dada como se fosse a primeira vez. Tal

permitiu uma consolidação de conhecimentos em pontos que julgamos muito

importantes numa primeira fase da análise de dados.

No que concerne à sua carga horária semanal, esta disciplina tem 3 horas de aulas

teóricas e 3 horas de aulas práticas, correspondendo-lhe 6 ECTS. Como temos referido

em anos anteriores, esta carga horária parece-nos manifestamente insuficiente, tendo em

conta o extenso Programa (muito próximo da junção dos Programas de Estatística I e

Estatística II). Um maior número de horas permitiria também uma melhor exploração

das potencialidades de tratamento estatístico de algum pacote de software. Tal, torna

difícil colocar em prática a perspectiva que defendemos de que o Professor deve ensinar

a pensar e a aprender. Refira-se, com base em alguma experiência que temos do ensino

deste tipo de matérias, que esta é uma disciplina difícil para os alunos, os quais revelam

grandes dificuldades na compreensão de alguns conceitos. Tal é também explicado pela

sua fraca formação de base e falta de sentido de sentido crítico. Numa disciplina deste

tipo fica clara, e cada vez mais acentuada nos últimos anos, a deficiência de muitos

alunos em saber pensar.

Como referimos, o programa desta disciplina inclui também a utilização efectiva

de software estatístico optando-se pelo pacote SPSS, pois trata-se do único pacote

estatístico para o qual a Universidade de Évora dispõe de um número considerável de

licenças. A propósito, gostaríamos de salientar a necessidade de melhoramento das

condições físicas, quer ao nível do número de computadores quer ao nível das infra-

estruturas. Apesar de ter sido atribuída ao Departamento de Matemática uma sala

laboratorial, a mesma funciona em tempo parcial o que é manifestamente insuficiente

para compatibilizar os diversos horários das várias turmas. Torna-se, portanto, premente

criar as condições necessárias para se poder incluir a utilização efectiva de software

estatístico nestas aulas.

Nos dois anos lectivos anteriores (2003/04 e 2004/05) em que leccionámos a

disciplina de Probabilidades e Estatística, e que simultaneamente são os dois anos da

existência da mesma, sempre trabalhámos procurando atingir os objectivos da própria

disciplina e satisfazer os interesses das Comissões de Curso aos quais é leccionada. A

nossa experiência nesses dois anos permitiu concluir que a presença nas aulas é

fundamental para a boa compreensão das matérias e que o estudo contínuo é, nesta

disciplina, indispensável para a aprovação. Conforme relatado nos anteriores relatórios

críticos podemos verificar que no ano lectivo de 2003/04 nenhum aluno obteve

aprovação no regime de avaliação por exame final (isto para 60,3% de aprovações

relativas aos alunos avaliáveis), enquanto no ano lectivo de 2004/05 apenas 8 obtiveram

aprovação na avaliação por exame (isto para 48,6% de aprovações relativas aos alunos

avaliáveis). Em quaisquer destes dois anos praticamente todos os alunos que se

submeteram a todos os testes de avaliação contínua e que obtiveram aprovação à

disciplina estiveram presentes na esmagadora maioria das aulas. Consequentemente,

resolvemos implementar algumas medidas que impusessem uma autodisciplina aos

alunos e obrigasse, a quem optasse por entrar no regime de avaliação contínua, a

trabalhar diariamente e a comparecer na grande maioria das aulas. Do nosso ponto de

vista, avaliação contínua não significa apenas comparecer às frequências. Para se estar

em avaliação contínua e obter sucesso é necessário trabalhar diariamente e a presença

nas aulas (que não apenas física) é fundamental.

Assim, com base nos resultados e na experiência lectiva dos dois últimos anos e

com vista a atingir uma maior taxa de sucesso, identificaram-se as principais razões para

o insucesso escolar e introduziu-se um novo esquema de avaliação com vista a melhorar

o sucesso escolar. Esta iniciativa também surgiu numa tentativa de aproximar a

disciplina às ideias subjacentes no Processo de Bolonha, nomeadamente, num maior

trabalho realizado pelo aluno e dum maior acompanhamento da matéria leccionada, bem

como numa maior taxa de assistência às aulas.

Os alunos podiam optar por Avaliação Contínua ou por Avaliação por Exame

Final. No sistema de Avaliação Contínua foram realizadas três provas de avaliação,

sendo que a data da segunda prova de avaliação foi anunciada apenas uma semana antes

da sua realização. Apenas se impôs nota mínima na primeira frequência e na terceira

frequência, permitindo a recuperação de alunos que não estejam tão seguros na segunda

frequência pelo facto de ter matérias com um maior grau de dificuldade. Por outro lado,

exigiu-se a presença em 2/3 das aulas aos alunos neste regime (refira-se que nenhum

aluno reprovou à disciplina por não verificar este requisito e nem era essa a nossa

intenção). Tais medidas foram polémicas, mas mereceram a concordância quase

unânime dos alunos. Muitos alunos reconheceram (pessoalmente, por e-mail e em

observações registadas num inquérito de avaliação ao docente e à disciplina) que tais

medidas foram muito importantes para o seu sucesso. O Professor tem de motivar o

aluno, fazê-lo acreditar de que é capaz mesmo em condições muito adversas. Não deve

permitir que o aluno se sinta só. Tal foi fundamental para obter os bons resultados deste

ano lectivo.

Relativamente ao regime de Avaliação por Exame Final, este consistiu na

realização de um exame na época normal e dum exame em época de recurso.

Apesar de termos disponibilizado um horário para, de uma forma complementar e

menos formal, esclarecer dúvidas e aprofundar matérias, a verdade é que a grande

maioria dos alunos apareceram apenas nos 2 ou 3 dias que antecederam cada prova de

avaliação. Contudo, registámos um grande aumento do recurso ao e-mail para

esclarecimento de dúvidas o que facilitou o nosso contacto com os alunos mesmo fora

da data de realização das frequências e exames.

Geralmente, em cada semana foi leccionado um novo tópico, o que originou uma

elevada carga de trabalho exigida semanalmente aos alunos. Esse trabalho desenvolvido

pelos alunos fora das aulas revelou-se um aspecto muito importante e pensamos ter sido

uma das razões principais pela discrepância entre a taxa de aprovações verificada nos

dois sistemas de Avaliação à semelhança do que tinha acontecido nos dois anos

anteriores.

Devido a este novo sistema de avaliação, o número de alunos que assistiram às aulas

(teóricas e práticas) apenas registou uma quebra após a realização da primeira

frequência, sendo aproximadamente igual ao número de alunos que consideramos

avaliáveis. De notar que neste ano lectivo registámos uma assistência às aulas

substancialmente superior à dos anos anteriores. Conseguimos evitar algumas quebras

sazonais de assistência, que aconteciam em períodos de maior número de provas de

avaliação, e, em particular, uma quebra que acontecia imediatamente a seguir à segunda

frequência a qual foi muito prejudicial para vários alunos o ano passado. Pensamos que

tal é revelador de termos conseguido motivar os alunos para a necessidade de

assistência às aulas e termos incutido o interesse pela disciplina. Tal revela também a

empatia entre alunos e docentes. Num inquérito anónimo realizado aos alunos, mais de

90% dos alunos que responderam ao inquérito (n=100) avaliaram globalmente os

docentes com notas de Bom ou Muito Bom. Saliente-se que estes resultados foram

análogos aos obtidos nos dois anos anteriores, o que mostra que a opinião dos alunos

acerca da equipa docente não se alterou ao longo destes 3 anos.

Por outro lado, refira-se que o número médio de alunos nas aulas reforçou a

insuficiência das condições físicas para a sua realização (pelo menos das mais

concorridas), nomeadamente nalgumas salas de aula no Colégio Espírito Santo com

piores condições para actividades lectivas.

Relativamente às aulas práticas, as folhas de exercícios e as respectivas soluções

foram melhoradas através da introdução de novos exercícios, da correcção de pequenas

gralhas e da reordenação da listagem de exercícios. Procurou-se, a todo o instante,

incentivar o trabalho do aluno em casa. Houve a preocupação de adoptar exercícios

tendo em conta os contextos de actuação dos futuros licenciados e na tentativa de criar

nos alunos o incentivo e o gosto pela disciplina.

No desenrolar das aulas práticas procurou-se também corresponder às expectativas

do Processo de Bolonha. Procurámos, sempre que possível, quer com trabalhos

realizados em casa, quer com exercícios sugeridos na sala de aula, que fossem os alunos

a dinamizar as aulas práticas, apesar de alguma resistência inicial. Fomentou-se as

dúvidas carteira a carteira e a resolução do exercício individualmente pelo aluno.

Durante todo o semestre houve a preocupação de manter as turmas ao mesmo nível,

resolvendo-se os mesmos exercícios em cada aula, de forma a ter turmas homogéneas e

a que alguns alunos pudessem circular entre turmas diferentes por dificuldades de

horário.

Ainda em relação às aulas práticas, refira-se que os tópicos eram abordados muito

pouco tempo após a sua introdução nas aulas teóricas, permitindo não haver

praticamente desfasamento entre a parte teórica e a sua aplicação prática. Pensamos que

tal procedimento conduz a uma melhor compreensão das matérias. Esta é uma disciplina

em que faria sentido ter aulas teórico-práticas.

Antes de apresentarmos os resultados finais gostaríamos de salientar que mais de

75% dos alunos pontuaram com notas de Bom ou Muito Bom a correspondência entre

conhecimentos avaliados e matéria leccionada. Esta proporção manteve-se idêntica nos

3 anos lectivos, o que permite mostrar que para os alunos o grau de exigência se

manteve.

Relativamente aos resultados finais, se tivermos como referência o número de

inscritos na disciplina (n=247), a percentagem de aprovações foi igual a 31,4%. Caso

tenhamos como referência o número de alunos que compareceram à primeira frequência

(n=179), a percentagem de aprovações foi igual a 41,9%. Finalmente, tomando como

referência o número de alunos que compareceram a toda a avaliação contínua e/ou a

algum dos exames, o que nós designamos por alunos avaliáveis (n=99), a

percentagem de aprovações foi igual a 75,8%.

Em relação à percentagem de aprovações por curso, verificou-se 85,1% de

aprovações em Economia, 72,8% de aprovações em Gestão e 44,4% em Informática

de Gestão.

Como se pode facilmente concluir por observação dos quadros 1 e 2, a taxa de

aprovações foi muito superior neste ano lectivo. O sucesso assentou na metodologia de

ensino e no método de avaliação. No primeiro ano de leccionação desta disciplina

obtivemos 95% de aprovações em avaliação contínua (regime de 4 frequências), mas

nenhuma aprovação em exame. Neste ano lectivo obtivemos uma percentagem de

aprovações análoga em avaliação contínua (92%) e 27% de aprovações em exame.

Repare-se que neste ano lectivo se submeteram a avaliação contínua 72 alunos, mais 28

alunos que no ano lectivo 2003/04.

2003/04 2004/05 2005/06

% Aprovados/Inscritos 26,7 16,4 31,4

% Aprovados/1ª Freq. 31,0 21,6 41,9

% Aprovados/Avaliáveis 60,3 48,6 75,9

Quadro 1

% Aprovados/Avaliáveis

2003/04 2004/05 2005/06

Economia 58,5 48,3 85,1

Gestão 62,5 50,0 72,1

Inf Gestão - 40,0 44,4

Quadro 2

Cerca de metade dos alunos inscritos não frequentaram qualquer aula e há muitos

cerca de ¼ dos inscritos que nós classificamos de alunos “fantasma”, pois nunca

apareceram a qualquer aula nem a qualquer prova de avaliação. Pensamos que medidas

que visem terminar com esta situação, que é comum em muitas outras disciplinas, são

desejáveis e urgentes. Pensamos que ajudaria muito a resolver esta situação se os alunos

apenas se pudessem inscrever a um número limitado de disciplinas. Muitos alunos

inscritos em Probabilidades e Estatística têm disciplinas em atraso, estando

simultaneamente inscritos a 7 ou 8 disciplinas. Em alturas de sobrecarga de trabalho

verifica-se uma diminuição significativa da assiduidade às aulas e muitas vezes a não

comparência nas provas de avaliação. Ao considerarmos a presença nas aulas como um

critério de avaliação contínua conseguimos que os alunos verdadeiramente interessados

em obter aprovação à disciplina neste regime de avaliação não só se mantivessem

assiduamente nas aulas como também administrassem de uma outra forma os seus

esforços em outras disciplinas. Gostaríamos de salientar o aumento do número de

alunos avaliáveis em regime de avaliação contínua relativamente aos dois anos

anteriores (quadro 3).

2003/04 2004/05 2005/06

Inscritos 165 207 247

% Avaliáveis em Aval. Cont. 26,7 21,7 29,1

% Avaliáveis (Total) 44,2 34,8 40,1

Quadro 3

O método de avaliação e a metodologia de ensino implementados nesta disciplina

foram muito bem recebidos pelos alunos quer pela atitude demonstrada por estes, quer

pelas opiniões apresentadas nos inquéritos anónimos realizados. Os resultados obtidos

pelos alunos no regime de avaliação contínua permitem corroborar este ponto de vista

ao longo dos 3 anos.

No gráfico abaixo podemos observar as caixas de bigodes que permitem comparar

as notas obtidas em exame pelos alunos provenientes da avaliação contínua e pelos

restantes alunos. No quadro 4 apresentamos também os valores de algumas grandezas

estatísticas. Como se pode verificar a nota média é significativamente superior quando o

aluno se submete a exame tendo passado previamente por avaliação contínua. Numa

disciplina com a exigência desta é fundamental um estudo contínuo. Doutro modo

torna-se muito difícil estudar tudo em apenas alguns dias. Se considerarmos os alunos

de ambos os grupos como amostras representativas das respectivas populações de

alunos, então com uma confiança de 95%, podemos afirmar que a nota esperada de um

aluno que se submeta a exame tendo passado por todas as provas de avaliação contínua

é entre 2 a 7 valores superior à de um aluno que não tenha completado a avaliação

contínua (alunos que muitas vezes apenas fazem a primeira frequência ou transitam

directamente para exame).

Alunos que fizeram só Exame

Alunos que vieram daAvaliação Contínua

14121086420

Descriptive Statistics

6 10,0000 1,78885 8,00 12,00 8,0000 10,0000 12,0000

18 5,3333 4,00000 ,00 13,00 2,0000 4,5000 10,0000

Alunos que vieram daAvaliação ContínuaAlunos que fizeram sóExame

N MeanStd.

Deviation Minimum Maximum 25th 50th (Median) 75thPercentiles

Quadro 4

Pensamos que uma excelente coordenação entre os dois docentes é essencial para

uma troca sistemática de informações acerca das aulas, para a rápida resolução de

algumas questões que surjam durante o semestre e para o bom acompanhamento dos

alunos. No inquérito de avaliação do docente e disciplina mais de 80% dos alunos

pontua com notas de Bom e Muito Bom a coordenação entre os docentes e essa

percentagem manteve-se ao longo destes 3 anos. Este Relatório é também o reflexo

dessa excelente coordenação.

Relatório Crítico de Leccionação em inglês

Probability and Statistics Course

Economics, Management, Computer Science and Management

Academic Year 2005/2006

Critical Report

This is a critical report for the academic year 2005/2006. We also report on the

evolution of this discipline during the last three years.

Probability and Statistics is lectured to students from Economics, Management

and Computer Science and Management. This is a one-semester course lectured during

the 3rd semester of the undergraduate programs. It replaced the courses named Statistics

I and Statistics II which were lectured in previous years.

This academic year the complementary teaching material was improved and the

objectives were fulfilled as approved by the Program Boards.

Complementary teaching material was available to students in an internet site. The

site provided information related to the course, including lessons’ summaries. It also

facilitated coursework material and eased accessibility to readily available information

displayed at the professors office, located at the Verney College.

The site had more than 17200 visits this semester, which demonstrates its utility to

disseminate the information following almost an exponential growth since last year we

had 5000 visits, and the previous one (first year of existence of this internet page), we

had almost 3000 visits.

This is the first course of Probability and Statistics in these academic courses. The

students have only some concepts of Descriptive Statistics and Introduction to

Probability, lectured in Secondary School. A revision was possible in some topics but

the majority was lectured for them for the first time. This permits a consolidation of the

knowledge of some concepts which we think are very important at an initial stage of

data analysis.

Related to weekly workload, this course has 3 hours of theoretical lessons and 3

hours of practical lessons, corresponding to 6 ECTS. As we have being referring in the

last three years, this workload seems clearly insufficient if we take into account the

extensive Program (approximately the same of the two joint Programs of Statistics I and

Statistics II). More teaching load would allow to better explore the potentialities of

statistical treatment of some software package. With such as limited teaching load it is

difficult to put in practice our philosophy of teaching to think and to learn. According

to our experience teaching this course, students usually show a great difficulty in

understanding some concepts. This is partly due to theirs weak basic formation and the

lack of critical sense. There is a deficiency of many students in knowing how to think.

The program of this course includes the effective use of statistical software. We

opted to use SPSS because it is the only statistical package for which the University of

Évora had a large number of licences. We stress the need for improvement of physical

facilities, number of computers and the quality of the infrastructures. There is only a

part time computer lab attributed to Department of Mathematics to teach several classes.

It’s necessary to create conditions for the effective use of statistical software.

Since the academic year 2003/2004 (first year in which we lectured this course),

we aimed to achieve the objectives of the discipline and to satisfy the Program Boards’

suggestions. Based on our experience we found that attendance to the classes is

fundamental for a good comprehension of the several topics and that the continuous

study is essential for the student’s success in this discipline. As reported in previous

critical reports, in 2003/2004 no students approved the Final Exam (compared to 60,3%

success of students evaluated), and in 2004/2005 only 8 students passed the Final Exam

(compared to 48,6% success of students evaluated). In any of these two years,

practically all the students, who approved in continuous evaluation, attended almost all

the lessons. Therefore, this year we have implemented some measures to impose auto-

discipline for students who have chosen continuous evaluation, to work on a daily basis

and to attend to the majority of the lessons. From our perspective, continuous evaluation

doesn’t mean only to appear at the partial tests and to assist a few lessons. To succeed

it’s necessary to work hard every day and class participation is also fundamental.

Therefore, based on our last two year’s experience and with the objective of

success rate improvement, we identify the main reasons for the high failure rate and

introduced a new assessment method. This initiative is aimed to approach the

underlying ideas introduced by the Bologna Process, namely, a greater work carried out

by the student and more attendance to classes.

Students could choose between Continuous Evaluation and Final Exam

Evaluation. The regime of Continuous Evaluation consisted in 3 midterms, but for the

second one, they only know the date of its realization one week before. Besides that,

only for the first and third midterms there is a minimal grade for approval, which

permits the recuperation of some students that were not so secure in the second midterm

due to the fact that those topics were a little more difficult. We established a minimum

of attendance to 2/3 of the classes (note that none students failed on basis of this

requirement, since this was our intention). Those measures were a little polemic, but

almost all students accepted them. Several students recognized (in person, by e-mail and

in observations on the inquiry to the lecturers and to the discipline) that those measures

were very important for their success. The professor should motivate students, making

them believe in their capabilities to succeed even in very adverse conditions and

students shouldn’t feel alone. This was fundamental for the success this year.

Relatively to the Final Exam evaluation regime, there are two examinations, one

during the normal period and another one during the appeal period.

Despite the regular schedule for office hours to clarify subject matters, most

students only take advantage of this time only 2 or 3 days before the test. However, the

increasing use of email, in order to clarify some questions, facilitates our contact with

students not only right before evaluation dates.

Generally, each week a new topic was introduced and that originated a high

weekly workload demanded to the students. The work developed by the students

became a very important aspect and we think that it was one of the main reasons for the

discrepancy between the success rates verified in the two evaluation systems. The same

trend was verified in the last two years.

Based on this new evaluation system, there was a decrease in the number of

students attending classes only after the first midterm. The average assistance was

approximately equal to the number of students that were evaluated. Note that this

number was superior to the registered in the last two years. We also avoided some lack

of attendance during periods of more evaluations and in particular right after the second

midterm, which was very prejudicial for many students in last year.

We think that the interest for the course, the motivation for class attendance, and the

ease of communication (empathy) between students and teachers improved the success

rate. This can be verified through the results of an anonymous inquiry that we carried

out. The results of this inquiry show that more than 90% of the students, (n=100),

provided a global evaluation of Good or Very Good for the Professors. These results

were analogous to those obtained in the last two years, which reflects that the students’

opinion about the teachers didn’t change in these three years.

On the other hand, the mean number of students attending the lessons reinforced

the insufficient physical conditions of the classrooms, namely some rooms in Espírito

Santo College with bad conditions for teaching activities.

Relatively to the practical lessons, exercises and solutions from the previous year

were improved after correction of some minor mistakes and reorganization of the

exercises. We were looking to stimulate the student’s homework. In choosing the

exercises, we took into account the expectations of future graduated students and

examples to motivate students for the class.

During the practical lessons, we also tried to correspond to the expectations of the

Bologna Process. When ever possible, we use homework and classroom exercises to

motivate students’ participation in the classroom, but there was some initial resistance.

We also fomented individual work by the students. We tried to maintain the lessons for

the different group’s schedules at the same level, discussing the same exercises and

keeping some homogeneity.

Theoretical and practical lessons were lectured within a short span period so that

we have a closed coordination between the subject matters. We think that this procedure

leads to a better understanding of the topics. This is a discipline that theoretical -

practical lessons makes more sense.

Before presenting the final results, we would like to emphasize that more than

75% of the students have classified with Good or Very Good the relation between the

topics that were lectured and later evaluated. This proportion was the same in the last 3

years, which shows that the exigency was the same.

Relatively to final results, if we have the number of registered students (n=247) as

reference, the success rate was equal to 31,4%. If we use as a base the number of

students who had attended to the first midterm (n=179), the success rate was equal

41,9%. Finally, using the number of students that took all midterms or the final exam,

i.e. evaluated students (n=99), the success rate was equal 75,8%.

The success rate of evaluated students by course are; 85,1% for Economics,

72,8% for Management and 44,4% for Computer Science and Management.

The success rate during this academic year was much higher than in previews

years (Table 1 and 2). We attribute this increase to the new teaching methodology and

evaluation method adopted. During the first year we achieved a success rate of 95% for

continuous evaluation (with four midterms), but no student approved the Final Exam.

This year, the success rate for continuous evaluation was 92% and 27% for Final Exam.

Note that this year 72 students took continuous evaluation; this means 28 more students

than in 2003/2004.

2003/04 2004/05 2005/06

% Approved/Registered 26,7 16,4 31,4

% Approved/1st midterm 31,0 21,6 41,9

% Approved/Evaluated 60,3 48,6 75,9

Table 1

% Approved / Evaluated

2003-2004 2004-2005 2005-2006

Economics 58,5 48,3 85,1

Management 62,5 50,0 72,1

Computer Science and Management - 40,0 44,4

Table 2

Almost half of the registered students didn’t attend to any classes, and there were

about ¼ that we classified as “ghost” students, because they never showed up to any

evaluation, or to any lesson. We think there is an urgent need put an end to this

situation, which is common to other courses. We believe that it would help to resolve

this issue if there is a limit to the number of courses students could register. Several

students in Probability and Statistics have postponed other courses, and were

simultaneously registered in 7 or 8 courses. In periods of highest workload there is a

clear trend to miss classes and many times miss to examinations too. Considering the

attendance a criterion of the continuous evaluation, students are really interested in

attending classes and make better use of their efforts to get success in other courses. We

would like the point out the increase in the number of students in continuous evaluation

relatively to the last two years (table 3).

2003/04 2004/05 2005/06

Number of Registered Students 165 207 247

% Evaluated (Continuous Evaluation 26,7 21,7 29,1

% Evaluated (total) 44,2 34,8 40,1

Table 3

The method of evaluation and the teaching methodology implemented in this

course was well received by the students as can be shown by their attitude and opinions

the presented in the anonymous inquiries. Their performance in Continuous evaluation

represents evidence during the last three years

The box-plot below shows a comparison of the distribution of the notes obtained

by students who took the Final Exam after failure of continuous evaluation and other

students who took only the Final Examination. A summary statistics is presented in

table 4. We can see that the average note is superior for students in the first group. In a

course with this difficulty is fundamental continuous study.

If we consider both groups of students as representative sample from their

respective populations, then with a confidence interval of 95%, there is a difference of

about 2 to 7 points between the groups.

other students

students from the continuousevaluation

14121086420

Descriptive Statistics

6 10,0000 1,78885 8,00 12,00 8,0000 10,0000 12,0000

18 5,3333 4,00000 ,00 13,00 2,0000 4,5000 10,0000

Students fromcontinous evaluationOther students

N MeanStd.

Deviation Minimum Maximum 25th 50th (Median) 75thPercentiles

Table 4

We believe that an excellent coordination between the two professors is essential

to exchange information about the lessons and to resolve some of the problems that

appeared at student’s attendance among others. In the inquiry, more than 80% of the

students classified the coordination between the professors with Good and Very Good,

and this percentage was maintained throughout the years. This report is also result of

this excellent coordination.

Programa detalhado e informação da disciplina

• ECONOMIA (3º semestre), GESTÃO (3º semestre; funciona também para os

inscritos em Estatística I), INFORMÁTICA E GESTÃO (3º semestre).

• Carga horária: 3 T + 3 P

• 6 ECTS

• Docentes: Paulo Infante (Responsável) – [email protected]

Gonçalo Jacinto – [email protected]

• Todas as informações relativas à disciplina podem ser consultadas através do

link:

http://www.ensino.uevora.pt/pe_eg

OBJECTIVOS

Esta disciplina fornece um conjunto de conceitos e métodos que visam, por um lado,

permitir que os alunos sejam capazes, através da sua correcta aplicação, de interpretar e

analisar dados amostrais e, por outro lado, inferir conclusões tendo presente o carácter

probabilístico que lhes está associado.

Para além do domínio de noções fundamentais da teoria das Probabilidades,

incluindo as distribuições de probabilidade mais utilizadas, os alunos deverão ser

capazes de, consoante a natureza dos dados e a situação experimental, aplicar as

técnicas apropriadas à análise dos dados e interpretar os resultados de uma forma crítica.

Os alunos deverão ainda ser capazes de utilizar o software estatístico SPSS.

ATENDIMENTO AOS ALUNOS

• Paulo Infante

Quarta-feira: 14h-15h / Sexta-feira: 9h30-11h e 14h-15h

• Gonçalo Jacinto

Segunda-feira: 10h-13h / Quarta-feira: 10h-13h

� Os docentes apresentam disponibilidade total para responder a qualquer dúvida por

e-mail.

AVALIAÇÃO

Nesta disciplina, os alunos podem optar por dois tipos de avaliação:

1. Avaliação Contínua

a. No regime de avaliação contínua o aluno(a) terá obrigatoriamente de

assistir a um mínimo de dois terços das aulas teóricas e práticas.

b. O regime de avaliação contínua consiste na realização de 3 Frequências

com a duração de 2 horas cada.

c. A primeira Frequência a realizar em 29 de Outubro de 2005.

d. A segunda Frequência a realizar em data a anunciar três dias antes.

e. A terceira Frequência a realizar em 17 de Dezembro de 2005.

f. A matéria para avaliação relativa à primeira e terceira Frequências será

definida nas aulas teóricas uma semana antes da data prevista para a

realização das frequências. A matéria para avaliação na segunda

frequência será a matéria que já tenha sido leccionada nas aulas e ainda

não tenha sido avaliada.

g. Para a primeira e terceira Frequências o aluno(a) terá que ter uma nota

superior ou igual a 7 valores. Caso a nota seja inferior a 7 valores numa

destas duas frequências, o aluno(a) opta automaticamente pelo regime de

avaliação por Exame Final e caso a nota seja inferior a 7 valores na

terceira Frequência o aluno reprova à disciplina.

h. A nota final (NF) será o resultado da fórmula:

NF=0.35 N1 + 0.30 N2 + 0.35 N3

onde Ni é a nota na Frequência i, i=1, 3, com Ni, ≥7.

i. A apreciação do desempenho do aluno durante as aulas poderá, se daí

resultar benefício para o aluno, alterar a nota final.

j. Para obter aprovação à disciplina a nota final (NF) deverá ser igual ou

superior a 9.5 valores e ter assistido a pelo menos 2/3 das aulas teóricas e

2/3 das aulas práticas.

k. Caso o aluno(a) não realize a primeira ou terceira Frequências opta

automaticamente pelo regime de avaliação por Exame Final.

2. Exame Final

a. O regime de avaliação por Exame Final, em época normal, consiste na

realização de uma chamada com a duração de 3 horas.

b. A data dos exames em época normal e em época de recurso é, de acordo

com o Regulamento Escolar Interno, fixada pela comissão de horários.

c. A nota final será a da prova de exame e deverá ser igual ou superior a 9.5

valores para obter aprovação à disciplina.

d. A matéria para avaliação será toda aquela leccionada durante o semestre.

e. O Exame de Época Especial, com a duração de 3 horas, realizar-se-á em

20 de Setembro de 2006.

OBSERVAÇÕES:

� As Frequências e os Exames são provas sem consulta, podendo os alunos utilizar

um formulário de apoio e tabelas estatísticas fornecidos para o efeito.

� Os alunos podem utilizar máquina de calcular (pessoal e intransmissível).

PROGRAMA

Cap I – Introdução Cap. 2 – Estatística Descritiva

2.1. Distribuições de frequência

2.2. Medidas de Localização

2.3. Medidas de Dispersão

2.4. Medidas de Assimetria e Achatamento

2.5. Medidas de Concentração Cap. 3 – Introdução às Probabilidades e Probabilidades Condicionais

3.1. Conceitos de Probabilidade

3.2. Experiências aleatórias e acontecimentos

3.3. Definição axiomática de probabilidade

3.4. Probabilidade condicional e independência

3.5. Teorema da probabilidade total

3.6. Teorema de Bayes

Cap. 4 – Variáveis Aleatórias Unidimensionais e Bidimensionais

4.1. Variáveis aleatórias discretas

4.1.1. Função massa de probabilidade

4.1.2. Função distribuição

4.2. Variáveis aleatórias contínuas

4.2.1. Função densidade de probabilidade

4.2.2. Função distribuição

4.3. Esperança matemática

4.4. Variância e desvio padrão

4.5. Momentos

4.6. Distribuições conjuntas e marginais

4.7. Distribuições condicionais

4.8. Independência entre variáveis aleatórias

4.9. Covariância e coeficiente de correlação

Cap. 5 – Principais Distribuições de Probabilidade

5.1. Distribuição de Bernoulli

5.2. Distribuição Binomial

5.3. Distribuição de Poisson

5.4. Distribuição Geométrica

5.5. Distribuição Uniforme

5.6. Distribuição Exponencial

5.7. Distribuição Normal

5.8. Distribuição qui-quadrado, t-student e F de Fisher-Snedecor.

5.9. Lei dos grandes números

5.10. Teorema do limite central

Cap. 6 – Introdução à Amostragem

6.1. Noção de estatística

6.2. Distribuições amostrais

6.2.1. Distribuição amostral de médias

6.2.2. Distribuição amostral de variâncias e de razão de variâncias

6.2.3. Distribuição amostral de diferença de médias

6.2.4. Distribuição amostral de proporções

6.2.5. Distribuição amostral de diferença de proporções

Cap. 7 – Estimação Pontual e Intervalos de Confiança

7.1. Noção de estimador e de estimativa

7.2. Estimação pontual

7.2.1. Propriedades dos estimadores pontuais

7.2.2. Método dos momentos

7.2.3. Método da máxima verosimilhança

7.3. Estimação por intervalos

7.3.1. Intervalo de confiança da média

7.3.2. Intervalo de confiança da variância e da razão de variâncias

7.3.3. Intervalo de confiança da diferença de médias

7.3.4. Intervalo de confiança de proporções

7.3.5. Intervalo de confiança de diferença de proporções

Cap. 8 – Testes de Hipóteses

8.1. Hipótese nula e hipótese alternativa

8.2. Região de aceitação e de rejeição

8.3. Erros tipo I e tipo II

8.4. Nível de significância

8.5. Testes bilaterais e unilaterais

8.6. Potência de um teste

8.7. Testes de médias

8.8. Testes de variâncias e comparação de variâncias

8.9. Testes de diferença de médias

8.10. Testes de proporções

8.11. Testes de diferença de proporções

Cap. 9 – Testes Não Paramétricos

9.1. Testes de ajustamento e de independência

9.1.1. Teste do qui-quadrado como teste de ajustamento

9.1.2. Teste de Kolmogorov-Smirnov

9.1.3. Tabelas de contingência

9.2. Outros testes não paramétrico

Cap. 10 – Correlação e Regressão Linear e Não-Linear Simples

10.1. Noção de correlação e de regressão

10.2. Diagrama de dispersão

10.3. Regressão linear e não linear

10.4. Método dos mínimos quadrados

10.5. Coeficiente de determinação e coeficiente de correlação

10.6. Testes de hipóteses dos coeficientes de regressão

10.7. Predição de novas observações

OSERVAÇÕES:

� Para as aulas práticas haverá folhas de exercícios visando uma diversidade de

exemplos de aplicação, sendo os alunos aconselhados a resolver, para além

destes, outros exercícios de livros apresentados na Bibliografia.

� Parte do estudo da Estatística Descritiva e Introdução às Probabilidades foi

iniciado no decurso do Ensino Secundário, pelo que se pressupõe o

conhecimento destes conteúdos pelos alunos, sendo feita uma revisão de

conhecimentos em alguns dos pontos já anteriormente abordados no ensino

secundário.

BIBLIOGRAFIA

Murteira, B. J. F.; Silva Ribeiro, C.; Andrade e Silva, J.; Pimenta, C. (2001) –

Introdução à Estatística, McGraw-Hill.

OUTRA BIBLIOGRAFIA

Berenson, M. L.; Levine, D. M.; Krehbiel, T. C. (2001) – Basic Business Statistics:

Concepts and Applications, 5th Ed., Prentice Hall.

Carlson, W. L.; Thorne, B. (1996) – Applied Statistical Methods: For Business,

Economics, and the Social Sciences, Prentice Hall.

D’Hainault, L. (1990) – Conceitos e Métodos da Estatística, Uma Variável a uma

Dimensão, Vol I, Fundação Calouste Gulbenkian.

D’Hainault, L. (1992) – Conceitos e Métodos da Estatística, Duas ou Três Variáveis

a Duas ou Três Dimensões, Vol II, Fundação Calouste Gulbenkian.

Galvão de Mello, F. (2000) – Probabilidades e Estatística, Conceitos e Métodos

Fundamentais, Vol I, 2ª Ed., Escolar Editora.

Galvão de Mello, F. (1997) – Probabilidades e Estatística, Conceitos e Métodos

Fundamentais, Vol II, Escolar Editora.

Guimarães, R.C.; Cabral, J. A. S. (1998) – Estatística, 2º Ed., McGraw-Hill.

Hines, W. W.; Montgomery, D. C. (1990) – Probability and Statistics in

Engineering and Management Science, 3rd Ed., John Wiley.

Maroco, J. (2003) – Análise Estatística - Com Utilização do SPSS, Edições Sílabo.

Martins, M. E. G. (2000) – Introdução às Probabilidades e à Estatística, SPE.

Mendenhall, W.; Scheaffer, R. L.; Wackerly, D. D. (2001) – Mathematical Statistics

with Applications, 6th Ed., Duxbury Press.

Mood, A. M.; Graybill, F. A.; Boes, D. C. (1974) – Introduction to the Theory of

Statistics, 3rd Ed. McGraw-Hill International Editions.

Murteira, B. (1990) – Probabilidades e Estatística, Vol I e II, 2ª Ed., McGraw-Hill.

Newbold, P.; Carlson, W. L.; Thorne, B. (2002) – Statistics for Business and

Economics, Pearson Higher Education.

Pestana, D. D.; Velosa, S. F. (2002) – Introdução à Probabilidade e à Estatística,

Fundação Calouste Gulbenkian.

Pereira, A. (2003) – SPSS - Guia Prático de Utilzação, 4ª Ed., Edições Sílabo.

Pinto, J. C. C.; Curto, J. J. D. (2000) – Estatística para Economia e Gestão, Edições

Sílabo.

Ross, S. M. (2000) – Introduction to Probability and Statistics for Engineers and

Scientists, Academic Press.

Programa detalhado e informação da disciplina em Inglês

• ECONOMICS (3rd semester), MANAGEMENT (3rd semester; lecture to students

register in Statistics I), COMPUTER SCIENCE (3rd semester).

• Workload: 3 T + 3 P

• 6 ECTS

• Professors: Paulo Infante (Responsable) – [email protected]

Gonçalo Jacinto – [email protected]

• All teaching material is available to students in an internet site

http://www.ensino.uevora.pt/pe_eg

AIMS OF THE COURSE

This course provides concepts and methods of probability theory and statistical

inference that allows students be able to interpret and analyse sampling data and to get

some conclusions having into account the various levels of uncertainly presented.

Moreover the Theory of Probability fundamental concepts, including the most used

probability distributions, students should be able to select and apply statistical methods

and models appropriately and to interpret results in a critical way. Finally, it is intended

to provide some guidance for students to use correctly the statistical software SPSS.

STUDENT SUPPORT AND GUIDANCE

• Paulo Infante

Wednesday: 14h-15h / Friday: 9h30-11h e 14h-15h

• Gonçalo Jacinto

Monday: 10h-13h / Wednesday: 10h-13h

� Teachers present total availability to answer to any question by mail.

EVALUATION METHODS

In this course students can choose continuous evaluation and final exam evaluation:

1. Continuous evaluation

a. Students must attend to 2/3 of total theoretical and practical lessons.

b. The regimen of continuous evaluation consists in 3 midterms each one

with two hours.

c. The evaluation topics for the first and third midterms will be defined in

the lecture classes one week before the date foreseen to accomplish the

midterm.

d. In the firs and third midterms the student must have a score greater or

equal to 7 values. Case of score is less then 7 values in the first

frequency, students automatically choose final exam evaluation and case

of score is less then 7 values in the third midterm students reprove.

e. The final score (FS) will be the result of the formula:

FS=0.35 N1 + 0.30 N2 + 0.35 N3

where Ni is the score in midterm i, i=1, 2, 3, with N1>7 and N3>7.

f. Student’s performance during the lessons can modify the final score, if it

is in student’s benefit.

g. To get approved to the course the final score (FS) must be greater or

equal to 9.5 values.

h. Case students don’t attend to the first or to the third midterms,

automatically they opt by final exam evaluation.

2. Final Exam

a. In the evaluation regime by Final Exam, at normal time, students must

attend to one exam with three hours duration.

b. The final score will be the one of the exam proof and the student must

have a score greater or equal to 9.5 to get approved to the course.

c. The evaluation topics will be that whole lectured during the semester.

d. The Appeal Exam and the Exam at Special Time will have the duration

of 3 hours.

OBSERVATIONS:

- The midterms and the Final Exams are tests without consultation. The students can use

a support form and statistical tables supplied by the professors.

- The students should use a personal calculator.

PROGRAM CONTENTS

Cap I-Introduction Cap. 2-Descriptive statistics

2.1. Frequency tables

2.2. Measures of location

2.3. Measures of Dispersion

2.4. Measures of skewness and Flattening

2.5. Measures of Concentration

Cap. 3- Introduction to the Probabilities and Conditional Probabilities

3.1. Concepts of Probability

3.2. Random experiences and events

3.3. Axiomatic definition of probability

3.4. Conditional probability and independence

3.5. Theorem of the total probability

3.6. Bayes theorem

Cap. 4-One-dimensional and bidimensional random variables

4.1. Discreet random variables

4.1.1. Probability mass function

4.1.2. Distribution function

4.2. Continuous random variables

4.2.1. Probability density function

4.2.2. Distribution function

4.3. Expectation of a random variable

4.4. Variance and standard deviation

4.5. Moments

4.6. Joint and marginal probability distributions

4.7. Conditional distributions

4.8. Independence

4.9. Covariance and correlation coefficient

Cap. 5- Distributions of Probability

5.1. Bernoulli distribution

5.2. Binomial distribution

5.3. Geometric distribution

5.3. Poisson distribution

5.4. Uniform distribution

5.5. Exponential distribution

5.6. Normal distribution

5.7. Qui-square, t-student and F of Fisher-Snedecor distributions

5.9. The Central Limit Theorem

Cap. 6- Introduction to Sampling

6.1. Sampling methods

6.2. Statistics notion

6.3. Sampling distributions

6.3.1. Distribution of the sample mean

6.3.2. Distribution of the sample variance and of the ratio of variances

6.3.3. Sampling distribution of means difference

6.3.4. Distribution of the sample proportion

6.3.5. Sampling distribution of difference of proportions

Cap. 7-Point estimate and confidence intervals

7.1. Estimator and estimate

7.2. Point estimate

7.2.1. Properties of the point estimators

7.2.2. Method of moments

7.2.3. Method of maximum likelihood

7.3. Confidence interval estimation

7.3.1. Confidence intervals on the mean

7.3.2. Confidence intervals on the variance and on the ratio of variances

7.3.3. Confidence intervals on the difference in two means

7.3.4. Confidence intervals on a proportion

7.3.5. Confidence intervals on the difference in two proportions

Cap. 8- Tests of Hypotheses

8.1. Null hypothesis and alternative hypothesis

8.2. Acceptance and rejection regions

8.3. Type I and type II errors

8.4. Significance level

8.5. Bilateral and unilateral tests

8.6. Power of a test

8.7. Tests of Hypotheses tests on the mean

8.8. Tests of Hypotheses on the variance and for the equality of two variances

8.9. Tests of Hypotheses on the difference of two means

8.10. Tests of Hypotheses on a proportion

8.11. Tests of Hypotheses on two proportions

Cap. 9- Non-Parametric tests

9.1. Independence and Goodness of fit tests

9.1.1. Test of the qui-square as goodness of fit test

9.1.2. Test of Kolmogorov-Smirnov

9.1.3. Contingency tables: independence tests and homogeneity tests

9.2. Other non-parametric tests

Cap. 10- Correlation and Linear and No Linear Regression

10.1. Notion of correlation and regression

10.2. Dispersion diagram

10.3. Linear regression and non linear regression

10.4. Least squares method

10.5. Coefficient of determination and coefficient of correlation

10.6. Tests of hypotheses on the regression coefficients

10.7. Prediction of new observations

OSERVATIONS:

- The program of this course includes the use of the statistical software SPSS.

- For practical lessons we took exercises looking for a diversity of application examples,

being the students advised to solve other exercises looking to books presented in the

Bibliography.

- The students have some concepts of Descriptive Statistics and Introduction to

Probability, lectured in Secondary School. Because of it we presupposed the knowledge

of these contents. Only a revision will be possible in some topics.

REFERENCES

Murteira, B. J. F.; Silva Ribeiro, C.; Andrade e Silva, J.; Pimenta, C. (2001) –

Introdução à Estatística, McGraw-Hill.

OTHER REFERENCES

Berenson, M. L.; Levine, D. M.; Krehbiel, T. C. (2001) – Basic Business Statistics:

Concepts and Applications, 5th Ed., Prentice Hall.

Carlson, W. L.; Thorne, B. (1996) – Applied Statistical Methods: For Business,

Economics, and the Social Sciences, Prentice Hall.

D’Hainault, L. (1990) – Conceitos e Métodos da Estatística, Uma Variável a uma

Dimensão, Vol I, Fundação Calouste Gulbenkian.

D’Hainault, L. (1992) – Conceitos e Métodos da Estatística, Duas ou Três Variáveis

a Duas ou Três Dimensões, Vol II, Fundação Calouste Gulbenkian.

Galvão de Mello, F. (2000) – Probabilidades e Estatística, Conceitos e Métodos

Fundamentais, Vol I, 2ª Ed., Escolar Editora.

Galvão de Mello, F. (1997) – Probabilidades e Estatística, Conceitos e Métodos

Fundamentais, Vol II, Escolar Editora.

Guimarães, R.C.; Cabral, J. A. S. (1998) – Estatística, 2º Ed., McGraw-Hill.

Hines, W. W.; Montgomery, D. C. (1990) – Probability and Statistics in

Engineering and Management Science, 3rd Ed., John Wiley.

Maroco, J. (2003) – Análise Estatística - Com Utilização do SPSS, Edições Sílabo.

Martins, M. E. G. (2000) – Introdução às Probabilidades e à Estatística, SPE.

Mendenhall, W.; Scheaffer, R. L.; Wackerly, D. D. (2001) – Mathematical Statistics

with Applications, 6th Ed., Duxbury Press.

Mood, A. M.; Graybill, F. A.; Boes, D. C. (1974) – Introduction to the Theory of

Statistics, 3rd Ed. McGraw-Hill International Editions.

Murteira, B. (1990) – Probabilidades e Estatística, Vol I e II, 2ª Ed., McGraw-Hill.

Newbold, P.; Carlson, W. L.; Thorne, B. (2002) – Statistics for Business and

Economics, Pearson Higher Education.

Pestana, D. D.; Velosa, S. F. (2002) – Introdução à Probabilidade e à Estatística,

Fundação Calouste Gulbenkian.

Pereira, A. (2003) – SPSS - Guia Prático de Utilzação, 4ª Ed., Edições Sílabo.

Pinto, J. C. C.; Curto, J. J. D. (2000) – Estatística para Economia e Gestão, Edições

Sílabo.

Ross, S. M. (2000) – Introduction to Probability and Statistics for Engineers and

Scientists, Academic Press.

Sumários

Sumários das aulas teóricas Lição Nº 1 – 16/09/05

Apresentação genérica do programa e da Bibliografia. Considerações gerais sobre o

modo de funcionamento das aulas. Definição do método de avaliação da disciplina.

Marcação das datas dos testes e do horário de atendimento dos alunos. Considerações

genéricas sobre as Probabilidades e a Estatística.

Lição Nº 2 – 22/09/5 e 23/09/05

Conceito de população e de amostra. Dados Estatísticos. Variáveis discretas e

contínuas. Estatística Descritiva. Agrupamento dos dados e formação de classes. Noção

de frequência absoluta, frequência relativa e de frequências acumuladas. Tábuas de

distribuição de frequências. Exemplos de aplicação. Histograma e polígono de

frequências. Medidas de localização: média, moda e mediana. Quantil de ordem p:

quartis, decis e percentis. Exemplo de aplicação. Medidas de dispersão: noção de

dispersão, amplitude, amplitude inter-quartis, variância e desvio padrão. Noção de

dispersão absoluta e de dispersão relativa: coeficiente de variação

Lição Nº 3 – 24/09/05

Medidas de Assimetria: noção de assimetria; comparação entre media, mediana e moda;

grau de assimetria de Pearson; coeficiente de assimetria de Bowley. Momentos ordinais

e momento centrais. Coeficiente de assimetria com base nos momentos. Medidas de

achatamento: noção de achatamento, coeficiente de achatamento com base nos

momentos, coeficiente percentil de curtose. Barreiras Internas e Barreiras Externas.

Noção de outlier. Diagrama de Caixa-e-bigodes. Exemplos de aplicação. Medidas de

Concentração. Exemplo de aplicação.

Lição Nº 4 – 6/10/05 e 7/10/05

Introdução às Probabilidades e Probabilidades Condicionais. Noção de experiência

aleatória, espaço-amostra, acontecimento elementar e acontecimento. Espaço de

acontecimentos e espaço de probabilidades. Definição axiomática de probabilidade.

Propriedades. Conceito Laplaciano, frequencista e subjectivo de Probabilidades.

Exemplos. Probabilidade condicional. Fórmula das probabilidades compostas.

Exemplos de aplicação.

Lição Nº 5 – 12/10/05 e 13/10/05

Teorema da Probabilidade Total. Exemplo de aplicação. Teorema de Bayes. Exemplos

de aplicação. Independência de acontecimentos. Exemplo de aplicação. Conceito de

variável aleatória. Variáveis aleatórias discretas: função massa de probabilidade e

função distribuição. Exemplo de aplicação.

Lição Nº 6 – 14/10/05

Propriedades da função distribuição. Conceito de esperança matemática de uma variável

aleatória. Propriedades da esperança matemática. Exemplo de aplicação. Mediana e

moda. Conceito de variância de uma variável aleatória. Propriedades da variância.

Desvio padrão. Coeficiente de variação. Momentos. Coeficiente de assimetria e de

achatamento. Distribuição de Bernoulli. Exemplos de aplicação. Distribuição Binomial.

Exemplos de aplicação. Esperança matemática, variância e desvio padrão de uma

variável aleatória com distribuição Binomial. Exemplos de aplicação da distribuição

Binomial. Distribuição Geométrica. Exemplo de aplicação. Esperança matemática,

variância e desvio padrão de uma variável aleatória com distribuição Geométrica.

Lição Nº 7 – 19/10/05 e 20/10/05

Distribuição de Poisson. Processo de Poisson. Esperança matemática, variância e desvio

padrão de uma variável aleatória com distribuição de Poisson. Aproximação da

distribuição Binomial pela distribuição de Poisson. Exemplos de aplicação. Variáveis

aleatórias contínuas: função densidade de probabilidade, função distribuição, esperança

matemática e variância. Exemplos. Distribuição Uniforme. Esperança matemática de

uma variável aleatória com distribuição uniforme.

Lição Nº 8 – 21/10/05

Exemplos de aplicação da distribuição Uniforme. Distribuição exponencial. Esperança

matemática, variância e desvio padrão de uma variável aleatória com distribuição

exponencial. Falta de memória da distribuição exponencial. Exemplos de aplicação.

Lição Nº 9 – 26/10/05 e 27/10/05 Distribuição Normal. Variável aleatória normal reduzida. Leitura e utilização da tabela

da distribuição normal. Quantis da distribuição normal. Exemplos de aplicação.

Lição Nº 10 – 28/10/05 Algumas considerações gerais sobre diferentes pontos da matéria dada. Dúvidas para o

teste.

Lição Nº 11 – 02/11/05 e 03/11/2005 Combinação linear de variáveis normais independentes. Soma de variáveis aleatórias

normais independentes. Teorema do Limite Central. Aproximação da Binomial pela

Normal. Aproximação da Poisson pela Normal. Exemplo de aplicação. Distribuição

Qui-quadrado, distribuição t-student e distribuição F. Quantis de probabilidade.

Conceito de variável aleatória bidimensional. Exemplos. Variáveis aleatórias

bidimensionais discretas: função massa de probabilidade conjunta e função distribuição.

Variáveis aleatórias bidimensionais contínuas: função densidade de probabilidade

conjunta e função distribuição. Distribuições marginais. Independência entre variáveis

aleatórias. Conceito de covariância. Propriedades. Coeficiente de correlação linear.

Lição Nº 12 – 04/11/2005 Introdução à Amostragem. Noção de estatística. Estimação pontual. Noção de estimador

e de estimativa. Exemplos. Propriedades dos Estimadores Pontuais: não enviesamento,

eficiência e consistência. Exemplos de aplicação. Erro quadrático médio. Método dos

momentos. Exemplo de aplicação.

Lição Nº 13 – 9/11/2005 e 10/11/2005 Método da máxima verosimilhança. Exemplos de aplicação. Propriedade da Invariância.

Lição Nº 14 – 11/11/05

Distribuição amostral de médias. Intervalo de confiança para a média quando o desvio

padrão é conhecido. Intervalo de confiança para a média quando o desvio padrão não é

conhecido. Conceito de erro padrão da estimativa. Exemplos de aplicação. Distribuição

amostral de variâncias. Intervalo de confiança para a variância. Exemplo de aplicação.

Lição Nº 15 – 16/11/05 e 17/11/05

Distribuição amostral de proporções. Intervalo de confiança para a proporção. Exemplos

de aplicação. Introdução aos testes de hipóteses: hipótese nula e hipótese alternativa;

erro de 1ª espécie e erro de 2ª espécie; teste unilateral e teste bilateral. Nível de

significância e região critica. Testes de hipóteses para a média quando o desvio padrão é

conhecido. Valor de prova. Exemplos de aplicação.

Lição Nº 16 – 18/11/05

Dualidade entre testes de hipóteses e intervalos de confiança. Exemplo de aplicação.

Obtenção do tamanho da amostra de modo a limitar o erro de 2ª espécie mantendo-se o

erro de 1ª espécie. Testes de hipóteses para a média quando o desvio padrão é

desconhecido. Exemplo de aplicação.

Lição Nº 17 – 23/11/05 e 24/11/05 Testes de hipóteses para a variância. Exemplo de aplicação. Testes de hipóteses para a

proporção. Exemplo de aplicação. Distribuição amostral de diferença de médias.

Intervalo de confiança para a diferença de médias com desvios padrões conhecidos.

Intervalo de confiança para diferença de médias com desvios padrões desconhecidos,

mas iguais. Exemplo de aplicação.

Lição Nº 18 – 25/11/05 Testes de hipóteses para a diferença de médias. Exemplos de aplicação. Distribuição

amostral de razão de variâncias. Intervalo de confiança para a razão de variâncias.

Exemplo de aplicação. Testes para a comparação de variâncias. Exemplo de aplicação.

Algumas considerações críticas acerca da matéria dada.

Lição Nº 19 – 30/11/05 e 2/12/2005 Distribuição amostral de diferença de proporções. Intervalo de confiança para a

diferença de proporções. Exemplo de aplicação. Noção de correlação e de regressão.

Diagrama de dispersão. Exemplos. Modelo de regressão linear simples. Método dos

mínimos quadrados. Interpretação dos parâmetros de regressão. Coeficiente de

determinação e coeficiente de correlação. Intervalos de confiança e testes de hipóteses

para os parâmetros da regressão. Predição de novas observações: estimação pontual e

estimação intervalar. Exemplo de aplicação com interpretação de outputs do SPSS.

Lição Nº 20 – 2/12/05 e 5/12/2005 Continuação da aula anterior. Alguns comentários sobre o modelo de regressão linear.

Análise de resíduos. Exemplos de aplicação. Regressão não-linear simples. Exemplos.

Teste de Kolmogorov-Smirnov. Exemplo de aplicação.

Lição Nº 21 – 7/12/05 e 9/12/2005 Testes de hipóteses para o coeficiente de correlação linear. Exemplos. Testes não

paramétricos: importância e aplicação. Teste do qui-quadrado como teste de

ajustamento. Exemplos de aplicação. Tabelas de contingência: teste do qui-quadrado de

Independência. Exemplo de aplicação.

Lição Nº 22 – 14/12/05 e 15/12/2005 Correcção de Yates. Teste de Wilcoxon. Exemplos de aplicação. Breve referência ao

teste do sinal. Teste de Mann-Whitney. Exemplo de aplicação.

Lição Nº 23 – 16/12/05 Algumas considerações sobre matéria dada. Esclarecimento de dúvidas para a terceira

frequência.

Sumários das aulas práticas

Lição Nº 1 – 03/10/05 e 04/10/05 Apresentação genérica da forma e conteúdo das aulas práticas. Considerações gerais

sobre o modo de funcionamento das aulas. Marcação do horário de atendimento aos

alunos. Estatística Descritiva: variáveis discretas. Construção de tábuas de frequências.

Representações gráficas: gráficos de barras. Cálculo de medidas de localização: média,

moda, mediana e quantis. Cálculo de medidas de dispersão: variância e desvio padrão.

Cálculo de medidas de assimetria: comparação entre média, moda e mediana e grau de

assimetria de Pearson. Cálculo de medidas de achatamento: coeficiente percentil de

curtose.

Lição Nº 2 – 10/10/05 e 11/10/05 Gráfico de Caixa-e-bigodes Barreiras Internas e Barreiras Externas. Noção de outlier..

Medidas de concentração: recta de igual distribuição, curva de Lorentz, área de

concentração e índice de Gini.

Estatística Descritiva: variáveis contínuas. Construção de classes. Representações

gráficas: histograma e polígono de frequências. Cálculo de medidas de localização:

média, moda, mediana e quantis. Cálculo de medidas de dispersão: variância e desvio

padrão. Cálculo de medidas de assimetria: comparação entre média, moda e mediana e

grau de assimetria de Pearson. Cálculo de medidas de achatamento: coeficiente percentil

de curtose. Determinação de percentis.

Lição Nº 3 – 11/10/05 e 12/10/05 Probabilidades. Experiência aleatória, espaço de resultados e acontecimentos.

Axiomática da probabilidade. Probabilidade condicional. Independência entre

acontecimentos.

Lição Nº 4 – 17/10/05 e 18/10/05 Teorema da probabilidade total e Teorema de Bayes.

Variáveis aleatórias discretas. Função densidade e função distribuição. Cálculo de

probabilidades.

Lição Nº 5 – 18/10/05 e 19/10/05 Variáveis aleatórias discretas. Cálculo do valor esperado e da variância. Distribuições

de probabilidade discretas. Distribuição Binomial e distribuição geométrica.

Propriedades mais importantes das distribuições.

Lição Nº 6 – 24/10/05 e 25/10/05

Distribuição de Poisson. Variáveis aleatórias contínuas. Função densidade e função

distribuição. Valor esperado e variância. Cálculo de probabilidades.

Distribuição Uniforme.

Lição Nº 7 – 25/10/05 e 26/10/05 Continuação da aula anterior. Distribuição Exponencial. Relação entre a distribuição de

Poisson e a Exponencial. Propriedades da distribuição Exponencial e cálculo de

probabilidades.

Lição Nº 8 – 31/10/05 e 02/11/05

Distribuição Normal. Transformação na distribuição normal reduzida. Utilização de

tabelas de probabilidades. Propriedades da distribuição Normal.

Aproximação da distribuição Binomial e Poisson pela distribuição Normal.

Lição Nº 9 – 07/11/05 e 08/11/05 Variáveis aleatórias bidimensionais discretas. Funções de probabilidade marginais.

Covariância e coeficiente de correlação.

Distribuições de probabilidade t-Student, Qui-Quadrado e F-Snedcor.

Lição Nº 10 – 08/11/05 e 09/11/05

Distribuições amostrais. Distribuição amostral da média, distribuição amostral da média

utilizando o Teorema do Limite Central.

Estimação Pontual. Propriedades dos estimadores: enviesamento, eficiência e

consistência.

Lição Nº 11 – 14/11/05 e 15/11/05 Continuação da aula anterior. Método de estimação dos momentos e método da máxima

verosimilhança.

Lição Nº 12 – 15/11/05 e 16/11/05

Intervalos de confiança para a média, com variância conhecida e desconhecida.

Intervalos de confiança para a média em grandes amostras. Intervalos de confiança para

variância e para a proporção.

Lição Nº 13 – 21/11/05 e 22/11/05 Testes de hipóteses para a média, com variância conhecida. Teste de hipóteses para a

média com variância desconhecida: grandes e pequenas amostram. Cálculo do valor de

prova. Cálculo dos erros de 1ª espécie e de 2ª espécie. Potência do teste.

Lição Nº 14 – 22/11/05 e 23/11/05

Continuação da aula anterior. Teste de hipóteses para a variância. Teste de hipóteses

para a proporção.

Lição Nº 15 – 28/11/05 e 29/11/05 Distribuição amostral da diferença de médias. Intervalos de confiança para a diferença

de médias, com as variâncias desconhecidas e variâncias desconhecidas. Intervalos de

confiança para a razão de variâncias e para a diferença de proporções.

Lição Nº 16 – 29/11/05 e 20/11/05

Teste de hipóteses para a diferença de médias. Teste de hipóteses para a razão de

variâncias e para a diferença de proporções.

Dualidade entre testes de hipóteses e intervalos de confiança. Cálculo do valor de prova.

Lição Nº 17 – 05/12/05 e 06/12/05 Regressão linear e Regressão não linear. Estimação de curvas de regressão. Construção

de testes de hipóteses e intervalos de confiança para os parâmetros da regressão.

Intervalo de predição.

Lição Nº 18 – 06/12/05 e 07/12/05

Aula de laboratório. Utilização do software SPSS em regressão linear simples.

Resolução de problemas com recurso ao SPSS. Modelo de regressão e método de

mínimos quadrados. Coeficiente de correlação e determinação. Testes de hipóteses e

intervalos de confiança para os parâmetros da regressão. Predição de novas

observações: estimação pontual e estimação intervalar.

Lição Nº 19 – 12/12/05 e 13/12/05 Testes não paramétricos. Testes de bondade do ajustamento: teste do qui-quadrado e

teste de Kolmogorov-Smirnov. Tabela de contingência: teste de qui-quadrado de

independência.

Lição Nº 20 – 13/12/05 e 14/12/05

Aula de laboratório. Utilização do software SPSS em testes não paramétricos.

Resolução de problemas com recurso ao SPSS. Teste de Kolmogorov-Smirnov e de qui-

quadrado. Teste de Mann-Whitney e de Wilcoxon.

Material de apoio às aulas teóricas

Material de apoio às aulas práticas

1. Considere os resultados finais, numa determinada disciplina, obtidos por 20

estudantes de uma dada Universidade:

9 14 12 8 14 12 16 16 8 14

11 12 14 11 11 18 14 18 15 15

a) Determine as frequências absolutas e relativas (simples e acumuladas).

b) Represente graficamente as frequências absolutas e relativas.

c) Calcule a média, a moda e a mediana. Comente.

d) Determine os quartis e interprete os valores obtidos.

e) Calcule a variância e o desvio padrão.

f) Calcule os coeficientes de dispersão e de variação.

g) Calcule o grau de assimetria de Pearson. Que conclui sobre a assimetria da

distribuição?

h) Calcule um coeficiente de curtose. Que conclui sobre o achatamento da

distribuição?

i) Refaça as alíneas anteriores recorrendo ao SPSS.

2. Admita que se realizou um inquérito a um grupo de compradores de 30 carros novos

para determinar quantas reparações ou substituições de peças foram feitas durante o

primeiro ano de utilização dos carros, tendo-se obtido os seguintes resultados:

1 4 1 2 2 3 3 2 1 2

3 2 3 1 0 1 2 7 4 3

5 1 2 4 2 1 3 1 0 1

a) Apresente os dados numa tabela de distribuição de frequências.

b) Calcule e interprete a média, a mediana, a moda e o desvio-padrão.

c) Determine a função de distribuição empírica e represente-a graficamente.

d) Determine os quartis da distribuição e diga qual o seu significado.

e) Represente os dados numa caixa-de-bigodes e interprete.

f) Estude a distribuição quanto à assimetria e ao achatamento.

g) Refaça as alíneas anteriores recorrendo ao SPSS.

3. Considere a seguinte distribuição de frequências, correspondente a áreas (centenas

de metros quadrados) de empresas de um parque industrial:

Áreas n.º de empresas [5, 15) 40 [15, 25) 80 [25, 35) 115 [35, 45) 105 [45, 55) 65 [55, 65) 45 [65, 75) 35 [75, 85) 30

a) Esboce o histograma e o polígono de frequências absolutas.

b) Calcule o desvio padrão.

c) Calcule a mediana, o terceiro quartil e o quinto percentil. Interprete os valores

obtidos.

d) Obtenha outras medidas de dispersão.

e) Calcule o terceiro e o quarto momentos centrais.

f) Comente as proposições:

i) “A distribuição é assimétrica positiva.”.

ii) “A distribuição é platicúrtica.”.

g) Esboce a curva de Lorenz e interprete um ponto qualquer da curva.

h) Calcule o índice de Gini. Comente.

4. Admita que um grupo de 50 analistas financeiros efectuou uma previsão do ganho

por acção, em euros, de uma empresa no próximo ano, sendo os resultados

apresentados em 7 classes de igual amplitude, na tabela seguinte:

Classes

Pontos médios (x’ i)

Número de analistas

Ni

Fi

5 4 0,08

8

[8, 10)

[10, 12) 8 27

13 37 0,74

17 5 1,00

a) Complete a tabela.

b) Calcule a mediana e interprete o seu valor.

c) Diga, sem efectuar cálculos, se as seguintes questões são verdadeiras ou falsas:

Statistics

Volume de vendas72

0

51,1111

47,00

19,93974

94,00

11,00

105,00

25,0000

38,0000

47,5000

62,0000

80,0000

Valid

Missing

N

Mean

Mode

Std. Deviation

Range

Minimum

Maximum

10

25

50

75

90

Percentiles

i) O percentil 74 é igual a 13 euros.

ii) 84% dos analistas previram um ganho por acção superior a 8 euros.

d) Complete a seguinte afirmação:

___ % dos analistas previram um ganho por acção inferior a 12,40 euros.

5. Considere que, numa distribuição de frequências relativa aos gastos energéticos de

80 empresas numa dada actividade, os pontos médios das classes xi e as frequências

relativas fi são os seguintes, respectivamente:

xi= 4, 6, 8, 11, 15 e 21; fi= 0.1375, 0.1875, 0.2500, 0.2000, 0.1000 e 0.1250.

a) Complete a seguinte afirmação: 25 % das empresas têm um consumo energético

superior a ____ unidades.

b) Sabendo que a amplitude total do consumo energético das empresas nesta amostra é

igual a 21,8 unidades e que o menor consumo energético registado é igual a 3,1

unidades, esboce a caixa de bigodes.

c) Admita que um seu colega, depois de calcular o terceiro momento central, tirou a

seguinte conclusão: “A maior parte das empresas tem um consumo energético

inferior à média.”. Suporte a veracidade ou a falsidade desta conclusão.

6. Admita que, relativamente ao volume de vendas anuais, em milhões de euros, de um

conjunto de empresas de um país X, se obteve o seguinte output do SPSS:

a) Esboce a caixa de bigodes, sabendo

que a segunda maior empresa em

volume de vendas realizou 92

milhões de euros.

b) Justifique a falsidade da seguinte

afirmação: “O terceiro momento

centrado é nulo.”.

5. Suponha que numa determina população, 9,8% dos indivíduos são leitores da revista

A, 30% são leitores da revista B e 5% são leitores de ambas. Determine a

probabilidade de uma pessoa escolhida ao acaso:

a) Ser leitor de alguma das revistas.

b) Ser leitor apenas da revista A.

c) Não ser leitor de nenhuma das revistas.

d) Ser leitor da revista A sabendo que também é leitor da revista B.

6. Uma caixa contém 2 bolas vermelhas e 3 azuis. Extraem-se, ao acaso, duas bolas

com reposição. Qual a probabilidade de:

a) Ser vermelha a primeira bola escolhida?

b) Ser vermelha a segunda bola escolhida?

c) Ambas as bolas serem vermelhas?

d) Ser vermelha a primeira e azul a segunda?

e) Refaça as alíneas anteriores, admitindo que se extraem as bolas sem reposição.

7. Sejam A e B acontecimentos tais que P[A] = .2, P[B] = p e P[A∪B] = .6. Calcule p

considerando A e B:

a) mutuamente exclusivos.

b) independentes.

8. Aos armazéns de uma empresa chegam dois lotes de 1000 produtos cada, um de

uma fábrica A e outro de uma fábrica B. Admita que o fornecimento da fábrica A

tem 10% de produtos defeituosos e o da B 20%. Supondo que se misturou ao acaso

os produtos dos 2 lotes e que, extraindo um produto, também ao acaso, se verificou

que era defeituoso, determine a probabilidade do produto ter sido produzido pela

fábrica A.

9. Sejam A e B dois acontecimentos quaisquer. Mostre que

P(A∩B) ≤ P(A) ≤ P(A∪B) ≤ P(A)+P(B).

10. Suponha que existem 3 tipos de vírus duma dada doença, sendo 0,3; 0,5 e 0,2 as

probabilidades de um indivíduo ser atacado por cada um deles. Para a vacina

disponível as probabilidades de imunização são 0,8; 0,9 e 0,95 respectivamente.

a) Qual a probabilidade de um indivíduo vacinado contrair a doença?

b) Se um indivíduo vacinado resistiu ao ataque, qual a probabilidade de ter sido

atacado por um vírus do 2º tipo?

11. O Governo de um determinado país pretende avaliar o crescimento do produto

interno bruto (PIB). Para tal, resolve pedir previsões da evolução de diversos

componentes, em três vertentes distintas, a um economista. Neste caso, 40% das

estimativas são referentes às receitas (vertente em que a probabilidade do

economista estimar correctamente é igual a 0,80), 35% das estimativas são

referentes às despesas (vertente em que a probabilidade do economista estimar

correctamente é igual a 0,20) e 25% das estimativas são referentes às importações e

exportações (vertente em que a probabilidade do economista estimar correctamente

é igual a 0,40).

a) Determine a probabilidade de, escolhida ao acaso uma estimativa referente às

receitas, esta esteja estimada incorrectamente.

b) Relativamente a um dada estimativa verificou-se que estava correcta. Calcule a

probabilidade de ser relativa às importações e exportações.

12. Uma companhia de seguros refere que 30% dos seus clientes são de alto risco, 45%

dos seus clientes são de médio risco e os restantes clientes são de baixo risco. Em

cada caso, a probabilidade de terem acidentes no ano coberto pelo seguro é igual a

0.25, 0.16 e 0.08, respectivamente.

a) Determine a probabilidade de escolher ao acaso um cliente que não seja de alto

risco.

b) Determine a probabilidade de um condutor ser de alto risco, sabendo que não

teve acidentes no ano coberto pelo seguro.

13. Considere a v. a. X com a seguinte função densidade de probabilidade:

( ) < <=

10 x 3

f x 30 caso contrário

a) Represente graficamente a função de densidade de probabilidade.

b) Descreva a função de distribuição de X e represente-a graficamente.

c) Calcule P(X ≤ 2).

d) Calcule E(X) e Var(X).

14. Uma cadeia de hipermercados vende, por semana, uma quantidade de carne

(expressa em toneladas) que admitimos ser uma variável aleatória X com função

densidade de probabilidade dada por:

, 0 3( ) 6

0, caso contrario

+ ≤ ≤=

xk x

f x

a) Obtenha a função distribuição, o valor médio e a mediana de X.

b) Determine a quantidade de carne que deve ser recebida semanalmente para que

em 80% das semanas não haja falta do produto.

c) Qual a probabilidade das vendas semanais de carne da cadeia de hipermercados

ser de pelo menos 2 tonelada? E de vender entre 1 e 2 toneladas?

d) Determine a variância das vendas semanais de carne da cadeia de

hipermercados.

15. Um aluno da Universidade de Évora para se deslocar para as aulas utiliza 2 meios de

transporte, cuja duração conjunta é uma variável aleatória bidimensional (X, Y) com

densidade

(6 ) ; 0<x<2, 2<y<4( , )

0 ; restantes valores

− −=

k x yf x y .

a) Determine a constante k.

b) Calcule o tempo médio de duração do segundo transporte ( Y ).

c) Calcule o tempo mediano de duração do primeiro transporte ( X ).

d) As variáveis X e Y são independentes? Justifique.

16. A função densidade conjunta de duas variáveis aleatórias X e Y contínuas é:

( )cxy 0 x 4 e 1 y 5

f x, y0 c.c.

< < < <=

Determine:

a) O valor da constante c.

b) P(1 < X < 2, 2 < Y < 3).

c) P(X ≥ 3, Y ≤ 2).

d) Função distribuição marginal de X.

e) Função distribuição marginal de Y.

f) E(X), E(Y) e E(XY). Pode afirmar que as variáveis são independentes?

17. O conteúdo de leite de certa marca é uma variável aleatória com distribuição

uniforme entre 0,85 e 1,05 litros.

a) Indique a função densidade de probabilidade correspondente.

b) Qual a probabilidade de um pacote de leite ter um volume inferior a 1 litro?

18. O tempo de funcionamento (em horas) de um certo equipamento é uma v.a com

distribuição exponencial de parâmetro λ=1/2.

a) Determine a função densidade e a função distribuição de X.

b) Calcule a probabilidade de que a 1ª avaria ocorra pelo menos 1 hora depois do

início do funcionamento do equipamento.

c) Calcule a probabilidade de que a 1ª avaria não ocorra depois das primeiras 4h de

funcionamento.

d) Prove que a probabilidade de que equipamento dure mais de 10h sabendo que já

está a funcionar há 3h é igual à probabilidade de que o equipamento dure pelo

menos 7h.

19. Suponha que um dispositivo electrónico tem um tempo de vida X (em unidades de

1000 horas), que é uma v.a. exponencial de média igual a 1 unidade. Admita, ainda,

que o custo de fabrico de um desses dispositivos é igual a 200 € e que o fabricante o

vende por 500€, mas garante o reembolso total se a duração do dispositivo for

menor ou igual a 900 horas. Qual será o lucro que o fabricante espera obter por

dispositivo?

20. O tempo de execução de determinada tarefa é uma variável aleatória com

distribuição Normal, com µ = 72 minutos e σ = 12 minutos.

a) Calcule a probabilidade de que a tarefa:

i) Leve mais de 93 minutos a executar;

ii) Não demore mais de 65 minutos;

iii) Gaste entre 63 e 78 minutos;

b) Determine os valores de a e b tais que:

i) P(X > a) = 0,2525;

ii) P(X < b) = 0,0054.

21. Suponha que a sua nota numa frequência, em unidades padrão é igual a 0,87 e que

se admite que as notas eram normalmente distribuídas. Determine a percentagem de

alunos que se poderia esperar com notas inferiores à sua? E superiores?

22. Admita que uma empresa tem produção constante de 100 toneladas por mês. Sabe-

se que a procura é uma v. a. Normal com média µ = 80 toneladas e desvio-padrão σ

= 10 toneladas.

a) Determine a probabilidade de ocorrer procura excedentária.

b) Para reduzir a probabilidade de ocorrer procura excedentária para 0,0027, a

empresa deve aumentar a sua produção mensal em quantas toneladas.

23. Seja X uma variável aleatória com distribuição Normal de valor médio 10 e

variância 4, representando o comprimento de barras de ferro. Suponha que uma

barra é considerada não defeituosa se {8 ≤ X ≤ 12} e defeituosa em caso contrário.

a) Qual a probabilidade de que uma barra, escolhida ao acaso, do fabrico diário,

seja não defeituosa?

b) Qual a probabilidade de que em dez barras escolhidas aleatoriamente do fabrico

diário, pelo menos duas sejam defeituosas?

24. Admita que os responsáveis de uma determina empresa produtora de açúcar, face a

uma diminuição registada nas vendas do produto, encararam a hipótese de fechar

uma das suas sucursais. De acordo com estudos efectuados, para não encerrar a dita

sucursal, a empresa necessita que a procura semanal (7 dias) seja superior a 65.000

kg. Sabendo que a procura média diária de açúcar se distribui normalmente, com

média 10.000 kg e desvio-padrão 1.000 kg, determine a probabilidade da sucursal

encerrar.

25. A média de um exame final de uma determinada disciplina foi igual 14 e o desvio

padrão igual a 2. Determine a nota mínima que um estudante devia ter para ser

classificado entre os 10% com notas mais altas.

26. Admita que o diâmetro externo de um dado eixo segue uma distribuição normal com

média igual a 4cm e variância igual a 0.01 cm2. Admita, ainda, que de acordo com

as especificações estabelecidas, o diâmetro externo não deve diferir de 4cm por mais

de 0.05 cm. Caso contrário, o fabricante terá um prejuízo igual a 10€ se essa

diferença exceder 0.08 cm e igual a 5€ se essa diferença estiver compreendida entre

0.05cm e 0.08cm. Calcule o prejuízo médio do fabricante.

27. Joga-se uma moeda 1000 vezes ao ar. Determine a probabilidade de o número de

caras não diferir de 500 por mais de 50.

28. Suponha que, em determinadas eleições nacionais com apenas dois candidatos, o

candidato A obteve 60% dos votos. Calcule a probabilidade de, numa mesa de voto

considerada representativa do eleitorado, o candidato A ter tido um número de votos

compreendido entre 590 e 700 (ambos inclusive) num total de 1000 votos atribuídos

aos dois candidatos.

29. O número de defeitos por cada unidade de equipamento electrónico tem distribuição

de Poisson com média igual a 40. Determine a probabilidade de um equipamento

electrónico, escolhido ao acaso, ter entre 30 a 35 defeitos.

30. A produção de chocolate numa dada fábrica tem distribuição normal de valor médio

200 gramas e variância 25 gramas.

a) Calcule P(185 < X < 215).

b) Suponha que um defeito numa das máquinas provoca uma alteração na produção

de chocolates, deslocando a média para 215 gramas. Calcule a probabilidade

anterior.

c) Determine a variância do peso médio de 5 chocolates.

31. O tempo (em horas) que um gestor demora a avaliar um determinado projecto é uma

variável aleatória com distribuição normal de média igual a 10 horas e desvio

padrão igual a 2 horas.

a) Determine a probabilidade do gestor demorar entre 9 e 11 horas a avaliar um

determinado projecto.

b) Se ao gestor fosse pedido para prever o tempo necessário para avaliar um dado

projecto, de modo a que a probabilidade do estudo não estar concluído nesse

tempo apenas fosse igual a 0,025, que valor indicaria?

c) O gestor recebe uma compensação monetária sempre que termina a avaliação de

um projecto em menos de 8 horas. Admitindo que o gestor recebeu 7 projectos

distintos para avaliar, calcule a probabilidade de ser compensado em pelo menos

2 projectos.

32. Suponha que a procura semanal, de uma determinada marca de óleo lubrificante,

numa dada estação de serviço, segue uma distribuição normal com valor médio 50

litros e desvio padrão 3 litros.

a) Calcule a probabilidade de numa determinada semana se consumirem entre 45

litros e 65 litros.

b) Comente, sem efectuar cálculos: “Se o stock no início de cada semana for

inferior a 50 litros, então em mais de metade das semanas haverá ruptura de

stock.”.

c) Qual deverá ser o stock de óleo no início de uma determinada semana, de modo

a que a probabilidade de haver ruptura de stock, nessa semana, seja igual a

0.015?

33. Considere a v. a. X com a seguinte função densidade de probabilidade:

( ) < <=

10 x 3

f x 30 caso contrário

a) Represente graficamente a função de densidade de probabilidade.

b) Descreva a função de distribuição de X e represente-a graficamente.

c) Calcule P(X ≤ 2).

d) Calcule E(X) e Var(X).

34. Uma cadeia de hipermercados vende, por semana, uma quantidade de carne

(expressa em toneladas) que admitimos ser uma variável aleatória X com função

densidade de probabilidade dada por:

, 0 3( ) 6

0, caso contrario

+ ≤ ≤=

xk x

f x

a) Obtenha a função distribuição, o valor médio e a mediana de X.

b) Determine a quantidade de carne que deve ser recebida semanalmente para que

em 80% das semanas não haja falta do produto.

c) Qual a probabilidade das vendas semanais de carne da cadeia de hipermercados

ser de pelo menos 2 tonelada? E de vender entre 1 e 2 toneladas?

d) Determine a variância das vendas semanais de carne da cadeia de

hipermercados.

35. Um aluno da Universidade de Évora para se deslocar para as aulas utiliza 2 meios de

transporte, cuja duração conjunta é uma variável aleatória bidimensional (X, Y) com

densidade

(6 ) ; 0<x<2, 2<y<4( , )

0 ; restantes valores

− −=

k x yf x y .

e) Determine a constante k.

f) Calcule o tempo médio de duração do segundo transporte ( Y ).

g) Calcule o tempo mediano de duração do primeiro transporte ( X ).

h) As variáveis X e Y são independentes? Justifique.

36. A função densidade conjunta de duas variáveis aleatórias X e Y contínuas é:

( )cxy 0 x 4 e 1 y 5

f x, y0 c.c.

< < < <=

Determine:

g) O valor da constante c.

h) P(1 < X < 2, 2 < Y < 3).

i) P(X ≥ 3, Y ≤ 2).

j) Função distribuição marginal de X.

k) Função distribuição marginal de Y.

l) E(X), E(Y) e E(XY). Pode afirmar que as variáveis são independentes?

37. O conteúdo de leite de certa marca é uma variável aleatória com distribuição

uniforme entre 0,85 e 1,05 litros.

a) Indique a função densidade de probabilidade correspondente.

b) Qual a probabilidade de um pacote de leite ter um volume inferior a 1 litro?

38. O tempo de funcionamento (em horas) de um certo equipamento é uma v.a com

distribuição exponencial de parâmetro λ=1/2.

a) Determine a função densidade e a função distribuição de X.

b) Calcule a probabilidade de que a 1ª avaria ocorra pelo menos 1 hora depois do

início do funcionamento do equipamento.

c) Calcule a probabilidade de que a 1ª avaria não ocorra depois das primeiras 4h de

funcionamento.

d) Prove que a probabilidade de que equipamento dure mais de 10h sabendo que já

está a funcionar há 3h é igual à probabilidade de que o equipamento dure pelo

menos 7h.

39. Suponha que um dispositivo electrónico tem um tempo de vida X (em unidades de

1000 horas), que é uma v.a. exponencial de média igual a 1 unidade. Admita, ainda,

que o custo de fabrico de um desses dispositivos é igual a 200 € e que o fabricante o

vende por 500€, mas garante o reembolso total se a duração do dispositivo for

menor ou igual a 900 horas. Qual será o lucro que o fabricante espera obter por

dispositivo?

40. O tempo de execução de determinada tarefa é uma variável aleatória com

distribuição Normal, com µ = 72 minutos e σ = 12 minutos.

a) Calcule a probabilidade de que a tarefa:

i) Leve mais de 93 minutos a executar;

ii) Não demore mais de 65 minutos;

iii) Gaste entre 63 e 78 minutos;

b) Determine os valores de a e b tais que:

i) P(X > a) = 0,2525;

ii) P(X < b) = 0,0054.

41. Suponha que a sua nota numa frequência, em unidades padrão é igual a 0,87 e que

se admite que as notas eram normalmente distribuídas. Determine a percentagem de

alunos que se poderia esperar com notas inferiores à sua? E superiores?

42. Admita que uma empresa tem produção constante de 100 toneladas por mês. Sabe-

se que a procura é uma v. a. Normal com média µ = 80 toneladas e desvio-padrão σ

= 10 toneladas.

a) Determine a probabilidade de ocorrer procura excedentária.

b) Para reduzir a probabilidade de ocorrer procura excedentária para 0,0027, a

empresa deve aumentar a sua produção mensal em quantas toneladas.

43. Seja X uma variável aleatória com distribuição Normal de valor médio 10 e

variância 4, representando o comprimento de barras de ferro. Suponha que uma

barra é considerada não defeituosa se {8 ≤ X ≤ 12} e defeituosa em caso contrário.

a) Qual a probabilidade de que uma barra, escolhida ao acaso, do fabrico diário,

seja não defeituosa?

b) Qual a probabilidade de que em dez barras escolhidas aleatoriamente do fabrico

diário, pelo menos duas sejam defeituosas?

44. Admita que os responsáveis de uma determina empresa produtora de açúcar, face a

uma diminuição registada nas vendas do produto, encararam a hipótese de fechar

uma das suas sucursais. De acordo com estudos efectuados, para não encerrar a dita

sucursal, a empresa necessita que a procura semanal (7 dias) seja superior a 65.000

kg. Sabendo que a procura média diária de açúcar se distribui normalmente, com

média 10.000 kg e desvio-padrão 1.000 kg, determine a probabilidade da sucursal

encerrar.

45. A média de um exame final de uma determinada disciplina foi igual 14 e o desvio

padrão igual a 2. Determine a nota mínima que um estudante devia ter para ser

classificado entre os 10% com notas mais altas.

46. Admita que o diâmetro externo de um dado eixo segue uma distribuição normal com

média igual a 4cm e variância igual a 0.01 cm2. Admita, ainda, que de acordo com

as especificações estabelecidas, o diâmetro externo não deve diferir de 4cm por mais

de 0.05 cm. Caso contrário, o fabricante terá um prejuízo igual a 10€ se essa

diferença exceder 0.08 cm e igual a 5€ se essa diferença estiver compreendida entre

0.05cm e 0.08cm. Calcule o prejuízo médio do fabricante.

47. Joga-se uma moeda 1000 vezes ao ar. Determine a probabilidade de o número de

caras não diferir de 500 por mais de 50.

48. Suponha que, em determinadas eleições nacionais com apenas dois candidatos, o

candidato A obteve 60% dos votos. Calcule a probabilidade de, numa mesa de voto

considerada representativa do eleitorado, o candidato A ter tido um número de votos

compreendido entre 590 e 700 (ambos inclusive) num total de 1000 votos atribuídos

aos dois candidatos.

49. O número de defeitos por cada unidade de equipamento electrónico tem distribuição

de Poisson com média igual a 40. Determine a probabilidade de um equipamento

electrónico, escolhido ao acaso, ter entre 30 a 35 defeitos.

50. A produção de chocolate numa dada fábrica tem distribuição normal de valor médio

200 gramas e variância 25 gramas.

a) Calcule P(185 < X < 215).

b) Suponha que um defeito numa das máquinas provoca uma alteração na produção

de chocolates, deslocando a média para 215 gramas. Calcule a probabilidade

anterior.

c) Determine a variância do peso médio de 5 chocolates.

51. O tempo (em horas) que um gestor demora a avaliar um determinado projecto é uma

variável aleatória com distribuição normal de média igual a 10 horas e desvio

padrão igual a 2 horas.

a) Determine a probabilidade do gestor demorar entre 9 e 11 horas a avaliar um

determinado projecto.

b) Se ao gestor fosse pedido para prever o tempo necessário para avaliar um dado

projecto, de modo a que a probabilidade do estudo não estar concluído nesse

tempo apenas fosse igual a 0,025, que valor indicaria?

c) O gestor recebe uma compensação monetária sempre que termina a avaliação de

um projecto em menos de 8 horas. Admitindo que o gestor recebeu 7 projectos

distintos para avaliar, calcule a probabilidade de ser compensado em pelo menos

2 projectos.

52. Suponha que a procura semanal, de uma determinada marca de óleo lubrificante,

numa dada estação de serviço, segue uma distribuição normal com valor médio 50

litros e desvio padrão 3 litros.

a) Calcule a probabilidade de numa determinada semana se consumirem entre 45

litros e 65 litros.

b) Comente, sem efectuar cálculos: “Se o stock no início de cada semana for

inferior a 50 litros, então em mais de metade das semanas haverá ruptura de

stock.”.

c) Qual deverá ser o stock de óleo no início de uma determinada semana, de modo

a que a probabilidade de haver ruptura de stock, nessa semana, seja igual a

0.015?

53. Suponha que o peso dos indivíduos de uma determinada população segue uma

distribuição normal de média 60 kg e desvio-padrão 10 kg e que tal população

utiliza um elevador público de tara máxima 300 kg para 4 pessoas.

a) Calcule a probabilidade do peso das 4 pessoas exceder a tara máxima.

b) Calcule a probabilidade do peso médio de 4 pessoas:

i) Exceder 60 kg.

ii) Estar compreendido entre 40 kg e 60 kg.

54. Suponha que o gasto médio em telefone, num conjunto numeroso de empresas do

mesmo ramo de actividade, foi de 12 000 contos/ano com um desvio-padrão de

2000 contos. Considerando 50 quaisquer dessas empresas, qual a probabilidade do

seu gasto médio anual ter sido superior a 12 300 contos?

55. Uma máquina é regulada para revestir uma peça com uma camada média de 3 mm

de espessura de determinada substância. O processo tem uma distribuição normal

com 1 mm de desvio padrão. Qual será a probabilidade de extrair uma amostra de 25

peças com uma média amostral superior a 3,4 mm ?

56. Numa multinacional, o responsável pela comercialização de um produto alimentar,

não sazonal e de procura rígida, apurou que as vendas semanais tinham média 8

toneladas e desvio padrão de 1 tonelada. Qual a probabilidade de ao fim de 60

semanas as vendas totalizarem pelo menos 470 toneladas?

57. Sabendo que 2% das peças produzidas por uma máquina são defeituosas, determine

a probabilidade de, numa remessa de 400 peças, haver:

a) 3%, ou mais, de peças defeituosas.

b) No máximo 2% de peças defeituosas

58. Admitindo que um em cada cinco alunos usa óculos, determine a probabilidade de

observar mais de 30% de alunos com óculos, numa amostra de dimensão 20 e numa

amostra de dimensão 100.

59. Num processo eleitoral, um determinado candidato obteve 45% dos votos.

Determine a probabilidade de, numa secção de voto ter havido uma maioria absoluta

de votos a favor desse candidato, sabendo que o número de votantes foi:

a) 200.

b) 1000.

60. Considere uma população normal, com média µ e desvio-padrão σ, e a seguinte

estatística 1 2X 2XT

2

+= , para amostras aleatórias de dimensão n = 2.

a) Determine a distribuição amostral de T e respectivos parâmetros.

b) Diga se T é um estimador centrado e consistente para µ.

61. Seja X1, X2,...,Xn uma amostra aleatória, com E[X] = µ e Var[X] = σ2. Mostre que o

enviesamento de ( )2

2 1=

−=∑

n

ii

n

X XS

n é dado por

2

−σ

n e que o enviesamento de

( )2

2 11 1

=−

−=

∑n

ii

n

X XS

n é nulo.

62. Seja X1, X2,...,Xn uma amostra proveniente de uma população X com função

densidade dada por 1

( ) ,0= < < θθ

f x x , θ real positivo. Mostre que o estimador

2=T X é centrado para o parâmetro θ.

63. Suponha que uma variável aleatória X representa o número de avarias de um

dispositivo durante um período de tempo e que obedece a uma lei de Poisson de

parâmetro λ desconhecido. Para este parâmetro foram sugeridos dois estimadores:

1 11 2

...ˆ ˆ e 2

+ + += =λ λn nX X X X

n

a) Classifique-os quanto ao enviesamento e consistência.

b) Qual dos dois estimadores é mais eficiente? Justifique a sua escolha.

64. Para o parâmetro θ de uma certa população foram indicados dois estimadores:

1 2ˆ ˆθ e θ . Diga qual preferiria, sabendo que k é uma constante e:

1

n 1ˆE θ θn

+ = 1

kˆVar θn

=

2

n 1ˆE θ θn

+ = 2

kˆVar θn 3

= +

65. Suponha que as despesas familiares de um determinado país é uma variável aleatória

com média µ e desvio padrão σ. Para conhecer o montante mensal médio das

despesas familiares, duas empresas de sondagens realizaram inquéritos, simultânea

mas independentemente. A empresa A inquiriu 3025 famílias enquanto a empresa B

inquiriu 1225. Pretendendo realizar o estudo com base na informação conjunta das

duas empresas, qual dos estimadores 3025 12251

X Xˆ

2

+=µ ou 2 4250ˆ X=µ escolheria?

Justifique.

66. Mostre que, se θ é um estimador consistente de θ, então kθ (k≠0) é um estimador

consistente de kθ.

67. Utilizando o método da Máxima Verosimilhança, determine o estimador para o

parâmetro p de uma população de Bernouli. Suponha que a v.a. X é usada para

indicar que uma peça de um determinado lote é ou não defeituosa e que p representa

a probabilidade de uma peça ser defeituosa.

a) Utilizando o método da Máxima Verosimilhança, determine o estimador para o

parâmetro p de uma população de Bernouli.

b) Sabendo que, ao inspeccionar 30 peças se verificou que 5 eram defeituosas,

determine a estimativa de p.

68. Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição cuja função densidade

seja

( )1x ;0 x 1, 0

f x0; caso contrário

θ−θ < < θ>=

a) Determine, pelo método dos momentos, o estimador de θ.

b) Determine, pelo método de máxima verosimilhança, o estimador de θ.

69. Seja X uma variável aleatória com a seguinte função massa de probabilidade:

( )

1- , 0, 2, 4

31

| , 1, 3, 5 , com 03

0,

== = ≤ ≤

α

θ α α

x

f x x

outros valores de x

a) Determine, pelo método dos momentos, um estimador para o parâmetro α.

b) Verifique se o estimador encontrado é centrado e consistente.

c) Será melhor o estimador encontrado na alínea a) ou o estimador

1 4ˆ

6

+ −=α nX X

.

d) Considerando a amostra (1, 0, 5, 2, 3, 1, 0, 3, 4, 4, 5, 2) determine uma

estimativa para o parâmetro α pelo método da máxima verosimilhança.

70. O Presidente de um clube de futebol quer avaliar os custos de reparação das

bancadas do estádio na sequência dos distúrbios envolvendo claques em jogos de

risco. Para isso pede os valores das reparações incorridas nos últimos 10 jogos de

risco que se realizaram nesse estádio. Os dados obtidos (em 103 euros) foram:

137,9 176,8 825,3 231,7 275,8

312,1 243,0 143,6 205,3 176,1

Estime pontualmente o valor médio e a variância, admitindo que o modelo adequado

para este tipo de despesas é normal.

71. Encontre o estimador de máxima verosimilhança para o parâmetro λ, com λ > 0, de

uma população com distribuição exponencial.

72. Suponha que o peso dos indivíduos de uma determinada população segue uma

distribuição normal de média 60 kg e desvio-padrão 10 kg e que tal população

utiliza um elevador público de tara máxima 300 kg para 4 pessoas.

a) Calcule a probabilidade do peso das 4 pessoas exceder a tara máxima.

b) Calcule a probabilidade do peso médio de 4 pessoas:

i) Exceder 60 kg.

ii) Estar compreendido entre 40 kg e 60 kg.

73. Suponha que o gasto médio em telefone, num conjunto numeroso de empresas do

mesmo ramo de actividade, foi de 60 000 euros/ano com um desvio-padrão de

10000 euros. Considerando 50 quaisquer dessas empresas, qual a probabilidade do

seu gasto médio anual ter sido superior a 61 500 euros?

74. Uma máquina é regulada para revestir uma peça com uma camada média de 3 mm

de espessura de determinada substância. O processo tem uma distribuição normal

com um desvio padrão igual a 1 mm. Qual será a probabilidade de extrair uma

amostra de 25 peças com uma média amostral superior a 3,4 mm?

75. Numa multinacional, o responsável pela comercialização de um produto alimentar,

não sazonal e de procura rígida, apurou que as vendas semanais tinham média 8

toneladas e desvio padrão de 1 tonelada. Qual a probabilidade de ao fim de 60

semanas as vendas totalizarem pelo menos 470 toneladas?

76. Sabendo que 2% das peças produzidas por uma máquina são defeituosas, determine

a probabilidade de, numa remessa de 400 peças, haver:

a) 3%, ou mais, de peças defeituosas.

b) No máximo 2% de peças defeituosas

77. Admitindo que um em cada cinco alunos usa óculos, determine a probabilidade de

observar mais de 30% de alunos com óculos, numa amostra de dimensão 20 e numa

amostra de dimensão 100.

78. Num processo eleitoral, um determinado candidato obteve 45% dos votos.

Determine a probabilidade de numa secção de voto ter havido uma maioria absoluta

de votos a favor desse candidato, sabendo que o número de votantes foi:

a) 200.

b) 1000.

79. Considere uma população normal, com média µ e desvio-padrão σ, e a seguinte

estatística 1 2X 2XT

2

+= , para amostras aleatórias de dimensão n = 2.

a) Determine a distribuição amostral de T e respectivos parâmetros.

b) Diga se T é um estimador centrado e consistente para µ.

80. Seja X1, X2,...,Xn uma amostra aleatória, com E[X] = µ e Var[X] = σ2. Mostre que o

enviesamento de ( )2

2 1=

−=∑

n

ii

n

X XS

n é dado por

2

−σ

n e que o enviesamento de

( )2

2 11 1

=−

−=

∑n

ii

n

X XS

n é nulo.

81. Seja X1, X2,...,Xn uma amostra proveniente de uma população X com função

densidade dada por 1

( ) ,0= < < θθ

f x x , θ real positivo. Mostre que o estimador

2=T X é centrado para o parâmetro θ.

82. Suponha que uma variável aleatória X representa o número de avarias de um

dispositivo durante um período de tempo e que obedece a uma lei de Poisson de

parâmetro λ desconhecido. Para este parâmetro foram sugeridos dois estimadores:

1 11 2

...ˆ ˆ e 2

+ + += =λ λn nX X X X

n

a) Classifique-os quanto ao enviesamento e consistência.

b) Qual dos dois estimadores é mais eficiente? Justifique a sua escolha.

83. Para o parâmetro θ de uma certa população foram indicados dois estimadores:

1 2ˆ ˆθ e θ . Diga qual preferiria, sabendo que k é uma constante e que

1

n 1ˆE θ θn

+ =

2

n 1ˆE θ θn

+ =

1

kˆVar θn

=

2

kˆVar θn 3

= +

84. Suponha que as despesas familiares de um determinado país é uma variável aleatória

com média µ e desvio padrão σ. Para conhecer o montante mensal médio das

despesas familiares, duas empresas de sondagens realizaram inquéritos, simultânea

mas independentemente. A empresa A inquiriu 3025 famílias enquanto a empresa B

inquiriu 1225. Pretendendo realizar o estudo com base na informação conjunta das

duas empresas, qual dos estimadores 3025 12251

X Xˆ

2

+=µ ou 2 4250ˆ X=µ escolheria?

Justifique.

85. Mostre que, se θ é um estimador consistente de θ, então kθ (k≠0) é um estimador

consistente de kθ.

86. Suponha que a v.a. X é usada para indicar que uma peça de um determinado lote é

ou não defeituosa e que p representa a probabilidade de uma peça ser defeituosa.

a) Utilizando o método da Máxima Verosimilhança, determine o estimador para o

parâmetro p de uma população de Bernoulli.

b) Sabendo que ao inspeccionar 30 peças se verificou que 5 eram defeituosas,

determine a estimativa de p.

87. Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição com função densidade

dada por

( )1x ;0 x 1, 0

f x0; caso contrário

θ−θ < < θ>=

a) Determine, pelo método dos momentos, o estimador de θ.

b) Determine, pelo método de máxima verosimilhança, o estimador de θ.

88. Seja X uma variável aleatória com a seguinte função massa de probabilidade:

( )

1- , 0, 2, 4

31

| , 1, 3, 5 , com 03

0,

== = ≤ ≤

α

θ α α

x

f x x

outros valores de x

a) Determine, pelo método dos momentos, um estimador para o parâmetro α.

b) Verifique se o estimador encontrado é centrado e consistente.

c) Será melhor o estimador encontrado na alínea a) ou o estimador

1 4ˆ

6

+ −=α nX X

.

d) Considerando a amostra (1, 0, 5, 2, 3, 1, 0, 3, 4, 4, 5, 2), determine uma

estimativa para o parâmetro α pelo método da máxima verosimilhança.

89. O Presidente de um clube de futebol quer avaliar os custos de reparação das

bancadas do estádio na sequência dos distúrbios envolvendo claques em jogos de

risco. Para isso pede os valores das reparações incorridas nos últimos 10 jogos de

risco que se realizaram nesse estádio. Os dados obtidos (em 103 euros) foram:

137,9 176,8 825,3 231,7 275,8

312,1 243,0 143,6 205,3 176,1

Estime pontualmente o valor médio e a variância, admitindo que o modelo adequado

para este tipo de despesas é normal.

90. Encontre o estimador de máxima verosimilhança para o parâmetro λ, com λ > 0, de

uma população com distribuição exponencial.

91. Numa multinacional, o responsável pela comercialização de um produto alimentar,

não sazonal e de procura rígida, apurou que as vendas semanais tinham distribuição

(aproximadamente) normal com média µ toneladas e desvio padrão 1 tonelada e que

ao fim da 30ª semana as vendas totalizaram 235 toneladas.

a) Obtenha um intervalo, com 90% de confiança, para a média µ das vendas

semanais.

b) Qual deve ser a dimensão da amostra para reduzir o erro de estimativa para 0,2?

92. Numa fábrica de computadores a administração pretende uma estimativa para o

tempo médio de vida de um determinado tipo de disco rígido. Para tal, foi

seleccionada uma amostra constituída por 15 computadores. Com base nesta

amostra obteve-se um tempo médio de vida igual a 27 350 horas. Supondo que o

tempo de vida segue uma distribuição normal com σ igual a 3000 horas, construa

um intervalo de confiança a 99% para o tempo médio de vida dos discos rígidos.

93. Com o objectivo de prever a produção de trigo duma certa região dividiu-se a

mesma em pequenos talhões, procedendo-se em seguida ao registo, ao acaso, da

produção de alguns desses talhões. Admita que a quantidade de trigo produzida por

talhão tem distribuição normal com desvio padrão igual a 60 Kg.

a) Determine o número mínimo de talhões que o experimentador deverá analisar se

desejar garantir, com uma confiança de pelo menos 95%, que a média da

amostra difira no máximo 30 Kg do verdadeiro valor da produção média por

talhão.

b) Qual o número mínimo de talhões que será necessário analisar se o nível de

confiança exigido for de 99%?

c) Acha que a hipótese de normalidade é essencial na resolução das alíneas a) e b)?

Justifique a resposta.

94. Um fabricante produz peças que obedecem a uma norma que especifica que o seu

diâmetro deve ser igual a 100 mm. Admita que os diâmetros das peças produzidas

são

N(µ, σ) e que uma amostra aleatória de 20 peças conduziu aos resultados seguintes:

( )20 20 2

1 1

1999,60 e 111,91= =

= − =∑ ∑i ii i

x x x

a) Construa um I. C. a 95% para o diâmetro médio das peças.

b) Construa um I. C. a 95% para a variância do diâmetro das peças.

95. Num determinado período pré eleitoral foi realizada uma sondagem com o objectivo

de analisar a popularidade de dois candidatos A e B num determinado distrito. Para

tal, foram inquiridas 780 pessoas residentes nesse distrito manifestando-se 55% dos

inquiridos a favor do candidato A.

a) Construa um intervalo de confiança a 90%, 95% e 99% para a percentagem de

pessoas do distrito que são a favor do candidato A. Comente as diferenças

obtidas para os três intervalos.

b) Suponha que a percentagem obtida resultou de uma amostra de 1020 pessoas.

Determine um intervalo de confiança a 95% para a percentagem de pessoas a

favor do candidato A. Comente o resultado obtido.

96. Admita que a direcção de determinada Universidade se dispõe a oferecer aos seus

3800 alunos a possibilidade de estes frequentarem aulas ao Sábado de manhã se a

procura para este horário for suficientemente alta. Determine a dimensão apropriada

da amostra de alunos a inquirir para que a amplitude do intervalo de confiança a

95% para a proporção de alunos com interesse por aquele horário não exceda 0.1?

97. Num estudo de mercado quantas pessoas devem ser inquiridas para, com 95% de

confiança, se cometer um erro de estimativa da verdadeira proporção de potenciais

clientes de um novo produto inferior a 3%? E para se cometer um erro de estimativa

inferior a 1%?

98. Considere uma amostra aleatória obtida no mercado de trabalho de uma grande

cidade, constituída por 2000 indivíduos. Das entrevistas efectuadas constatou-se que

165 pessoas responderam não ter emprego.

a) Construa um intervalo de confiança a 95% para a proporção média de indivíduos

desempregados na referida cidade.

b) Caso pretenda reduzir para metade a amplitude do intervalo relativo à alínea

anterior, mantendo o mesmo grau de confiança, qual a dimensão da amostra

adequada? Justifique a resposta.

99. Os empregados de uma determinada empresa deveriam trabalhar, em média, 8h

diárias. De forma a investigar se os empregados estão a trabalhar mais do que as

horas previstas, o sindicato registou o número de horas que 150 trabalhadores

(escolhidos ao acaso) trabalharam num dia qualquer, tendo obtido os seguintes

resultados:

150

1

1498 =

=∑ ii

x ( )2150

1

600=

− =∑ ii

x x

a) Teste ao nível de significância de 5%, se a empresa deverá ser punida por exigir

que os seus empregados trabalhem mais do que deviam.

b) Qual o tipo de erro que pode cometer relativamente à decisão que tomou?

100. Numa determinada empresa pensa-se importar um grande lote de instrumentos

de precisão, para os quais o fabricante garante um peso médio igual a 100 gr. Sendo

o peso uma característica importante para a qualidade do produto, resolveu-se testar

a veracidade da afirmação do fabricante. Para tal, o departamento técnico da

empresa importadora obteve uma amostra de 15 instrumentos, através da qual se

obtiveram os seguintes valores:

15

1

1407 =

=∑ ii

x e ( )15

2

1

1674 =

− =∑ ii

x x

Admitindo a normalidade dos pesos, qual a sua opinião, ao nível de significância de

1%, relativamente à afirmação do fabricante.

101. Suponha que um comerciante recebeu uma remessa de ovos com a garantia de

serem da classe A, isto é, ovos cujo peso segue uma distribuição normal de média

igual a 55gr e desvio padrão igual a 8gr. Como o fornecedor só lhe concede 2 dias

para reclamar, resolve pesar 10 ovos e escolhe para nível de significância 5%.

a) Admitindo que o peso médio dos 10 ovos é igual a 57 gr, qual a decisão que ele

deve tomar?

b) Calcule a probabilidade do erro de 2ª espécie, caso o verdadeiro peso médio dos

ovos seja igual a 50gr.

c) Pretendendo um erro de 2ª espécie β inferior a 10%, mantendo α = 5%, qual

deverá ser o número de ovos que o comerciante deve pesar?

102. Suponha que a média dos volumes de leite de 16 embalagens retiradas

aleatoriamente da linha de produção é igual a 997ml.

a) Admitindo que o desvio padrão da população, considerada normal, é igual a

5ml, teste, ao nível de 5%, a hipótese do volume médio de todos os pacotes de

leite ser igual a 1 litro.

b) Admitindo que a média da população é igual a 998ml, calcule a probabilidade de

aceitar a hipótese testada na alínea anterior.

103. Suponha que, numa determinada produção, o peso de sacos de café é

normalmente distribuído com desvio padrão 10 gramas. Admita, ainda, que a

máquina de enchimento está regulada para sacos de 500 gramas. Nestas condições,

para aferir o funcionamento da máquina analisou-se uma amostra de 9 sacos

aleatoriamente retirados da produção e definiu-se que se rejeitava a hipótese de bom

funcionamento da máquina se X > 510 gramas.

a) Calcule a probabilidade de cometer um erro de 1ª espécie.

b) Se o verdadeiro peso médio dos sacos for igual a 505 gramas, calcule a

probabilidade de aceitar a hipótese de bom funcionamento.

c) Admitindo que o peso médio de todos os sacos é igual a 505 gramas, qual

deverá ser o tamanho da amostra a retirar da população se pretender cometer um

erro de 2ª espécie inferior a 15%, mantendo o mesmo erro de 1ª espécie?

104. Suponha que determinado canal de televisão deseja saber qual tinha sido a

percentagem de pessoas que viram determinado programa. Para tal, realizou uma

sondagem tendo sido inquiridas 220 pessoas, das quais 132 disseram ter visto o

referido programa.

a) Determine um intervalo de confiança de nível 95% para percentagem de pessoas

em toda a população que viu esse programa.

b) Qual deveria ser o número de pessoas inquiridas para se obter um intervalo de

confiança de nível 95% com metade da amplitude do anterior? (Admita que a

proporção das pessoas que viram o programa se mantém.)

c) Poder-se-á afirmar, ao nível de 5%, que mais de metade das pessoas viram o

programa?

105. Determinada marca de óleo para carros afirma que o seu óleo é conhecido por

durar, em média, 5000 km com uma variância igual a 250 000 km2. Admitindo que

o tempo de duração segue uma distribuição normal, teste a afirmação quanto à

variância, a um nível de significância 5%, com base nos seguintes valores do

número de quilómetros que 6 automóveis fizeram antes do óleo se queimar:

5020 6000 4500 5700 5500 4900

106. O administrador de um Hospital pretende estimar as contas em aberto (ainda não

cobradas), referentes a tratamentos e internamentos. Admita que o montante de cada

dívida segue uma distribuição normal e que a experiência de anos anteriores permite

considerar um valor para o desvio padrão igual a 50 euros. Para levar a cabo o seu

objectivo, o administrador seleccionou aleatoriamente 25 dessas contas e avaliou o

seu valor, tendo obtido um total em dívida igual a 1850 euros.

a) Determine um intervalo de confiança a 95% para o montante médio de cada

conta não saldada.

b) Poderá afirmar estatisticamente, ao nível de 1%, que o valor médio de cada

conta não saldada é inferior a 100 euros? Que erro pode estar a cometer com a

sua decisão?

c) Admitindo que o verdadeiro valor médio de cada conta não saldada é igual a 85

euros, calcule a probabilidade de cometer um erro de 2ª espécie.

d) Um valor do desvio padrão amostral, obtido com base nas 25 contas, igual a 60

euros, poderá pôr em causa, ao nível de 10%, o valor de σ considerado

anteriormente?

107. Admita que a direcção comercial de uma determinada empresa pretende lançar

um novo serviço de telecomunicações. De acordo com critérios empresariais, o

serviço só deverá ser lançado no mercado se houver mais de 80% de potenciais

compradores. Assim, para averiguar o eventual lançamento do serviço, a empresa

decidiu efectuar um inquérito a 400 grandes clientes, tendo 340 sido favoráveis à

aquisição do novo serviço.

a) Para um nível significância de 5%, poder-se-á concluir que a empresa

opta pelo lançamento do serviço? E para um nível de significância de

1%?

b) Determine o valor p do teste e interprete-o.

108. As vendas diárias de dois estabelecimentos A e B de certa cadeia são aleatórias.

Suponha que eram conhecidos os seguintes parâmetros:

6250 €; 900 €

7000 €; 750 €A A

B A

µ σ

µ σ

= =

= =

Nestas condições, qual a probabilidade de, em 2 meses de actividade (60 dias), a

média diária de vendas no estabelecimento A se revelar superior à do

estabelecimento B.

109. A esperança média de vida de pessoas do norte de Portugal é igual a 79,5 anos e

a das pessoas do sul é igual a 77,4 anos. Qual a probabilidade de que a diferença das

médias das amostras, às quais correspondem as características abaixo indicadas,

esteja entre –1 e 1?

Região Dimensão da amostra Desvio padrão

Norte 80 SN=5,8

Sul 100 Ss=6,5

110. Admita que uma determinada empresa se dividiu em duas sub-empresas, a B1 e

a B2, tendo colocado à disposição dos subscritores acções, de cada uma dessas

novas empresas, com cotações médias de 5,3 e 6,2 euros e desvio padrão de 3,1 e

2,1 euros, respectivamente.

a) Qual a probabilidade de em 16 dias, a diferença entre as cotações das acções

médias amostrais ser superior a 1 euro? Assuma que as populações são normais.

b) Qual a probabilidade de se obterem em 16 dias consecutivos um quociente dos

desvio padrões amostrais das cotações observadas de B1 e B2 superior a 1 euro?

111. Os pneus da marca P1 andam em média 105,6 (× 1000 km) antes de ficarem

“carecas” e os da marca P2 andam em média 178,5 (× 1000 km) antes de lhes

acontecer o mesmo. Admita que em duas amostras, de dimensão 9 cada, analisando

a distância percorrida com cada pneu até ao desgaste, se obtiveram os desvios-

padrão amostrais iguais a 10,97 e 11,75, para os pneus P1 e P2, respectivamente.

Calcule a probabilidade dos pneus da marca P1 terem percorrido, em média, mais

quilómetros. Admita a normalidade das populações e a igualdade das variâncias

112. O mercado accionista português apresentou estar mais volátil (maior

variabilidade) no ano de 1998 do que no de 1997. Para estudar esta situação,

seleccionaram-se aleatoriamente os valores de fecho do índice PSI-20 (Índice da

Bolsa de Derivados do Porto) para 31 dias de cada um destes anos, tendo sido

obtidos os seguintes valores:

31

,19971

225 180,84=

=∑ ii

x ( )31

2

,1997 19971

34 894 685,79=

− =∑ ii

x x

31

,19981

348 281,9=

=∑ ii

x ( )31

2

,1998 19981

68 483 7000=

− =∑ ii

x x

a) Obtenha um intervalo de confiança a 95% e 99% para a variância de cada um

dos anos.

b) Obtenha um intervalo de confiança a 95% para a razão de variâncias e comente

o resultado obtido.

113. Admita que o gerente de um banco está interessado em analisar a diferença entre

os valores esperados dos saldos das contas à ordem de duas das suas agências. Para

tal, de cada uma delas recolheu uma amostra aleatória de saldos, tendo-se registado

os seguintes resultados:

Agência Dimensão

da amostra

Média

amostral

Desvio-padrão

amostral

A 17 240 euros 13,50 euros

B 13 225 euros 12,05 euros

Admitindo a normalidade dos dados, calcule um intervalo de confiança a 90% e outro a

95% para a diferença entre os saldos médios das contas à ordem das agências A e B.

Admita os pressupostos necessários.

114. Para comparar a eficiência de dois métodos de ensino, uma turma de 24 alunos

foi dividida aleatoriamente em dois grupos, sendo aplicado um método diferente a

cada grupo. Os resultados no fim do semestre, numa escala de 0 a 100, foram os

seguintes:

Grupos Tamanho Amostra Média Variância I 13 74,5 82,6 II 11 71,8 112,6

Assumindo que as populações são normais e com variâncias iguais e desconhecidas,

obtenha um intervalo de confiança a 95% para a diferença entre os valores

esperados das duas populações. Comente.

115. Admita que uma amostra aleatória de 400 domicílios de uma determinada cidade

revelou que 8% destes são casas de aluguer, enquanto que, numa outra cidade, uma

amostra de 270 domicílios revelou que 37 eram casas de aluguer.

a) Construa um intervalo de confiança de nível 99% para a percentagem de casas

de aluguer em cada cidade.

b) Suponha que os intervalos de confiança, obtidos na alínea anterior, sejam

considerados pouco precisos. Qual deverá ser o tamanho das amostras para que

o erro de estimativa não exceda 2%?

c) Poderá afirmar estatisticamente, ao nível de 5%, que há maior percentagem de

casas de aluguer em alguma das duas cidades? Justifique.

116. As pilhas Duramais e Duramuito custam o mesmo preço. De forma a testar se

ambas têm a mesma duração, recolheram-se duas amostras de 100 pilhas de cada

marca, tendo-se obtido os seguintes resultados:

Marca Dimensão

da amostra Média Desvio-padrão

Duramais 100 1180 120

Duramuito 100 1160 40

Que pode concluir a um nível de significância de 5%? E a 1%?

117. Suponha que as produções médias de tecido (em gramas) de dois teares de uma

fábrica se podem considerar normais. Admita, ainda que numa experiência

efectuada com o objectivo de comparar esses dois teares, em termos das suas

produções médias, e obtiveram os seguintes resultados:

8 82 2

1 1

9 92 2

1 1

Tear 1: 80,8 gr 816,664 gr

Tear 2: 96,3 gr 1030,959 gr

= =

= =

= =

= =

∑ ∑

∑ ∑

i ii i

i ii i

x x

y y

a) Ao nível de significância de 5%, teste a igualdade de variância dos teares.

b) Compare, ao nível de significância de 1%, as produções médias dos dois teares.

Admita os pressupostos necessários.

118. Uma repartição de finanças tem dois funcionários a receber declarações de IRS,

o Sr. Vagaroso e o Sr. Caracol. Na semana passada foi destacado um novo Director

para esta repartição. Este, para ter uma ideia do tipo de atendimento ao público

realizado pelos seus funcionários, resolveu consultar o livro amarelo das

reclamações, onde verificou que grande parte das queixas apresentadas eram

respeitantes ao atendimento demasiado moroso do Sr. Vagaroso, especialmente

quando comparado com o tempo de atendimento do Sr. Caracol. Para testar a

veracidade destas afirmações, o director resolveu recolher uma amostra sobre o

tempo de atendimento, em minutos, despendido por cada um destes funcionários

com cada utente. Os resultados amostrais obtidos foram os seguintes:

Funcionário ni ix 'is

Sr. Caracol 16 22 20

Sr. Vagaroso 21 29 12

a) Teste a hipótese de igualdade das variâncias populacionais (considere α = 1%).

b) Supondo que os tempos de atendimento de cada um dos funcionários seguem

uma distribuição normal, construa um intervalo de confiança a 99% para a

diferença entre os tempos médios de atendimento dos dois funcionários.

Comente os resultados a que chegou.

c) Supondo que os tempos de atendimento de cada um dos funcionários seguem

uma distribuição normal, decida se o director deve ou não concordar com as

queixas dos utentes, ao nível de significância de 5%.

d) Teste a hipótese da variância do tempo de atendimento do Sr. Caracol ser igual a

350, ao nível de significância de 1%.

119. Suponha que uma determinada empresa de cigarros enviou para um laboratório

amostras de tabaco tratado por dois processo diferentes, tendo sido obtidos os

seguintes resultados para cinco medições do conteúdo de nicotina, por mg:

Processo A 24 27 26 21 24

Processo B 27 28 23 31 26

Admitindo que os conteúdos de nicotina, por mg, seguem distribuições normais com

desvios padrões iguais a 2 para o processo A e a 2.5 para o processo B, que pode

concluir ao nível de 5%? E ao nível de 1%?

120. Um analista financeiro pretende comparar as rendibilidades de dois activos

financeiros X e Y. Admitindo que as rendibilidades seguem uma distribuição

normal com desvios padrões iguais a 0.7 e 0.5 respectivamente, que poderá concluir,

ao nível de 5%, se numa amostra de dimensão 50 a rendibilidade média de X foi

igual a 0.8 e a de Y igual a 0.6?

121. Uma revista de desporto afirma que as pessoas que assistem aos jogos de futebol

transmitidos na TV são em igual número homens e mulheres. De forma a testar tal

afirmação, recolheu-se uma amostra aleatória de 400 pessoas que assistem a

transmissões futebolísticas na TV, das quais se verificou que 220 eram homens.

a) Que concluir acerca da notícia da revista, a um nível de significância de 10%? E

a 5%?

b) Determine o valor do limiar de significância associado ao teste anterior.

104.

a) 6.341 0.1= +⌢y x

b) Para testar a significância do modelo, testamos as hipóteses 0 2

1 2

: 0

: 0

= ≠

β

β

H

H.

Como ( ) ( )95% 2IC 0,059;0,141β = , rejeita-se H0 ao nível de 5%.

c) R2 = 0.699

d) ( ) ( )95% ˆIC y 4,98;57,70 .=

105.

a) 17,776 2,246y x= +⌢

b) Pretendemos testar as hipóteses0 2 1 2: 0 vs : 0= >H Hβ β . O valor de prova

associado é p=0, logo rejeita-se sempre a hipótese H0.

c) R2 = 0,854

d) 15 horas.

106.

a) ˆ 11,964 12,917y x=− +

b) 190 km

c) ( ) ( )95% 1 2IC 6,448;7,448µ −µ = −

107.

a) ( )32,96 1,42x

y=⌢ e r = 0.9997

b) Não, porque para o ajustamento de 20,6 44,171y x=− +⌢, obtém-se R2 = 0,9298.

c) 544,87.

108.

a) γ = 1,40 e C = 1,60×104.

b) R2 = 0,9972 e r = 0,9986.

c) 25,36.

109.

0

1

:

: , , , :

= = ∃ = ≠

A B C

i j

H p p p

H i j A B C p p

Como 2 6,0χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,996,0 9,21χ χ= < = .

110.

( )0

1

: 0.2

:

H X P

H X ( )0.2

P

Como 2 4,94χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,994,94 9,21χ χ= < = .

111.

Estimando o parâmetro da distribuição exponencial pelo método da máxima verosimilhança, queremos testar:

( )0

1

: 0.2

:

H X Exp

H X ( )xp 0.2

E

Como 2 2,65χ = , não se rejeita H0 ao nível de 5%, pois2 23;0,952,65 7,81χ χ= < = .

112.

Estimando a média e a o desvio padrão através de estimadores centrados, queremos testar:

( )0

1

: 11.73;3.60

:

H X N

H X ( )11.73;3.60

N

Como ( )max{ , } 0,1628 0,05 0,319+ −= = < =tabD d d D , não se rejeita H0 ao nível de

5%. 113.

( )0

1

: 55;8

:

H X N

H X ( )55;8

N

Como ( )max{ , } 0,3530 0,01 0,489tabD d d D+ −= = < = , não se rejeita H0 ao nível de

1%. 114.

Estimando a média e a o desvio padrão através de estimadores de máxima verosimilhança, queremos testar:

( )0

1

: 5.375;5.57

:

H X N

H X ( )5.375;5.57

N

Como 2 1026,8χ = , rejeita-se H0 ao nível de 5%, pois2 23;0,951026,8 7,81χ χ= > = .

115.

As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2,3,4, 1,2,3

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 19,34χ = , rejeita-se H0 ao nível de 1%, pois2 26;0,9919,38 16,8χ χ= > = .

116.

Estimando o parâmetro da distribuição Poisson pelo método da máxima verosimilhança, queremos testar:

( )0

1

: 3.52

:

H X P

H X ( )3.52

P

Como 2 4,32χ = , não se rejeita H0 ao nível de 5%, pois2 24;0,954,32 9,49χ χ= < = .

117.

As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2,3, 1,2.

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 3,61χ = , logo não se rejeita H0 ao nível de 5%, pois 2 22;0,953,61 5,99χ χ= < = e

p-value =0,179 > α=0,05. 118.

A hipótese a testar é:0 1 2 3: 0,10; 0,40; 0,50H p p p= = =

Como 2 134=χ , rejeita-se H0 ao nível de 5%.

119.

As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2, 1,2,3,4

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 4,69χ = , rejeita-se H0 ao nível de significância de 1%.

120.

b) As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2, 1,2,3

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 152,22χ = , rejeita-se H0 ao nível de significância de 5%.

121.

As hipóteses a testar são ( )0

1

: 152.17,28.72

:

H X N

H X ( )152.17,28.72

N.

Pelo valor de prova p=0,985, concluímos que não se rejeita a H0 aos níveis usuais de

significância.

1. c) média=13,1 , mediana=14, moda = 14 d) 1º quartil = 11, 2º quartil = 14, 3ºquartil = 15 e) variância = 8,52, desvio padrão = 2,918 f) coeficiente variação = 22,27% g) g = -0,308, distribuição assimétrica negativa h) k = 0,235,< 0,263 distribuição leptocúrtica. 2. b) média = 2,23, mediana = 2, moda = 1, desvio padrão = 1,407 d) 1º quartil = 1, 2º quartil = 2, 3º quartil = 3 f) g = 0,874, distribuição assimétrica positiva. k = 0,333>0,263, distribuição platicútica 3. b) desvio padrão = 18,89 c) mediana = 37,14 3º quartil = 52,11 5º percentil = 11,44 d) coeficiente de variação = 47,57% e) 3º momento = 3136,53 4º momento = 312890,36 f) i) verdadeiro ii) verdadeito h) G = 0,222 4. b) mediana = 11,5 c) i) F ii) V d) 58% 5. a) 12,5 b) V 6. b) F

7.

a) 0,348 b) 0,048 c) 0,652 d) 0,167

8.

a) 2/5 b) 2/5 c) 4/25 d) 6/25 e) i) 2/5

ii) 2/5 iii) 1/10

iv) 3/10 9.

a) 0,4 b) 0,5

10. 1/3 12.

a) 0,12 b) 0,511

13. a) 0,20 b) 0,20

14. a) 0,70 b) 0,27

15. a) ( )

1/8;x 0

3/8;x 1

P X x 3/8;x 2

1/8;x 3

0;c.c.

= == = = =

c) 1,5

d) P(X ≤1) = 1/2.

e) ( ) ( )

0; x 0

1/8; 0 x 1

F x P X x 4/8; 1 x 2

7 /8; 2 x 3

1; x 3.

< ≤ <= ≤ = ≤ < ≤ < ≥

f) 0,87

16. a) ( )

0,9989;x 0

0,0010;x 5000P X x

0,0001;x 50000

0;c.c.

= == = =

b) 10 euros 17. –0,59 € 18. a) 0,4

b) ( ) ( )

0,1;x 1

0,3;x 2f x P X x

0,5;x 3

0,1;x 4.

= == = = = =

c) E[X] = 2,6; Var[X] = 0,64 d) E[2X] = 5,2; Var[3X] = 5,76

19. a) P(X ≤ 1) = 0,66

b) P(X > 3) = 0,05 c) 1,12 d) 1,202

20. a)

X\Y 0 1 0 0,7 0 1 0 0,2 2 0,1 0

b) ( )0,8;y 0

P Y y 0,2;x 1

0;c.c..

== = =

c) P(X=2 | Y=0) = 0,125 21. a) 0,1

b) Sim, porque as variáveis não são independentes. c) E[Y] = 1,1; Var[Y] = 0,49 d) 7,99

22. a) Sim, porque as variáveis não são independentes.

b) E[X] = 3,49; E[Y] = 1,85 c) E[X | Y=2] = 3,26; E[X | Y=4] = 4

23. a) 0,254 b) 0,733 24. 0,377 25. a) 0,132 b) 0,790 c) 0,165

26. a) ( ) k n k4P X k 0,9 0,1 ;k 0,1,2,3,4

k−

= = =

b) 0,3439 c) 0,9999 27. a) 0,093 b) 0,614 c) 6,67 28 a) 0,983 b) 0,017

c) 0,966 d) i) 0,983 ii) 0,934 iii) 58,8 29. a) 0,929 b) 0,950 30. a) 0,057 b) 0,809 31. a) 0,996 b) 0,607 32. a) 0,143 b) 2 c) 1,78 d) 0,22 33. 0,063

34. b) ( )

0;x 0

xF x ;0 x 3

31;x 3

≤= < < ≥

c) 2/3 d) E[X] = 1,5; Var[X] = 0,75

35. a) ( )2

0;x 0

x xF x ;0 x 3

12 121;x 3

<= + ≤ ≤ >

E[X] = 15/8 Mediana = 2

b) 2,63 c) ( ) ( )P X 2 1/ 2; P 1 X 2 1/3≥ = ≤ ≤ =

d) Var[X] = 39/64 36. a) 1/8

b) E[Y] = 17/6 c) Mediana X = 0,764

d) Não, porque f(x,y) ≠ f(x)f(y)

37. a) 1/96

b) 15/384 c) 21/384

d) ( )2

0;x 0

xF x ;0 x 4

161;x 3

≤= < < ≥

e) ( )2

0;x 1

y 1F y ;1 y 5

24 241;x 5

≤= − < < ≥

f) E[X] = 8/3; E[Y] = 31/9; E[XY] = 248/27. Sim, são independentes pois E[XY] = E[X]E[Y]

38. a) ( )5, 0.85 x 1.05

f x0, c.c

≤ ≤=

b) 0,75

39. a) ( ) ( )0,5t

-0,5t

0, t 05e , t 0f x ; F t

0, t<0 1-e , t>0

− ≤ ≥ = =

b) 0,6065 c) 0,8647 d) 0,0302 40. 3.28 euros. 41. a) i) 0,0401 ii) 0,2810 iii) 0,4649 b) i) a = 79,98 ii) b = 41,40 42. 80,78% com notas inferiores e 19,22% com notas superiores. 43. a) 0,0228 b) Deve aumentar em 7,8 toneladas. 44. a) 0,6826 b) 0,8759 45. 0,0294 46. 16,56 47. 5.20 euros 48. 0,9986 49. 0,7517 50. 0,1904

51. a) 0,9974 b) 0,5 c) 5 52. a) 0,383 b) 13h55m c) 0,31 53. a) 0,95 b) Verdadeira c) 56,51

54. a) P4

1

300=

> ∑ ii

X =0,0013

b) i) ( )60P X > =0,5

ii) ( )40 60P X≤ ≤ =0,5 55. ( )12300P X > =0,1446 56. ( )3,4P X > =0,0228

57. 60

1

470=

≥ ∑ ii

P X =0,9015

58. a) ( )ˆ 0,03≥P p =0,1056

b) ( )ˆ 0,02≤P p =0,5714 59. Caso n=20, ( )ˆ 0,3>P p =0,0808

Caso n=100, ( )ˆ 0,3>P p =0,0043 60. a) ( )ˆ 0,5>P p =0,0681

b) ( )ˆ 0,5>P p =0,0004

61. a) 3 5

,2 2

T N µ σ

b) Como [ ] 3

2E T µ= , T não é um estimador centrado nem consistente.

62. 2 2 2 21

11 e n nE S E S

nσ σ−

= − = , logo 2

nS não é centrado, mas 2 1nS − é centrado.

63. [ ]E T θ= , logo T é centrado para θ.

64. a) 1λ⌢

é um estimador centrado e consistente

2λ⌢

é um estimador centrado, mas não é consistente

b) 1λ⌢

é mais eficiente do que 2λ⌢

.

65. O estimador 2θ⌢

é preferível pois é mais eficiente do que1

⌢θ .

66. O estimador 2µ por ser mais eficiente que o estimador 1µ . 68. a) ˆ =p X b) ˆ 1/ 6=p 69. Para a função 1f (x) x , 0 x 1, 0θ−= θ < < θ > , tem-se:

a) 1

=−

⌢ X

b)

( )1

ln=

= −∑

n

ii

n

70. a) 1

2

3

Xα −=⌢

c) O melhor estimador é 1α⌢ , pois é mais eficiente do que 2

⌢α .

d) 1 1/ 6α =⌢

71. Tem-se:

( ) ( )( )

n2

i2i 1

1n x22 2 2L , | x 2 .e =

− −µ− σ ∑µ σ = πσ

( ) ( ) ( )n

22 2i2

i 1

1 1ln L , | x n ln 2 ln x

2 2 =

µ σ = − π + σ − − µ σ ∑

( )

( )

n

ii 1

2

n2

ii 1

2 2 4

xd ln L

d

xd ln L n

d 2 2

=

=

− µ=

µ σ − µ

= − + σ σ σ

Consequentemente, ( )22 2272,76 e 187,27= = = =⌢ ⌢X Sµ σ

72. 1

Xλ =⌢

73. a) (7,53; 8,13) b) n ≥ 68 74. (25354,64; 29345,36)

75. a) n ≥ 16 b) n ≥ 27 c) Sim, porque em ambas a dimensão da amostra é inferior a 30. 76. a) (98,84; 101,12) b) (3,40; 12,56) 77.

a)

( )( )( )

90%

95%

99%

(0,521;0,579)

(0,515;0,585)

(0,504;0,596)

=

=

=

IC p

IC p

IC p

b) (0,519; 0,581) 78. n ≥ 385 79. Para 3% vem n ≥ 1068; para 1% vem n ≥ 9604 80. a) (0,07; 0,09) b) Para reduzir a amplitude para 0,01: Se p for conhecido e igual a 0,0825, n ≥ 11632

Se p não for conhecido toma-se p =0,5, vindo n ≥ 38416

81. a) 0

1

: 8

: 8

H

H

µ

µ

= >

Como T=12,13 rejeita-se H0 ao nível de 5%. b) Erro do tipo I.

82. 0

1

: 100

: 100

H

H

µ

µ

= ≠

Como T= -2,20 não se rejeita H0 ao nível de 1%.

83. a) 0

1

: 55

: 55

H

H

µ

µ

= ≠

Como Z= 0,79 não se rejeita H0 ao nível de 5%. b) β=P(Erro Tipo II) = 0,492. c) n ≥27

84. a) 0

1

: 1000

: 1000

H

H

µ

µ

= ≠

Como Z= -2,4 rejeita-se H0 ao nível de 5%. b) β=P(Erro Tipo II) = 0,6406

85. a) α=P(erro Tipo I) = 0,0013 b) β=P(erro Tipo II) = 0,9332 c) n ≥ 66. 86. a) (0,535: 0,665) b) n ≥ 873

c) 0

1

: 0,5

: 0,5

= >

H p

H p

Como Z= 2,97 rejeita-se H0 ao nível de 5%.

87. 2

0

21

: 250000

: 250000

= ≠

H

H

σ

σ

Como χ2= 6,25 não se rejeita H0 ao nível de 5%. 88. a) ( ) ( )95% 54,4;93,6=µIC

b) Erro do tipo I. c) 0,7967

d) 2

0

21

H : 2500

H : 2500

= ≠

σ

σ

Como 2 34.56Χ = , não se rejeita H0 ao nível de 10%.

89.

a) 0

1

H : p 0.8

H : p 0.8

= >

Como Z 2.5= , rejeita-se H0 ao nível de 5% e ao nível de 1%. b) p = 0,0062.

90. ( )0A BP X X− > =0 91. ( )1 21 1P X X− ≤ − ≤ =0,1185 92. a) ( )1 2 1P X X− > =0,0212

b) ( )1 2/ 1P S S > =0,9244 93. ( )1 2 0P X X− > =0 94.

a)

( )( )( )( )

295% 1997

299% 1997

295% 1998

299% 1998

(742440,1; 2077064,6)

(649807,9; 2528600,4)

(14571000,0; 40764107,1)

(12753016,8; 49625869,6)

=

=

=

=

IC

IC

IC

IC

σ

σ

σ

σ

b) (9,48; 40,63)

95. ( )( )

90% 1 2

95% 1 2

(6,92;23,08)

(5,27;24,73)

− =

− =

IC

IC

µ µ

µ µ

96. (-5,64; 11,04) 97.

a) ( ) ( )( ) ( )

99% 1

99% 2

0,045;0,115

0,083;0,191

=

=

IC p

IC p

b) 1

2

1221

1962

n

n

c) 0 1 2

1 1 2

: 0

: 0

− = − ≠

H p p

H p p

Como Z= -2,29 rejeita-se H0 ao nível de 5%.

98. 0 1 2

1 1 2

: 0

: 0

− = − ≠

H

H

µ µ

µ µ

Como Z= 1,58 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%.

99. a) 2 2

0 1 2

2 21 1 2

H :

H :

= ≠

σ σ

σ σ

Como F=1,20 não se rejeita H0 ao nível de 5%.

b) 0 1 2

1 1 2

: 0

: 0

− = − ≠

H

H

µ µ

µ µ

Como T=-4,49 rejeita-se H0 ao nível de 1%.

100. a) 2 2

0 1 2

2 21 1 2

H :

H :

= ≠

σ σ

σ σ

Como F=2,78 não se rejeita H0 ao nível de 1% b) (-21,42; 7,42)

c) 0 1 2

1 1 2

: 0

: 0

− = − <

H

H

µ µ

µ µ

Como T= -1,32 não se rejeita H0 ao nível de 5%.

d) 2

0 1

21 1

: 350

: 350

= ≠

H

H

σ

σ

Como χ2= 17,14 não se rejeita H0 ao nível de 1%.

101. 0

1

: 0

: 0

− = − ≠

A B

A B

H

H

µ µ

µ µ

Como Z= -1,82 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%.

102. 0

1

: 0

: 0

− = − ≠

X Y

X Y

H

H

µ µ

µ µ

Como Z= 1,64 não se rejeita H0 ao nível de 5%. 103.

a) 0 1 2

1 1 2

: 0

: 0

− = − ≠

H p p

H p pou 0

1

: 0,5

: 0,5

= ≠

H p

H p

Como Z=2 rejeita-se H0 ao nível de 5%. b) valor-prova = p = 0,0456.

104.

a) 6.341 0.1= +⌢y x

b) Para testar a significância do modelo, testamos as hipóteses 0 2

1 2

: 0

: 0

= ≠

β

β

H

H.

Como ( ) ( )95% 2IC 0,059;0,141β = , rejeita-se H0 ao nível de 5%.

c) R2 = 0.699

d) ( ) ( )95% ˆIC y 4,98;57,70 .=

105.

a) 17,776 2,246y x= +⌢

b) Pretendemos testar as hipóteses0 2 1 2: 0 vs : 0= >H Hβ β . O valor de prova

associado é p=0, logo rejeita-se sempre a hipótese H0.

c) R2 = 0,854

d) 15 horas.

106.

a) ˆ 11,964 12,917y x=− +

b) 190 km

c) ( ) ( )95% 1 2IC 6,448;7,448µ −µ = −

107.

a) ( )32,96 1,42x

y=⌢ e r = 0.9997

b) Não, porque para o ajustamento de 20,6 44,171y x=− +⌢, obtém-se R2 = 0,9298.

c) 544,87.

108.

a) γ = 1,40 e C = 1,60×104.

b) R2 = 0,9972 e r = 0,9986.

c) 25,36.

109.

0

1

:

: , , , :

= = ∃ = ≠

A B C

i j

H p p p

H i j A B C p p

Como 2 6,0χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,996,0 9,21χ χ= < = .

110.

( )0

1

: 0.2

:

H X P

H X ( )0.2

P

Como 2 4,94χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,994,94 9,21χ χ= < = .

111.

Estimando o parâmetro da distribuição exponencial pelo método da máxima verosimilhança, queremos testar:

( )0

1

: 0.2

:

H X Exp

H X ( )xp 0.2

E

Como 2 2,65χ = , não se rejeita H0 ao nível de 5%, pois2 23;0,952,65 7,81χ χ= < = .

112.

Estimando a média e a o desvio padrão através de estimadores centrados, queremos testar:

( )0

1

: 11.73;3.60

:

H X N

H X ( )11.73;3.60

N

Como ( )max{ , } 0,1628 0,05 0,319+ −= = < =tabD d d D , não se rejeita H0 ao nível de

5%. 113.

( )0

1

: 55;8

:

H X N

H X ( )55;8

N

Como ( )max{ , } 0,3530 0,01 0,489tabD d d D+ −= = < = , não se rejeita H0 ao nível de

1%. 114.

Estimando a média e a o desvio padrão através de estimadores de máxima verosimilhança, queremos testar:

( )0

1

: 5.375;5.57

:

H X N

H X ( )5.375;5.57

N

Como 2 1026,8χ = , rejeita-se H0 ao nível de 5%, pois2 23;0,951026,8 7,81χ χ= > = .

115.

As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2,3,4, 1,2,3

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 19,34χ = , rejeita-se H0 ao nível de 1%, pois2 26;0,9919,38 16,8χ χ= > = .

116.

Estimando o parâmetro da distribuição Poisson pelo método da máxima verosimilhança, queremos testar:

( )0

1

: 3.52

:

H X P

H X ( )3.52

P

Como 2 4,32χ = , não se rejeita H0 ao nível de 5%, pois2 24;0,954,32 9,49χ χ= < = .

117.

As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2,3, 1,2.

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 3,61χ = , logo não se rejeita H0 ao nível de 5%, pois 2 22;0,953,61 5,99χ χ= < = e

p-value =0,179 > α=0,05. 118.

A hipótese a testar é:0 1 2 3: 0,10; 0,40; 0,50H p p p= = =

Como 2 134=χ , rejeita-se H0 ao nível de 5%.

119.

As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2, 1,2,3,4

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 4,69χ = , rejeita-se H0 ao nível de significância de 1%.

120.

b) As hipóteses a testar são 0 . .

1 . .

:

: , , : , 1,2, 1,2,3

= × ∃ ≠ = × = =

ij i j

ij i j

H p p p

H i j i j p p p i j

Como 2 152,22χ = , rejeita-se H0 ao nível de significância de 5%.

121.

As hipóteses a testar são ( )0

1

: 152.17,28.72

:

H X N

H X ( )152.17,28.72

N.

Pelo valor de prova p=0,985, concluímos que não se rejeita a H0 aos níveis usuais de

significância.

Aulas Laboratoriais em SPSS

1. Abordagem inicial ao SPSS Conhecimento básico dos Menus

• File, Edit: Menus idênticos aos existentes em qualquer software. Servem para abrir, guardar, imprimir, etc, ficheiros.

• View: Muda a fonte em que se escrevem os dados, permite visualizar o rótulo das variáveis.

• Data: Funções relacionadas com a alteração estrutural do ficheiro de dados. Menu onde se inserem e definem as variáveis a utilizar

• Transform: É usado para calcular novos valores e variáveis e recodificar variáveis, nomeadamente, é utilizado para a construção de classes.

• Analyse: Menu que contém as ferramentas de análise, desde as ferramentas da estatística descritiva, como a construção de distribuições de frequências e a regressão, até à análise dos dados através de análise de variância, séries temporais, análise de sobrevivência, testes não paramétricos, dados categorizados, etc, etc

• Graphs: Construção de todo o tipo de gráficos. 2. Introdução dos dados

• Introduzir dados: File →New→data

o Tipo de variáveis: numéricas, de caracteres, etc. - Data → Define variable o Definição do nome da variável (Só pode ter no máximo 8

caracteres e começar por uma letra) → Variable Name

o Tipo: String, Numeric.. →Type

o Formato: Nominal, Ordinal, Scale. →Measurement

o Rótulos: Nome do rótulo → Labels→ Value Label 0 – Mascluino

1 - Feminino o Gravar ficheiro o Abrir Ficheiro

• De um ficheiro Excel É necessário que o Excel tenha os dados num formato que seja possível o SPSS ler: no ficheiro do psi20 a coluna da data tem de ser alterada para dias, 1, 2, 3... e o nome das variáveis só pode ter, no máximo, oito caracteres. → File → Open →ficheiro do tipo *.xls

• De um ficheiro para SPSS → File → Open →psi20.sav

3. Estatística Descritiva

• Caracterizar a variável na folha Variable View • Analyze → Descriptive Statistic → Frequenceis

- Escolha das variáveis - Quadro de frequências - Analisar as opções: Statistics, Graphs.

• Representações gráficas - Gráficos de barras - Box-Plot - Histogramas

Aula Laboratorial de Regressão Linear Simples

Exercício 1 Os dados seguintes referem-se a uma amostra de observações sobre o número de horas

de estudo para a 3ª frequência de Probabilidades e Estatística (X) e a nota do aluno na

frequência numa escala de 0 a 100 (Y).

Aluno X Y

1 12 45

2 8 40

3 40 95

4 2 15

5 5 23

6 7 32

7 25 75 8 30 89

9 17 76

10 9 48

11 15 67

12 14 39

13 10 31

14 6 23

a) Represente o diagrama de dispersão.

b) Admitindo que a relação entre as variáveis X e Y é linear, estime os parâmetros

β1 e β2 do modelo de regressão correspondente.

c) Interprete o valor de β2.

d) Teste, ao nível de significância de 5%, a significância do modelo de regressão.

e) Obtenha intervalos de confiança a 95% para β1 e β2.

f) Poderá afirmar, estatisticamente ao nível de 5%, que um aluno que não tenha

estudado terá uma nota superior a 0. E superior a 2 valores?

g) Poderá afirmar, estatisticamente ao nível de 1%, que existe uma relação linear

positiva entre X e Y?

h) Determine os coeficientes de correlação e determinação e interprete os seus

valores.

i) Determine uma estimativa pontual e uma estimativa intervalar para a nota de um

aluno que tenha estudado 11 horas.

j) Realize uma análise de resíduos e retire as conclusões que entender

convenientes.

Outputs

Model Summary b

,924a ,853 ,841 10,3499Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Tempo de estudo (em horas)a.

Dependent Variable: Nota na 3ª frequênciab.

Descriptive Statistics

49,8571 25,9492 14

14,2857 10,6730 14

Nota na 3ª frequência

Tempo de estudo(em horas)

Mean Std. Deviation N

Tempo de estudo (em horas)

50403020100

Not

a na

3ª f

requ

ênci

a

100

80

60

40

20

0

Coefficients a

17,776 4,734 3,755 ,003 7,460 28,091

2,246 ,269 ,924 8,350 ,000 1,660 2,832

(Constant)

Tempo de estudo(em horas)

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig. Lower Bound Upper Bound

95% Confidence Interval for B

Dependent Variable: Nota na 3ª frequênciaa.

Normal P-P Plot of Regression Standardized Residual

Dependent Variable: Nota

Observed Cum Prob

1,0,8,5,30,0

Exp

ect

ed C

um

Pro

b

1,0

,8

,5

,3

0,0

Scatterplot

Dependent Variable: Nota

Regression Standardized Predicted Value

3210-1-2

Re

gre

ssio

n S

tan

dard

ized

Res

idu

al

2,0

1,5

1,0

,5

0,0

-,5

-1,0

-1,5

One-Sample Kolmogorov-Smirnov Test

14,0000000

,96076892,156,156

-,102,582,887,837,000

NMeanStd. Deviation

Normal Parametersa,b

AbsolutePositiveNegative

Most ExtremeDifferences

Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Point Probability

StandardizedResidual

Test distribution is Normal.a.

Calculated from data.b.

Exercício 2: Os dados seguintes referem-se a uma amostra de observações sobre a despesa mensal

em bens e em serviços culturais (Y) e o rendimento mensal per capita (X) de 14

agregados familiares.

Y 0 44 15 52 39 1 40 2 34 46 22 26 1 57

X 50 250 110 480 190 80 210 90 150 310 120 150 70 650

a) Represente o diagrama de dispersão.

rendimento mensal per capita

7006005004003002001000

desp

esa

men

sal e

m b

ens

e s

erv

iços

cul

tura

is

60

50

40

30

20

10

0

-10

b) Teste, ao nível de 1%, a normalidade das populações. Utilize o teste de

Kolmogorov-Smirnov e um método gráfico.

Como os valores de prova para ambas as populações são iguais a p = 0.899, concluímos

que não se rejeitam as hipóteses de normalidade com os parâmetros estimados.

c) Admitindo que a relação entre as variáveis X e Y é linear, estime os parâmetros β1 e

β2 do modelo de regressão correspondente e interprete os seus valores.

O modelo de regressão é y = 6.3412 + 0.0997x. O parâmetro 2β = 0.0997 significa que

por cada acréscimo de uma unidade do rendimento mensal per capita, a despesa mensal

em bens e serviços culturais aumenta, em média, 0.0997 unidades. O parâmetro 1β =

6.3412, neste caso, não tem interpretação, pois não faz grande sentido existir uma

despesa mensal, em média, igual a 6.3412 em serviços e bens culturais quando o

rendimento per capita é nulo.

d) Construa os intervalos de confiança a 95% para β1 e β2. Pela observação do output anterior concluímos que, ao nível de confiança de 95%, os

intervalos de confiança para β1 e β2 são:

e) Teste, ao nível de significância de 5%, se o modelo é significativo. Pretendemos testar a hipótese H0: β2 = 0 vs H1: β2 ≠ 0. Pelos intervalos de confiança,

através do valor de prova (p=0,000<0,05), ou mesmo mediante o valor da estatística de

Coefficients a

6,341 5,015 1,264 ,230 -4,585 17,268

9,973E-02 ,019 ,836 5,275 ,000 ,059 ,141

(Constant)

rendimentomensal per capita

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig. Lower Bound Upper Bound

95% Confidence Interval for B

Dependent Variable: despesa mensal em bens e serviços culturaisa.

( ) ( )( ) ( )

95% 1

95% 2

4,59; 17,27

0,059; 0,141

IC

IC

β

β

= −

=

One-Sample Kolmogorov-Smirnov Test

14 14

207,8571 27,0714

171,02310 20,40537

,209 ,176

,209 ,176

-,178 -,149

,783 ,659

,572 ,778

,899 ,899

,000 ,000

N

Mean

Std. Deviation

Normal Parametersa,b

Absolute

Positive

Negative

Most ExtremeDifferences

Kolmogorov-Smirnov Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Point Probability

X Y

Test distribution is Normal.a.

Calculated from data.b.

teste (t=5,275), concluímos que ao nível de 5% rejeitamos a hipótese de β2 ser nulo, ou

seja, a regressão entre o rendimento mensal per capita e a despesa mensal em bens e

serviços culturais é significativa.

f) Poderá afirmar, estatisticamente ao nível de 1%, que o declive da recta é positivo,

isto é, que X e Y variam linearmente no mesmo sentido?

Pretendemos testar a hipótese H0: β2 = 0 vs H1: β2 > 0. De acordo com o output da

tabela anterior tem-se p/2=0,000≤α=0,01, pelo que se rejeita H0 ao nível de 1% e

podemos concluir que o rendimento e a despesa mensal se relacionam positivamente.

g) Teste, ao nível de significância de 5%, a hipótese H0: β1 = 0 vs H1: β1 ≠ 0.

Da mesma forma que em d), pela observação do intervalo de confiança, pelo valor de

prova (p=0,230>0,05) ou pela estatística de teste (t=1,264) não rejeitamos a hipótese de

β1 ser nulo, ou seja, de a recta passar pela origem, o que significa que quando o

rendimento mensal per capita é nulo a despesa mensal em bens e serviços culturais

também pode ser considerada nula.

h) Teste, ao nível de significância de 5%, a hipótese H0: β2 = 0.1 vs H1: β2 ≠0.1.

Sob H0 tem-se

02 2n 2

xx

ˆt

QMES

β β−

−∩ onde ( )

n2

xx ii 1

S X X=

= −∑ e

n2i

i 1

eQME

n 2==−

e, atendendo a que xx

QME0,019

S= (desvio padrão de β2)

o valor da estatística de teste é 02 2

xx

ˆ 0,09973 0,1T 0,014

0,019QMES

β β− −= = = , valor que não

pertence à região crítica ( )12, 0.975 12, 0.975Rc , -t t , + = −∞ ∪ ∞ =( ] [ ), -2.179 2.179, +−∞ ∪ ∞ ,

pelo que não se rejeita H0 ao nível de 5%.

A mesma conclusão poderia ter sido obtida através da dualidade entre testes bilaterais e

intervalos de confiança. Observe-se que neste caso não rejeitamos a hipótese nula uma

vez que o valor a testar em H0 (β2=0,1) pertence ao intervalo de confiança a 95% para

β2 ( )0,059; 0,141.

i) Teste, ao nível de significância de 5%, a hipótese H0: β1 = 6 vs H1: β2 >6.

Sob H0 tem-se

01 1n 2

2

xx

ˆt

1 XQME

n S

β β−

−∩

+

e, atendendo a que 2

xx

1 XQME 5,015

n S

+ = (igual ao desvio padrão de β1)

o valor da estatística de teste é 01 1

2

xx

ˆ 6,341 6T 0,068

5,0151 XQME

n S

β β− −= = =

+

, valor que não

pertence à região crítica )12, 0.95Rc t , += ∞ =[ )1.782, +∞ , pelo que não se rejeita H0 ao

nível de 5%.

j) Determine os coeficientes de correlação e determinação e interprete os seus valores.

O valor do coeficiente de correlação é R=0,836, pelo que a associação entre as duas

variáveis é forte e positiva (ao aumento do rendimento per capita corresponde um

aumento da despesa mensal em bens e serviços culturais).

O valor do coeficiente de determinação é R2 = 0.699, o que indica um razoável

ajustamento da recta aos dados, pois a recta de regressão apenas consegue explicar

69.9% da variabilidade das observações. Portanto, com base na amostra considerada,

podemos afirmar que 69.9% da variação total das despesas é explicada pelo rendimento

- os demais factores, que não o rendimento, explicam ainda 30.1% das despesas.

k) Qual a estimativa pontual da despesa mensal em bens e serviços para uma família

que apresenta um rendimento per capita igual a 250?

Com a recta de regressão é dada por y =6,3412 + 0,0997x, se x = 250, tem-se

Model Summary

,836a ,699 ,674 11,6577Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), rendimento mensal per capitaa.

y =6,3412+0,0997*250 = 31,2662

Logo, se o rendimento mensal per capita for igual a 250 espera-se que a despesa mensal

em bens e serviços seja igual a 31,27 unidades.

l) Obtenha um intervalo de predição a 95% para a despesa em bens e serviços para um

rendimento per capita igual a 250. (Utilize os outputs anteriores e o output

seguinte).

Descriptive Statistics

14 27,0714 20,40537

14 207,8571 171,02310

14

despesa mensal embens e serviços culturais

rendimento mensal percapita

Valid N (listwise)

N Mean Std. Deviation

Um intervalo de predição a (1-α)100% é dado pela expressão

( )( ) ( )2 2

0 095% 0 n 2,1 / 2 0 n 2,1 / 2

xx xx

x x x x1 1ˆ ˆIC y y t QME 1 , y t QME 1

n s n sα α− − − −

− − = − + + + + +

Atendendo a que ( )22xx xs (n 1)s ' 13 171,02310 380235.71= − = × = e a que

ˆ QME 11.6577σ= = , tem-se

( )( ) ( )

( )

2 2

95%

250 207.86 250 207.861 1IC y 31.27 2.179 135.90 1 , 31.27 2.179 135.90 1

14 380235.71 14 380235.71

4.92,57.62

⌢ − − = − + + + + +

=

Podemos concluir, com um nível de confiança de 95%, que a despesa para um

rendimento igual a 250 unidades monetárias se situará entre 4.92 e 57.62.

m) Realize uma análise de resíduos e retire as conclusões que entender convenientes.

3,000002,000001,000000,00000-1,00000

Standardized Predicted Value

1,50000

1,00000

0,50000

0,00000

-0,50000

-1,00000

-1,50000

Sta

ndar

dize

d R

esid

ual

1,00,80,60,40,20,0

Observed Cum Prob

1,0

0,8

0,6

0,4

0,2

0,0

Exp

ecte

d C

um P

rob

Normal P-P Plot of Standardized Residual

One-Sample Kolmogorov-Smirnov Test

14,0000000

,96076892,201,201

-,157,753,622,555,000

NMeanStd. Deviation

Normal Parametersa,b

AbsolutePositiveNegative

Most ExtremeDifferences

Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Point Probability

StandardizedResidual

Test distribution is Normal.a.

Calculated from data.b.

A análise de resíduos, apesar de confirmar a normalidade (valor p do teste de

Kolmogorov-Smirnov igual a 0,555), sugere que o modelo linear não será o mais

apropriado.

n) Em vez dos valores de X foram utilizados os seus logaritmos. Com base nos

outputs, escreva a equação do modelo de regressão e comente.

2,000001,000000,00000-1,00000-2,00000

Standardized Predicted Value

1,00000

0,00000

-1,00000

-2,00000

Sta

ndar

dize

d R

esid

ual

Foi ajustada uma regressão logarítmica: y = -108.042 + 26.622 ln(x). Podemos

concluir, com base na amostra considerada, que 91,5% da variação total é explicada

pelo modelo, pelo que o ajustamento obtido é bastante melhor que o conseguido através

do modelo de regressão linear.

Neste caso, a análise de resíduos confirma a normalidade dos resíduos (valor p do teste

de Kolmogorov-Smirnov = 0.982) e a sua representação contra os valores estimados de

y não leva a suspeitar de uma heterogeneidade de variâncias.

One-Sample Kolmogorov-Smirnov Test

14,0000000

,96076892,115,110

-,115,431,993,982,000

NMeanStd. Deviation

Normal Parametersa,b

AbsolutePositiveNegative

Most ExtremeDifferences

Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Point Probability

StandardizedResidual

Test distribution is Normal.a.

Calculated from data.b.

Coefficients a

-108,042 11,974 -9,023 ,000

26,622 2,337 ,957 11,393 ,000

(Constant)

VAR00003

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: VAR00002a.

Model Summary

,957a ,915 ,908 6,17832Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), VAR00003a.

Aula Laboratorial de Testes não Paramétricos

Exercício 1 Uma determinada empresa com representações no Porto e em Lisboa decide promover

um funcionário para um cargo de chefia. No processo de selecção do funcionário a

empresa pretende, antes de mais, averiguar se existem diferenças entre a competência

dos funcionários do Porto e a competência dos funcionários de Lisboa. Para tal foram

seleccionados ao acaso 10 funcionários de Lisboa e 9 do Porto, tendo estes sido sujeitos

a uma prova cotada de 0 a 20. Os resultados obtidos nas duas cidades foram os

seguintes:

a) Teste, ao nível de 5%, a normalidade das populações. Utilize o teste de

Kolmogorov-Smirnov e um método gráfico.

b) Pretende-se concluir se, ao nível de 5%, existem diferenças significativas entre a

competência dos funcionários de Lisboa e os do Porto.

a. Indique as hipóteses a testar.

b. Realize o teste de Wilcoxon-Mann-Whitney e interprete os resultados

obtidos.

c) Aplique um teste paramétrico para testar a hipótese de as respostas médias ao

teste serem iguais.

d) Determine intervalos de confiança a 95% para os resultados médios em Lisboa e

no Porto e para a diferença média dos resultados.

Exercício 2

Num inquérito sobre a participação de homens e mulheres na aquisição de bens, foram

inquiridos 15 casais, com idades compreendidas entre os 35 e os 55 anos, tendo-lhes

sido pedido que classificassem o seu grau de influência nas compras da casa, numa

escala de 0 a 10. Os resultados obtidos foram os seguintes:

a) Com base num teste não paramétrico adequado, retire as conclusões que achar

convenientes.

b) Aplique um outro teste não paramétrico e compare as conclusões obtidas.

Exercício 3

Como parte de um estudo sobre a necessidade de assistir às aulas teóricas de

Probabilidades e Estatística foi pedido a um grupo de 10 alunos para realizar um

determinado teste antes da matéria ser leccionada na aula teórica. Ao mesmo grupo foi

posteriormente leccionada a aula teórica sobre a matéria do teste e pedido que

efectuasse um teste análogo ao primeiro. As classificações registadas para os dois testes

foram:

Classificação do teste (0-100)

Aluno 1 2 3 4 5 6 7 8 9 10

Antes da aula 18 79 91 75 68 43 33 85 22 56

Depois da aula 85 85 83 71 93 40 55 91 44 82

a) Poderá afirmar, ao nível de 5%, que as classificações obtidas no teste após a

aula são significativamente superiores às classificações obtidas no teste antes da

aula? Utilize um teste não paramétrico para responder a esta questão e indique

os pressupostos admitidos.

b) Utilizando um teste que julgue adequado, poderá concluir, ao nível de 5%, que

a nota mediana depois da aula é superior a 60.

Exercício 4

Recorreu-se a um painel de opinião para avaliar a alteração da base de apoio ao governo

causado pelas alterações legislativas que o Orçamento Geral de Estado introduz nas

deduções ao IRS. Em 250 opiniões registadas, observaram-se os seguintes resultados:

A favor Contra

Antes A favor 94 36

Contra 12 108

a) Indique as hipóteses para testar se houve uma alteração significativa no apoio

do governo, devido às alterações ao Orçamento Geral de Estado.

b) Aplique o teste de McNemar e retire as conclusões que achar convenientes.

Exercício 5

Uma marca de café acaba de lançar um novo lote. Para promover o novo lote

decide oferecer um café aos clientes de um determinado hipermercado, para que estes

fiquem a conhecer o café e possam ficar a conhecer a promoção de lançamento que

oferece uma chávena na compra de duas embalagens. Durante um determinado período

de tempo são observados os clientes a quem é oferecido o café, sendo classificados

quanto ao sexo e quanto à decisão de comprar ou não as duas embalagens com oferta da

chávena. Os resultados obtidos foram os seguintes:

Feminino Masculino

Não 8 20

Sim 35 12

Teste, ao nível de 5%, se existe alguma relação entre o sexo dos clientes e a

decisão em aderir à promoção.

Exercício 1

a)

X- Resultados no teste dos funcionários de Lisboa

Y- Resultados no teste dos funcionários do Porto

0

1

: ( , )

:

H X N

H X

µ σ 0

1

: ( , )

( , ) :

H Y N

N H Y

µ σµ σ ( , )

N µ σ

Os resultados obtidos foram:

One-Sample Kolmogorov-Smirnov Test

10 9

13,9600 13,9556

4,49325 4,96591

,248 ,258

,156 ,155

-,248 -,258

,783 ,775

,572 ,585

,496 ,506

,000 ,000

N

Mean

Std. Deviation

Normal Parametersa,b

Absolute

Positive

Negative

Most ExtremeDifferences

Kolmogorov-Smirnov Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Point Probability

Resultadosdos

funcionáriosde Lisboa no

teste

Reultadosdos

funcionáriosdo Porto no

teste

Test distribution is Normal.a.

Calculated from data.b.

Analisando os valores de prova, como p=0,496 na amostra de Lisboa e p=0,506 na amostra do Porto, concluímos que não se rejeitam as hipóteses de normalidade com os parâmetros estimados.

Através do método gráfico, obtém-se:

LISBOA: PORTO:

b) Pretende-se concluir se, ao nível de 5%, existem diferenças significativas entre a

competência dos funcionários de Lisboa e os do Porto, pelo que as hipóteses a

testar no caso de uma abordagem não paramétrica são:

0

1

:

:

= ≠

X Y

X Y

H

H

η ηη η

Realizando o teste de Wilcoxon-Mann-Whitney, obtém-se

Ranks

10 9,80 98,00

9 10,22 92,00

19

Atribuição do grupo a quepertencem os resultadosLisboa

Porto

Total

Resultadosglobais no teste

N Mean Rank Sum of Ranks

Normal P-P Plot of Resultados dos funcionários de Lisboa no teste

Observed Cum Prob

1,00,75,50,250,00

Exp

ecte

d C

um P

rob

1,00

,75

,50

,25

0,00

Normal P-P Plot of Reultados dos funcionários do Porto no teste

Observed Cum Prob

1,00,75,50,250,00

Exp

ecte

d C

um P

rob

1,00

,75

,50

,25

0,00

Test Statistics b

43,000

98,000

-,163

,870

,905a

Mann-Whitney U

Wilcoxon W

Z

Asymp. Sig. (2-tailed)

Exact Sig. [2*(1-tailedSig.)]

Resultadosglobais no

teste

Not corrected for ties.a.

Grouping Variable: Atribuição do grupoa que pertencem os resultados

b.

Pelo que podemos concluir, através do valor de prova (p=0,905>0,05), que

as amostras provêm da mesma população, isto é, não existem diferenças

significativas entre a competência dos funcionários das duas cidades.

c) Pela alínea a) concluímos que as amostras são provenientes de populações

normais, pelo que se deve utilizar a abordagem paramétrica. As hipóteses a

testar são:

0

1

:

:

= ≠

X Y

X Y

H

H

µ µµ µ

Aplicando o teste T, pois os desvios padrões populacionais são desconhecidos,

obtemos:

Group Statistics

10 13,9600 4,49325 1,42089

9 13,9556 4,96591 1,65530

Atribuição do grupo a quepertencem os resultadosLisboa

Porto

Resultadosglobais no teste

N Mean Std. DeviationStd. Error

Mean

Independent Samples Test

,000 ,996 ,002 17 ,998 ,0044 2,16942 -4,57262 4,58151

,002 16,277 ,998 ,0044 2,18151 -4,61375 4,62263

Equal variancesassumed

Equal variancesnot assumed

Resultadosglobais no teste

F Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

Como não se rejeita a hipótese de igualdade de variâncias (p=0.996), usamos o teste

t em que se assume a igualdade, pelo que como p=0,998>0,05 concluímos que

devemos manter H0, isto é, não existem diferenças entre os resultados médios dos

testes realizados pelos funcionários de Lisboa e do Porto.

Observe-se que, quer nesta alínea quer na anterior, os valores de prova são muito

próximos de 1 o que permite concluir uma grande evidência amostral a favor de H0.

d) One-Sample Test

9,825 9 ,000 13,96000 10,7457 17,17438,418 8 ,000 13,26667 9,6325 16,9008

LisboaPorto

t df Sig. (2-tailed)Mean

Difference Lower Upper

95% ConfidenceInterval of the

Difference

Test Value = 0

Independent Samples Test

,009 ,927 ,328 17 ,747 ,69333 2,11591 -3,77086 5,15752

,327 16,564 ,748 ,69333 2,12192 -3,79253 5,17919

Equal variancesassumedEqual variancesnot assumed

NotasF Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

Exercício 2

X- resultado (numa escala de 0 a 10) da participação do homem na aquisição de

bens.

Y- resultado (numa escala de 0 a 10) da participação das mulheres na aquisição de

bens.

a) As hipóteses a testar são:

0

0

:

:

= ≠

X Y

X Y

H

H

η ηη η

Como temos amostras emparelhadas e é possível obter, além do sinal da diferença, o

valor da diferença, usamos o teste de Wilcoxon para amostras emparelhadas.

Os resultados obtidos foram:

Pelo que não rejeitamos a hipótese nula para níveis de significância inferiores a

0,6%, isto é, para níveis de significância superiores ou iguais a 0,6% podemos

concluir que homens e mulheres têm um grau de influência diferente nas compras de

casa.

Para um teste unilateral direito

0

0

:

:

= >

X Y

X Y

H

H

η ηη η

Como p=0,03≤0,05, rejeitamos H0 ao nível de 5%, pelo que, a este nível de

significância, é possível concluir que os homens acham que têm maior influência do

que as mulheres na aquisição de bens.

b) Aplicando o teste dos sinais, cujas hipóteses também se podem colocar como

Ranks

11a 8,59 94,50

3b 3,50 10,50

3c

17

Negative Ranks

Positive Ranks

Ties

Total

Resultados no teste dasmulheres - Resultadosno teste dos homens

N Mean Rank Sum of Ranks

Resultados no teste das mulheres < Resultados no teste dos homensa.

Resultados no teste das mulheres > Resultados no teste dos homensb.

Resultados no teste dos homens = Resultados no teste das mulheresc.

Test Statistics b

-2,667a

,008

,006

,003

,001

Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Exact Sig. (1-tailed)

Point Probability

Resultadosno teste dasmulheres -Resultadosno teste dos

homens

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

( ) ( )( ) ( )

0

1

:

:

+ = −

+ ≠ −

H P P

H P P

obtemos os resultados seguintes:

Para o teste bilateral, como p=0,057>0,05 não se rejeita H0, sendo a conclusão a

mesma que com o teste anterior. Para o teste unilateral, como p=0,057 /

2=0,0285≤0,05, rejeita-se H0 ao nível de 5%, sendo a conclusão também a mesma

que no teste anterior.

Exercício 3

a) X- nota do aluno antes de assistir às aulas

Y- nota do aluno depois de assistir às aulas

0

1

:

:

= <

X Y

X Y

H

H

η ηη η

Frequencies

11

3

3

17

Negative Differencesa

Positive Differencesb

Tiesc

Total

Resultados no teste dasmulheres - Resultadosno teste dos homens

N

Resultados no teste das mulheres < Resultados noteste dos homens

a.

Resultados no teste das mulheres > Resultados noteste dos homens

b.

Resultados no teste dos homens = Resultados noteste das mulheres

c.

Test Statistics b

,057aExact Sig. (2-tailed)

Resultadosno teste dasmulheres -Resultadosno teste dos

homens

Binomial distribution used.a.

Sign Testb.

Ranks

3a 2,67 8,00

7b 6,71 47,00

0c

10

Negative Ranks

Positive Ranks

Ties

Total

Resultados no testedepois de assistiremàs aulas - Resultadosno teste antes deassistirem às aulas

N Mean Rank Sum of Ranks

Resultados no teste depois de assistirem às aulas < Resultados no testeantes de assistirem às aulas

a.

Resultados no teste depois de assistirem às aulas > Resultados no testeantes de assistirem às aulas

b.

Resultados no teste antes de assistirem às aulas = Resultados no testedepois de assistirem às aulas

c.

Test Statistics b

-1,989a

,047

,047

,023

,005

Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Exact Sig. (1-tailed)

Point Probability

Resultadosno teste

depois deassistirem às

aulas -Resultados

no teste antesde assistirem

às aulas

Based on negative ranks.a.

Wilcoxon Signed Ranks Testb.

Aplicando o teste de Wilcoxon para amostras emparelhadas (estamos a admitir as

distribuições são contínuas e simétricas), obtemos:

Como p=0,023≤0,05, rejeita-se H0 ao nível

de 5%, pelo que podemos concluir que as

classificações obtidas no teste após a aula

são superiores às classificações obtidas no

teste antes da aula.

b) Pretendemos testar

0

1

: 60

: 60

= >

Y

Y

H

H

ηη

Aplicando o teste de Wilcoxon, obtemos:

Ranks

7a 6,43 45,00

3b 3,33 10,00

0c

10

Negative Ranks

Positive Ranks

Ties

Total

Mediana - Resultadosno teste depois deassistirem às aulas

N Mean Rank Sum of Ranks

Mediana < Resultados no teste depois de assistirem às aulasa.

Mediana > Resultados no teste depois de assistirem às aulasb.

Resultados no teste depois de assistirem às aulas = Medianac.

Test Statistics b

-1,784a

,074

,084

,042

,010

Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Exact Sig. (1-tailed)

Point Probability

Mediana -Resultados

no testedepois deassistiremàs aulas

Based on positive ranks.a.

Wilcoxon Signed Ranks Testb.

Como para o teste unilateral direito se obtém p=0,042≤0,05, podemos concluir, ao nível

de 5%, que a nota mediana do teste depois da aula teórica é superior a 60.

Exercício 4

c) Construa as hipóteses para testar se houve uma alteração significativa no apoio

do governo, devido às alterações ao Orçamento Geral de Estado.

( ) ( )( ) ( )

0

1

0

1

: a favor contra contra a favor

: a favor contra contra a favor

: Nao houve mudança de opiniao

H : Houve mudança de opiniao.

→ = →

→ ≠ →

H P P

H P P

ou

H

d) Aplicando o teste de McNemar obtemos:

Rejeita-se H0 para α≥0,001, pelo que podemos concluir, para níveis de significância

superiores ou iguais a 0,1%, que houve mudança de opinião.

Exercício 5 Vamos aplicar o teste Qui-quadrado de independência para testar H0: Existe independência entre o sexo dos clientes e a decisão de aderir à promoção. ou H0: pij = pi. p.j Os resultados obtidos são os seguintes:

Case Processing Summary

75 100,0% 0 ,0% 75 100,0%Decisão * SexoN Percent N Percent N Percent

Valid Missing Total

Cases

Opiniões antes da medida & Opiniões depois da medida

94 36

12 108

Opiniões antes damedida0

1

0 1

Opiniões depois da medida

Test Statistics b

250

11,021

,001

N

Chi-Squarea

Asymp. Sig.

Opiniões antes damedida & Opiniõesdepois da medida

Continuity Correcteda.

McNemar Testb.

Decisão * Sexo Crosstabulation

8 20 28

16,1 11,9 28,0

35 12 47

26,9 20,1 47,0

43 32 75

43,0 32,0 75,0

Count

Expected Count

Count

Expected Count

Count

Expected Count

nao

sim

Decisão

Total

f m

Sexo

Total

Chi-Square Tests

15,110b 1 ,000

13,292 1 ,000

15,448 1 ,000

,000 ,000

75

Pearson Chi-Square

Continuity Correction a

Likelihood Ratio

Fisher's Exact Test

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. The minimum expected count is11,95.

b.

A amostra apresenta uma evidência estatística muito forte de que existe relação entre o

sexo e a decisão de aderir à promoção (valor p=0,000 associado ao valor da estatística

qui-quadrado de Pearson).

Provas de avaliação

UNIVERSIDADE DE ÉVORA - Departamento de Matemática

1ª Frequência de PROBABILIDADES E ESTATÍSTICA * 29/10/2005

ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO

Duração: 2 horas

Nota: Justifique todas as respostas de uma forma sucinta

1. Considere os salários, em centos de euros, de 80 trabalhadores de uma dada

empresa.

e) Calcule o terceiro quartil e interprete o seu

valor.

f) Sabe-se que a distribuição é mesocúrtica, que o

momento centrado de ordem 4 é 243 e que o

momento ordinário de ordem 1 é 9. Com base

nesta informação, um seu colega concluiu que

o coeficiente de variação é igual a 33,3%. Explique o seu raciocínio.

g) Complete as afirmações:

i) 37,5% dos trabalhadores têm um salário superior a ___ euros.

ii) Os trabalhadores com salário inferior a 1000€ recebem ___% do total

dos salários pagos pela empresa.

2. Admita que o volume de vendas anuais, em milhões de euros, de um conjunto de

empresas do país X foi o seguinte:

20 40 40 45 45 45 50 50 50 50

55 55 60 60 60 60 70 80 85 100

Esboce o diagrama caixa-e-bigodes. Comente.

3. Suponha que existem 3 tipos de vírus duma dada doença, sendo 0,3; 0,5 e 0,2 as

probabilidades de um indivíduo ser atacado por cada um deles. Para a vacina

disponível as probabilidades de imunização são 0,8; 0,9 e 0,95 respectivamente. Se

um indivíduo vacinado resistiu ao ataque, qual a probabilidade de ter sido atacado

por um vírus do 2º tipo?

Classes n i

[2, 4) 5

[4, 6) 10

[6, 8) 15

[8, 10) 20

[10, 12) 15

[12, 14) 9

[14, 16] 6

4. A taxa de juro de um determinado produto financeiro é uma variável aleatória X

com a seguinte função densidade de probabilidade:

( )2x 2

; 0 x 3f x 15

0; c.c.

+ ≤ ≤=

Sabendo que a taxa de juro do produto vai aumentar para um valor não inferior a 2,

determine a probabilidade de a mesma se situar no intervalo 2 a 2,5.

5. Suponha que a procura diária de um certo artigo em determinado estabelecimento é

uma variável aleatória com distribuição de Poisson de média igual a 3.

a) Determine o stock mínimo de artigos no início de cada dia para que haja

procura excedentária no máximo em 20% dos dias?

b) Tomando como referência o stock calculado na alínea anterior (assuma o valor

3 caso não a tenha conseguido resolver), calcule a probabilidade de numa

semana (5 dias úteis) haver no máximo 2 dias com procura excedentária.

c) Calcule a probabilidade de em meio-dia se registar uma procura superior a 3

artigos.

6. Suponha que um dispositivo electrónico tem um tempo de vida X, que é uma v.a.

exponencial de média igual a 1000 horas. Admita, ainda, que o custo de fabrico de

um desses dispositivos é igual a 200 € e que o fabricante garante o reembolso total

se a duração do dispositivo for menor ou igual a 900 horas. Qual deverá ser o preço

de venda do artigo para que o lucro que o fabricante espera obter em 100

dispositivos seja igual a 500€?

Formulário de Apoio:

1ip i i

i

np Nx l R

n−−

= + ×ɶ ( )22

1

1

1

n

i ii

s n x xn =

= −− ∑ [ ]1 33 , 3− +Q IQ Q IQ 3 1= −IQ Q Q

[ ] [ ]

[ ]

1

1

, 2,

np np

p

np

x xnp

xx np

+

+

+ ∈= ∉

ℕɶ

( )

( ) ( )

3' ' ' '3 3 2 1 1

2 4' ' ' ' ' '4 4 3 1 2 1 1

3 2

4 6 3

m m m m m

m m m m m m m

= − +

= − + −

( )1=

−=∑

kr

i ii

r

n x xm

n ' 1==

∑k

ri i

ir

n xm

n 3

1 3γ =

m

s 4

2 43γ = −

m

s

( ) ( )3 1

3 1

− − −

ɶ ɶQ x x Q

Q Q

ˆ−=

x xg

s

( )3 1

90 102

−−

Q Q

P P 1

1

=

=

=∑

i

jj

i k

jj

n

pn

1

1

=

=

=∑

i

i ij

i k

i ij

n x

qn x

1

11

1

1

=−

=

= −∑

k

iik

ii

qG

p

( )( ) ( )

( ) ( )1

|| , 1, 2, ..., n

|=

×= =

∑i i

i n

k kk

P A P B AP A B i

P A P B A

( ) ( ) ( )1

|=

=∑n

i ii

P B P B A P A ( ) ( ) ( )− = − ∩P A B P A P A B

( ) ( ) ( ) ( )∪ = + − ∩P A B P A P B P A B

( ) ( ) ( ) ( ) ( ). | |∩ = =P A B P A P B A P B P A B

( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 1 2 2 2 1 1... | ... | ... ... |− − −= × × × ×n n n n nP A A A P A A A A P A A A A P A A P A

( )( ) ; ( ) ( )≤ −∞

= = =∑ ∫k

x

kx x

F x P X x F x f u du ( ) ( ) ( )< ≤ = −P a X b F b F a

( ) ( ) ( )' ' ; = ( )+∞

−∞

= = =∑ ∫µ µk

mm mm k k m

x

E X x P X x x f x dx 1

( ) , = < <−

f x a x bb a

( ) ( ) ( ) ( )( ) ( ) ; ( ) ( )+∞

−∞

= − = − = = − ∑ ∫µ µk

m m m

m k k mx

E X E X x E X P X x x E X f x dx

( ) ( )1 , 0, 1, ..., − = = − =

n kknP X k p p k n

k ( ) ( ) 1

1 , 1,2, ...k

P X k p p k−

= = − =

( ) , 0, 1, ... 0!

= = = >λλ

λke

P X k kk

( ) , 0 >0; ( ) 1 , 0 >0− −= ≥ = − ≥λ λλ λ λt tf t e t F t e t

.

UNIVERSIDADE DE ÉVORA - Departamento de Matemática

2ª Frequência de PROBABILIDADES E ESTATÍSTICA * 29/11/2005

ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO

Duração: 2 horas Nota: Justifique todas as respostas de uma forma sucinta

1. Os gastos mensais com formação de pessoal de uma dada empresa têm

distribuição normal com média igual a 25000€ e desvio padrão igual a 3600€.

Admitindo que a empresa tem um orçamento anual de 250000€ para formação,

calcule a probabilidade desta verba ser adequada para o próximo ano. 2. A duração de pequenos comerciais num canal de televisão pode considerar-se

uma variável aleatória com função densidade1

( ) , 0f x x θθ

= < < .

a) Obtenha um estimador para θ pelo método dos momentos.

b) Mostre que o estimador obtido na alínea anterior é consistente. (Caso não

tenha resolvido a alínea anterior, considere ˆ 2Xθ = ) 3. O número de bilhetes de parquímetro emitido numa determinada rua da cidade

de Évora, num dia da semana, tem distribuição de Poisson de parâmetro λ.

Obtenha o estimador de máxima verosimilhança do número médio de bilhetes

emitidos diariamente e uma estimativa de máxima verosimilhança do desvio

padrão, sabendo que em 15 dias foram emitidos 3000 bilhetes. 4. Um determinado Município pretende efectuar uma sondagem junto da

população que vive num bairro mais afastado a fim de determinar a proporção

de pessoas que diariamente utilizam os transportes públicos.

a) Determine o número de munícipes a inquirir de modo a obter um erro de

estimativa máximo igual a 2% para um nível de confiança de 95%.

b) Os meios financeiros disponíveis apenas permitiam inquirir 1000 pessoas,

das quais 150 afirmaram utilizar os transportes públicos regularmente.

Obtenha um intervalo de confiança a 95% para a proporção de munícipes

que utilizam regularmente os transportes públicos. Diga qual o erro de

estimativa associado e comente o resultado.

5. Um determinado fornecedor de acesso à Internet tem um pacote que indica uma

velocidade de download de 2MB. Vinte e cinco dos seus clientes mediram as

suas velocidades de download num período que pode ser considerado de menor

tráfego, registando-se uma velocidade média igual a 1.5Mb e um desvio padrão

igual a 1 Mb. Haverá evidência, ao nível de 1%, para podermos concluir que a

velocidade de download é inferior à indicada por esse fornecedor? Admita os

pressupostos que entender necessários. 6. Suponha que um comerciante recebeu uma remessa de ovos com a garantia de

serem da classe A, isto é, ovos cujo peso segue uma distribuição normal de

média igual a 55gr e desvio padrão igual a 8gr. Como o fornecedor só lhe

concede 2 dias para reclamar, resolve analisar uma amostra de n ovos. Caso

pretenda decidir com um nível de significância igual a 5% e um erro de 2ª

espécie inferior a 10% (quando os ovos fornecidos pertençam a uma população

com peso médio igual a 50 gr.), quantos ovos deverá o comerciante pesar? 7. Comente a proposição: “Num teste de hipóteses unilateral direito para a média,

com desvio padrão conhecido, com um valor igual a 2,1 para a estatística de

teste, o valor de prova deste teste leva à rejeição da hipótese nula para um nível

de significância superior a 1%. ”. 8. Admita que na secção de informática de determinado estabelecimento comercial,

as vendas diárias de impressoras das marcas X e Y têm a seguinte função massa

de probabilidade conjunta:

Verifique se as variáveis são independentes e

calcule a probabilidade de num dado dia se

venderem mais impressoras da marca X.

Formulário de apoio:

(0,1) ; (0,1)(1 )

X np XN N

np p

λλ

− −∩ ∩−

ɺ ɺ ; ( ) ( )i ii

X N , X N n , n∩ µ σ ⇒ ∩ µ σ∑

X\Y 0 1 2

0 1/12 1/6 1/12

1 1/6 1/6

2 1/12 1/6 1/12

( ) ( ) ( ), i i i jj

p x P X x P X x Y y= = = = =∑ ;

( ) ( ) ( ), j j i ji

p y P Y y P X x Y y= = = = =∑

( )( ) ( ) ( ) ( )ov( , ) ( ) ( )XY C X Y E X E X Y E Y E XY E X E Yσ = = − − = −

( ) ( ),i j

i j i jx y

E XY x y P X x Y y= = =∑∑

UNIVERSIDADE DE ÉVORA - Departamento de Matemática

3ª Frequência de PROBABILIDADES E ESTATÍSTICA * 17/12/2005

ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO

Duração: 2 horas • Justifique, embora de uma forma sucinta, todas as respostas.

• Na última página dispõe de um formulário de apoio, bem como de alguns

valores de quantis de probabilidades das distribuições t-student, Qui-quadrado e

F que podem eventualmente ser necessários.

1. Para avaliar a sustentabilidade da construção do novo aeroporto da Ota foi pedido a

13 economistas apoiantes do Governo e a 9 economistas da oposição, para

estimarem o impacto do novo aeroporto no crescimento do PIB, tendo-se obtido os

seguintes resultados:

Média Desvio padrão

Governo 3,5 1,5

Oposição 2,0 2,0

a) Haverá evidência estatística, ao nível de significância de 10%, para concluir que

as previsões médias dos economistas apoiantes do governo são superiores às

previsões médias dos economistas apoiantes da oposição? Admita os

pressupostos necessários para realizar uma abordagem paramétrica.

b) Obtenha um intervalo de confiança a 95% para a razão das variâncias das

previsões. Que pode concluir acerca da validade de um dos pressupostos

admitidos na alínea anterior?

2. Segundo uma sondagem realizada a 300 estudantes de uma dada Universidade

verificou-se que 130 apoiavam a candidatura à Reitoria do candidato A, enquanto

noutra sondagem, em 250 inquiridos 125 apoiavam a candidatura do candidato B.

Com base no valor de prova, teste a hipótese do candidato B ter mais apoiantes que

o candidato A.

3. Para estudar se a duração (em segundos) de chamadas de voz de uma dada empresa

de telecomunicações tem uma distribuição uniforme U (0,150) foram observados

300 chamadas telefónicas, obtendo-se os seguintes resultados: Recorde que a função

distribuição da Uniforme é

( ) ( ) ( ) ( )( ) ( ) ( )/ , e ,F x x a b a a x b P X a b F b F a= − − < < ∈ = − .

Tempo [0,30) [30,60) [60,90) [90,120)

Número chamadas 55 125 85 35

Que pode concluir ao nível de significância de 5%?

4. Para testar a relação entre o desempenho dos docentes nas aulas (avaliados entre 0 e

10) e o número de horas de preparação das aulas foram observados 16 docentes.

Alguns dos resultados obtidos na análise estatística efectuada foram:

Descriptive Statistics

5,1313 3,57598 16

56,3750 28,64699 16

desempenho do docente

preparação das aulasem horas

Mean Std. Deviation N

Model Summary

,926 ,857Model1

R R Square

Coefficients a

-1,383 ,793 -1,745

,116 ,013 9,160

(Constant)

preparação dasaulas em horas

Model1

B Std. Error

UnstandardizedCoefficients

t

Dependent Variable: desempenho do docentea.

a) Interprete o valor dos coeficientes do modelo de regressão linear e avalie a

qualidade do ajustamento efectuado.

b) Teste, ao nível de 5%, se o declive da recta é superior a 0,10.

c) Determine um intervalo de predição a 90% para o desempenho de um docente

que tenha dispendido 80 horas na preparação das aulas.

d) Indique os pressupostos subjacentes ao modelo de regressão linear e diga

sucintamente como poderia avaliar um desses pressupostos.

5. Descreva sucintamente como procederia para realizar um ajustamento do tipo

2x1y eβ= β .

6. Para testar a relação entre a nota final dos alunos no curso de Gestão e o número de

meses que demoram a encontrar o primeiro emprego, numa amostra de 220 alunos

obteve-se o output:

número de meses para encontrar o 1º emprego * nota final no curso de Gestão Crosstabulation

15 45 60 120

46,4 120,0

55 20 25 100

38,6 100,0

70 65 85 220

70,0 65,0 85,0 220,0

Count

Expected Count

Count

Expected Count

Count

Expected Count

<8

>8

número de meses paraencontrar o 1º emprego

Total

10-13 13-16 >16

nota final no curso de Gestão

Total

Com base nos dados obtidos, complete a tabela e conclua ao nível de 5%?

7. Como parte de um estudo sobre a necessidade de assistir às aulas teóricas de

Probabilidades e Estatística foi pedido a um grupo de 10 alunos para realizar um

determinado teste antes da matéria ser leccionada na aula teórica. Ao mesmo grupo

foi posteriormente leccionada a aula teórica sobre a matéria do teste e pedido que

efectuasse um teste análogo ao primeiro. As classificações registadas para os dois

testes e os outputs obtidos foram:

Classificação do teste (0-100)

Aluno 1 2 3 4 5 6 7 8 9 10

Antes da aula 18 79 91 75 68 43 33 85 22 56

Depois da aula 85 85 83 71 93 40 55 91 44 82

Poderá afirmar, ao nível de 5%, que as classificações obtidas no teste após a aula são

significativamente superiores às classificações obtidas no teste antes da aula?

Considere os resultados apresentados da aplicação de um teste não paramétrico

adequado para responder a esta questão e calcule o valor da estatística de teste que

lhe permite obter o valor Z indicado no output.

Cotação:

1a) 2.5 1b) 2.5 2) 1.5 3) 2.5 4a) 1.5 4b) 1.5 4c) 1.5 4d) 1.0 5) 1.5 6) 2.0 7)

2.0

Test Statistics b

-1,989a

,047

,023

Z

Exact Sig. (2-tailed)Exact Sig. (1-tailed)

Resultadosno teste

depois deassistirem às

aulas -Resultados

no teste antesde assistirem

às aulas

Based on negative ranks.a.

Wilcoxon Signed Ranks Testb.

Test Statistics b

-1,989a

,047

,023

Z

Exact Sig. (2-tailed)Exact Sig. (1-tailed)

Resultadosno teste

depois deassistirem às

aulas -Resultados

no teste antesde assistirem

às aulas

Based on negative ranks.a.

Wilcoxon Signed Ranks Testb.

Formulário de apoio

( ) ( ) ( ) ( )* *0 k k 0 k k 1

d d

D max F x F x , F x F x+ −

= − − ������� ���������

( ) ( )2 2

0 00 n 2,1 / 2 0 n 2,1 / 2

xx xx

x x x x1 1ˆ ˆy t QME 1 , y t QME 1

n S n S− − − −

− − − × + + + × + + α α

( ) ( )2 2

0 00 n 2,1 / 2 0 n 2,1 / 2

xx xx

x x x x1 1ˆ ˆy t QME , y t QME

n S n S− − − −

− − − × + + × + α α

XY1 2 2

XX

Sˆ ˆ ˆy x; S

β = −β β = ; 0 02 2 1 1

2

XX XX

ˆ ˆT ; T=

QME 1 xQMES n S

β −β β −β=

+

( )

( )

n2

i i2XY E i 1

n2YYxx YY

i ii 1

ˆy yS SQ

r ; r 1 1SS S y y

=

=

−= = − = −

∑ ( )

n n2 2 2

xx i ii 1 i 1

S x x x nx= =

= − = −∑ ∑

; ( )( )n n

XY i i i ii 1 i 1

S x x y y x y nxy= =

= − − = −∑ ∑

( )

( )

1 1 2

1 2 1 2

n n n 1U

2Z N(0,1)n n n n 1

12

+ +−

= ∩+ +

ɺ

( )

( )( )

n n 1W

4Z N(0,1)n n 1 2n 1

24

+−

= ∩+ +

ɺ

; Z0.5160 Z0.5199 Z0.5239 Z1.645 Z1.96 Z2.326 F12,8, 0.95 F12,8, 0.975 F8,12, 0.95 F8,12, 0.975

0,04 0,05 0,06 0,95 0,975 0,99 3,28 4,20 2,85 3,51

t14, 0.90 t14, 0.95 t14,

0.975

t16, 0.90 t16, 0.95 t16,

0.975

t20, 0.90 t20, 0.95 t22, 0.90 t22, 0.95

1,345 1,761 2,145 1,337 1,746 2,120 1,325 1,725 1,321 1,717

X26, 0.025 X2

6, 0.05 X26, 0.95 X2

6, 0.975 X22, 0.025 X2

2, 0.05 X22, 0.95 X2

2, 0.975

1,240 1,640 12,600 14,400 0,051 0,103 5,990 7,380

X23, 0.05 X2

3, 0.95 X23, 0.975 X2

4, 0.05 X24, 0. 95 X2

4, 0.975 X25, 0.95 X2

5, 0.975

0,216 7,810 9,350 0,711 9,490 11,100 11,100 12,800

( )( )( )

( )2 2L C k

ij ij2 2 2 2i ik 1 pL 1 C 1

i 1 j 1 i 1ij i

o e o e

e eɺ ɺχ χ − −− −

= = =

− −Χ = ∩ Χ = ∩∑∑ ∑

UNIVERSIDADE DE ÉVORA - Departamento de Matemática

Exame de Época Recurso de PROBABILIDADES E ESTATÍSTICA * 6/01/2006

ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO

Duração: 3 horas

Nota: Justifique todas as respostas de uma forma sucinta.

1. Considere que, numa distribuição de frequências relativa aos gastos energéticos de

80 empresas numa dada actividade, os pontos médios das classes 'ix e as frequências

relativas fi são os seguintes, respectivamente: 'ix = 4, 6, 8, 11, 15 e 21; fi= 0.1375,

0.1875, 0.2500, 0.2000, 0.1000 e 0.1250. Admita que um seu colega, depois de

calcular o terceiro momento central, tirou a seguinte conclusão: “A maior parte das

empresas tem um consumo energético inferior à média.”. Suporte a veracidade ou a

falsidade desta conclusão.

2. Os ganhos percentuais, ao fim de 3 anos, com as obrigações de 16 empresas do

sector industrial foram os seguintes:

10.5 41.0 58.5 60.0 60.0 62.5 65.0 65.0 65.0 67.5

70.0 70.0 72.5 73.8 74.8 75.0 75.2 80.0 85.0 98.9

Esboce o diagrama caixa de bigodes. Comente.

3. Numa determinada semana foram detectados 255 condutores que apresentavam uma

taxa de alcoolemia positiva (superior a 0,5 gramas de álcool por litro de sangue), 87

dos quais foram detidos por apresentarem valor igual ou superior a 1,20 gramas.

Sabe-se, ainda, que 40 dos condutores detidos estiveram envolvidos em acidentes.

Calcule a probabilidade de um determinado condutor ter estado envolvido num

acidente sabendo que tinha uma taxa de alcoolémia superior a 1.2 gramas.

4. O fornecimento mensal de gás natural por parte da empresa GasPor para um país é

uma variável aleatória com função densidade de probabilidade dada por

23( ) , 0 2

8

xf x x= ≤ ≤

Calcule o fornecimento médio mensal de gás natural.

Model Summary

,985a ,971 ,962 ,11461Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Preço do Barril do Petróleoa.

5. Uma determinada empresa tem produção mensal igual a 100 toneladas. Sabendo que

a procura mensal é uma variável aleatória normal com média 80 toneladas e desvio

padrão 10 toneladas calcule a probabilidade de num semestre haver procura

excedentária em pelo menos dois meses.

6. Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição com função densidade

dada por

( )1x ;0 x 1, 0

f x0; caso contrário

θ−θ < < θ>=

Determine, pelo método de máxima verosimilhança, o estimador de θ.

7. A equipa de rally Mits tem dois pilotos e pretende avaliar qual deve ser o seu piloto

principal na maior prova mundial: Lisboa – Dakar. Para isso, realizou um conjunto

de 9 etapas/teste com cada um dos pilotos, registando-se os seguintes resultados (em

horas).

Média Variância

Piloto A 4,31 2,0

Piloto B 4,65 1,1

a) Determine um intervalo de confiança a 95% para a razão de variâncias dos

tempos dos pilotos.

b) Verifique, ao nível de significância de 5%, se existe evidência estatística de que

o piloto A consegue um tempo médio inferior ao piloto B e assim ser o piloto

principal da equipa. Admita os pressupostos necessários.

8. Suponha que se obtiveram 12 observações da taxa de crescimento do PIB de um

dado país por trimestre e do preço médio do barril de petróleo nesse trimestre.

Realizou-se uma análise de regressão utilizando o SPSS e obtiveram-se, entre

outros, os seguintes outputs:

Coefficients a

2,715 ,205 13,252 ,001

-,053 ,005 -,985 -10,057 ,002

(Constant)

Preço do Barrildo Petróleo

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Taxa de Crescimento do PIBa.

a) Interprete o valor dos coeficientes do modelo de regressão linear, avalie a

qualidade do ajustamento efectuado e indique os pressupostos subjacentes.

b) Construa um intervalo de confiança a 95% para β2 e através dele conclua se o

modelo de regressão é significativo.

9. Recolheram-se 16 tempos de entrega de SMS durante o período de Natal de uma

dada operadora TM, com o objectivo de testar se o tempo médio de entrega de cada

SMS é inferior a 30 segundos. Pretendendo realizar uma abordagem paramétrica

testou-se um pressuposto fundamental através do teste de Kolmogorov-Smirnov,

tendo-se obtido os seguintes resultados:

One-Sample Kolmogorov-Smirnov Test

16

27,6875

35,92162

,361

,361

-,229

1,445

,031

,022

,000

N

Mean

Std. Deviation

Normal Parametersa,b

Absolute

Positive

Negative

Most ExtremeDifferences

Kolmogorov-Smirnov Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Point Probability

TEMPO

Test distribution is Normal.a.

Calculated from data.b.

Indique a hipótese a testar, o valor da estatística de teste e retire as conclusões que

entender convenientes para um nível se significância de 5%. Caso não considere

adequada uma abordagem paramétrica, que teste poderia utilizar?

10. A operadora TM, referida no exercício anterior, pretende estimar a proporção de

clientes totalmente fidelizados. Qual deverá ser a dimensão da amostra a recolher

para obter uma estimativa com erro máximo de 2%, com uma confiança de 95%?

11. Determinada empresa seguradora baseia o seu sistema de prémios para determinado

risco na premissa de que o número de sinistros por apólice tem distribuição Poisson

de parâmetro λ = 0,2. Numa amostra de 1000 apólices referentes ao ano

anterior observou-se:

N.º sinistros por apólice 0 1 2 3

N.º apólices 800 175 21 4

Teste, ao nível de significância de 1%, a hipótese da suposição da empresa

seguradora.

Cotação:

1) 1.5 2) 1.5 3) 1.0 4) 1.5 5) 2.0 6) 1.5 7a) 1.5 7b) 1.5 8a) 2.0 8b) 1.5 9) 1.5 10)

1.5 11) 1.5

Formulário de Apoio:

1ip i i

i

np Nx l R

n−−

= + ×ɶ ( )22

1

1

1

n

i ii

s n x xn =

= −− ∑ [ ]1 33 , 3− +Q IQ Q IQ 3 1= −IQ Q Q

[ ] [ ]

[ ]

1

1

, 2,

np np

p

np

x xnp

xx np

+

+

+ ∈= ∉

ℕɶ

( )

( ) ( )

3' ' ' '3 3 2 1 1

2 4' ' ' ' ' '4 4 3 1 2 1 1

3 2

4 6 3

m m m m m

m m m m m m m

= − +

= − + −

( )1=

−=∑

kr

i ii

r

n x xm

n ' 1==

∑k

ri i

ir

n xm

n 3

1 3γ =

m

s 4

2 43γ = −

m

s

( ) ( )3 1

3 1

− − −

ɶ ɶQ x x Q

Q Q

ˆ−=

x xg

s

( )3 1

90 102

−−

Q Q

P P 1

1

=

=

=∑

i

jj

i k

jj

n

pn

1

1

=

=

=∑

i

i ij

i k

i ij

n x

qn x

1

11

1

1

=−

=

= −∑

k

iik

ii

qG

p

( )( ) ( )

( ) ( )1

|| , 1, 2, ..., n

|=

×= =

∑i i

i n

k kk

P A P B AP A B i

P A P B A

( ) ( ) ( )1

|=

=∑n

i ii

P B P B A P A ( ) ( ) ( )− = − ∩P A B P A P A B

( ) ( ) ( ) ( )∪ = + − ∩P A B P A P B P A B

( ) ( ) ( ) ( ) ( ). | |∩ = =P A B P A P B A P B P A B

( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 1 2 2 2 1 1... | ... | ... ... |− − −= × × × ×n n n n nP A A A P A A A A P A A A A P A A P A

( )( ) ; ( ) ( )≤ −∞

= = =∑ ∫k

x

kx x

F x P X x F x f u du ( ) ( ) ( )< ≤ = −P a X b F b F a

( ) ( )1 , 0, 1, ..., − = = − =

n kknP X k p p k n

k

( ) , 0, 1, ... 0!

= = = >λλ

λke

P X k kk

; 0 01 1 2 2

2

XX XX

ˆ ˆT ; T=

QME 1 xQMES n S

β −β β −β=

+

( )( )( )

( )2 2L C k

ij ij2 2 2 2i ik 1 pL 1 C 1

i 1 j 1 i 1ij i

o e o e

e eɺ ɺχ χ − −− −

= = =

− −Χ = ∩ Χ = ∩∑∑ ∑

UNIVERSIDADE DE ÉVORA - Departamento de Matemática

Exame de Época Recurso de PROBABILIDADES E ESTATÍSTICA * 6/01/2006

ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO

Duração: 3 horas Nota: Justifique todas as respostas de uma forma sucinta.

1. Considere que, numa distribuição de frequências relativa aos gastos energéticos de

80 empresas numa dada actividade, os pontos médios das classes 'ix e as frequências

relativas fi são os seguintes, respectivamente: 'ix = 4, 6, 8, 11, 15 e 21; fi= 0.1375,

0.1875, 0.2500, 0.2000, 0.1000 e 0.1250. Suporte a veracidade ou a falsidade da

conclusão: “A maior parte das empresas tem um consumo energético inferior à

média.”.

2. Os ganhos percentuais, ao fim de 3 anos, com as obrigações de 16 empresas do

sector industrial foram os seguintes:

10.5 41.0 58.5 60.0 60.0 62.5 65.0 65.0 65.0 67.5

70.0 70.0 72.5 73.8 74.8 75.0 75.2 80.0 85.0 98.9

Esboce o diagrama caixa de bigodes. Comente.

3. Suponha que as necessidades, nos meses de primavera e verão, de gás natural de um

determinado país podem ser descritas por uma variável aleatória contínua com

função densidade de probabilidade dada por:

23

( ) , 0 28

xf x x= ≤ ≤

Admita que você é o director da empresa fornecedora do país, GasPor, e que o

ministro desse país propôs que nos meses cujo fornecimento não cobrisse as

necessidades a sua empresa fosse penalizada em 100 000€ enquanto no caso

contrário a sua empresa beneficiaria de um prémio de 50 000€. Não sendo possível

assegurar mais que 1.5 unidades por mês no abastecimento de gás ao país, acha que

seria vantajoso para a sua empresa aceitar a proposta do ministro? Justifique.

4. Uma determinada empresa tem produção mensal igual a 100 toneladas. Sabendo que

a procura mensal é uma variável aleatória normal com média 80 toneladas e desvio

Model Summary

,985a ,971 ,962 ,11461Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Preço do Barril do Petróleoa.

Coefficients a

2,715 ,205 13,252 ,001

-,053 ,005 -,985 -10,057 ,002

(Constant)

Preço do Barrildo Petróleo

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Taxa de Crescimento do PIBa.

padrão 10 toneladas, calcule a probabilidade de num semestre haver procura

excedentária no máximo em dois meses.

5. Seja X1, X2, ...,Xn, uma amostra aleatória de uma população com distribuição

exponencial.

Determine, pelo método de máxima verosimilhança, o estimador de λ.

6. Diga, justificando, se é verdadeira ou falsa a seguinte proposição: “Supondo que o

intervalo de confiança a 99% para a diferença de médias é dado por (0.02, 0.15),

então podemos concluir que as médias populacionais diferem ao nível de 5%.”.

7. Numas eleições Presidenciais de determinado país foi realizada uma sondagem à

boca das urnas num dado concelho. Nessa sondagem foram inquiridas 210 pessoas,

78 das quais disseram ter votado no candidato CS.

a) Haverá evidência estatística para concluir, ao nível de 5%, que o candidato CS

obterá nesse Concelho mais de 30% dos votos?

b) As sondagens apresentadas por um canal de televisão, apresentavam o vencedor

com uma votação de 51,5%, com uma confiança de 95% e um erro máximo de

2,23%. Calcule a dimensão da amostra utilizada por esse canal de televisão.

8. Suponha que se obtiveram 12 observações da taxa de crescimento do PIB de um

dado país por trimestre e do preço médio do barril de petróleo nesse trimestre.

Realizou-se uma análise de regressão utilizando o SPSS e obtiveram-se, entre

outros, os seguintes outputs:

c) Interprete o valor dos coeficientes do modelo de regressão linear, avalie a

qualidade do ajustamento efectuado e indique os pressupostos subjacentes.

d) Construa um intervalo de confiança a 95% para a previsão do crescimento da

taxa do PIB por trimestre quando o preço por barril é de 50 dólares, admitindo

uma preço médio por barril de 40 dólares.

9. Recolheu-se uma amostra aleatória de 16 tempos de entrega de SMS, de uma dada

operadora, TM, durante o período de Natal tendo-se obtido uma média igual a 28

segundos e um desvio padrão igual a 36 segundos. Sabendo que, durante o mês de

Outubro, numa amostra de 24 SMS se obteve um valor médio do tempo de entrega

igual a 19 segundos e um desvio padrão igual a 9 segundos, diga se há evidência

estatística, ao nível de significância de 5%, que lhe permita concluir que os tempos

de entrega no Natal são superiores aos tempos de entrega em Outubro? Admita os

pressupostos que entender necessários para realizar uma abordagem paramétrica.

10. No caso descrito no exercício anterior testou-se, para a amostra recolhida no período

de Natal, um dos pressupostos através do teste de Kolmogorov-Smirnov, tendo-se

obtido os seguintes resultados:

One-Sample Kolmogorov-Smirnov Test

16

27,6875

35,92162

,361

,361

-,229

1,445

,031

,022

,000

N

Mean

Std. Deviation

Normal Parametersa,b

Absolute

Positive

Negative

Most ExtremeDifferences

Kolmogorov-Smirnov Z

Asymp. Sig. (2-tailed)

Exact Sig. (2-tailed)

Point Probability

TEMPO

Test distribution is Normal.a.

Calculated from data.b.

Indique a hipótese que testou quando recorreu a este teste e justifique porque não

deveria ter realizado a abordagem paramétrica. Neste caso, que teste poderia

utilizar? Descreva-o sucintamente.

11. Uma companhia de seguros tem três tipos de clientes – de risco elevado, médio e de

baixo risco. Do histórico dessa companhia, admitia-se que 10% dos clientes

correspondem à primeira categoria e 40% correspondem à segunda. Com base nos

registos actualizados da empresa conclui-se que as apólices se distribuem da

seguinte forma:

Risco

Elevado Médio Baixo

420 980 1100

Poderá concluir, ao nível de 5%, que neste momento já não é correcta a distribuição

proporcional das apólices?

Cotação:

1) 1.5 2) 1.5 3) 1.5 4) 2.0 5) 1.5 6) 1.0 7a) 1.5 7b) 1.5 8a) 2.0 8b) 1.5 9) 1.5 10)

1.5 11) 1.5

Formulário de Apoio:

1ip i i

i

np Nx l R

n−−

= + ×ɶ ( )22

1

1

1

n

i ii

s n x xn =

= −− ∑ [ ]1 33 , 3− +Q IQ Q IQ 3 1= −IQ Q Q

[ ] [ ]

[ ]

1

1

, 2,

np np

p

np

x xnp

xx np

+

+

+ ∈= ∉

ℕɶ

( )

( ) ( )

3' ' ' '3 3 2 1 1

2 4' ' ' ' ' '4 4 3 1 2 1 1

3 2

4 6 3

m m m m m

m m m m m m m

= − +

= − + −

( )1=

−=∑

kr

i ii

r

n x xm

n ' 1==

∑k

ri i

ir

n xm

n 3

1 3γ =

m

s 4

2 43γ = −

m

s

( ) ( )3 1

3 1

− − −

ɶ ɶQ x x Q

Q Q

ˆ−=

x xg

s

( )3 1

90 102

−−

Q Q

P P 1

1

=

=

=∑

i

jj

i k

jj

n

pn

1

1

=

=

=∑

i

i ij

i k

i ij

n x

qn x

1

11

1

1

=−

=

= −∑

k

iik

ii

qG

p

( )( ) ( )

( ) ( )1

|| , 1, 2, ..., n

|=

×= =

∑i i

i n

k kk

P A P B AP A B i

P A P B A

( ) ( ) ( )1

|=

=∑n

i ii

P B P B A P A ( ) ( ) ( )− = − ∩P A B P A P A B

( ) ( ) ( ) ( )∪ = + − ∩P A B P A P B P A B

( ) ( ) ( ) ( ) ( ). | |∩ = =P A B P A P B A P B P A B

( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 1 2 2 2 1 1... | ... | ... ... |− − −= × × × ×n n n n nP A A A P A A A A P A A A A P A A P A

( )( ) ; ( ) ( )≤ −∞

= = =∑ ∫k

x

kx x

F x P X x F x f u du ( ) ( ) ( )< ≤ = −P a X b F b F a

( ) ( )1 , 0, 1, ..., − = = − =

n kknP X k p p k n

k ( )

xe ;x, 0f x

0; caso contrário

−λλ λ>=

( ) , 0, 1, ... 0!

= = = >λλ

λke

P X k kk

; 0 01 1 2 2

2

XX XX

ˆ ˆT ; T=

QME 1 xQMES n S

β −β β −β=

+

( )( )( )

( )2 2L C k

ij ij2 2 2 2i ik 1 pL 1 C 1

i 1 j 1 i 1ij i

o e o e

e eɺ ɺχ χ − −− −

= = =

− −Χ = ∩ Χ = ∩∑∑ ∑

UNIVERSIDADE DE ÉVORA - Departamento de Matemática

PROBABILIDADES E ESTATÍSTICA (2003/04)

Formulário de Apoio de Inferência Estatística

DISTRIBUIÇÕES AMOSTRAIS INTERVALOS DE CONFIANÇA ESTATÍSTICA DE TESTE

X N ,n

∩ σ

µ 1 1

2 2

x z , x zn n− −

− × + × α α

σ σ

0XZ

n

−=

µ

σ

n 1

Xt

S'n

−∩µ

n 1, 1 n 1, 1

2 2

s ' s 'x t , x t

n n− − − −

− × + × α α

0XT

S'n

−=

µ

( ) 22n 12

n 1 S'−

−∩χ

σ 2 2

1 ,n 1 ,n 12 2

n 1 n 1s ' , s '

− − −

− − α αχ χ

( ) 2

220

n 1 S'−Χ =

σ

( )p 1 pp N p,

n

− ∩ ɺ

( ) ( )1 1

2 2

ˆ ˆ ˆ ˆp 1 p p 1 pˆ ˆp z , p z

n n− −

− − − × + × α α ( )

0

0 0

p pZ

p 1 p

n

−=

1 2

2 21 2

n 1,n 12 22 1

S'F

S' − −× ∩σ

σ

1 2 1 2

2 22 22 2n 1,n 1, n 1,n 1, 11 12 2

s ' s 'F , F

s ' s '− − − − −

α α

2122

S'F

S'=

2 21 2

1 2 1 21 2

X X N ,n n

− ∩ − +

σ σµ µ

2 2 2 21 2 1 2

1 2 1 21 1

1 2 1 22 2

x x z , x x zn n n n− −

− − × + − + × + α α

σ σ σ σ

( ) ( )1 2 1 2 0

2 21 2

1 2

X X

n n

− − −

+

µ µ

σ σ

DISTRIBUIÇÕES AMOSTRAIS INTERVALOS DE CONFIANÇA ESTATÍSTICA DE TESTE

( ) ( )

( ) ( )

1 2

1 2 1 2

n n 2

1 2

2 21 1 2 2

1 2

X Xt

1 1S

n n

n 1 S' n 1 S'ˆcom Sn n 2

+ −

− − −∩

+

− + −=

+ −

µ µ

( ) ( )

1 2 1 21 2 1 2

n n 2, 1 n n 2, 11 2 1 22 2

2 21 1 2 2

1 2

1 1 1 1ˆ ˆx x t s , x x t s

n n n n

n 1 s ' n 1 s 'ˆcom s

n n 2

+ − − + − −

− − × + − + × +

− + −=

+ −

α α

( ) ( )1 2 1 2 0

1 2

X XT

1 1S

n n

− − −=

+

µ µ

( ) ( )1 1 2 21 2 1 2

1 2

p 1 p p 1 pˆ ˆp p N p p ,

n n

− − − ∩ − + ɺ

( ) ( ) ( ) ( )1 1 2 2 1 1 2 21 2 1 2

1 11 2 1 22 2

ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆp 1 p p 1 p p 1 p p 1 pˆ ˆ ˆ ˆp p z ,p p z

n n n n− −

− − − − − − × + − + × + α α

( ) ( )( ) ( )1 2 1 2 0

1 1 2 2

1 2

ˆ ˆp p p pZ

ˆ ˆ ˆ ˆp 1 p p 1 p

n n

− − −=

− −+

Estimação Pontual

( ) ( )( ) ( ) ( )( )

( )

2

n

n

ˆ ˆEnv E

ˆ ˆ ˆEQM Var Env

limE

limVar 0

→∞

→∞

= −

= + = =

θ θ θ

θ θ θ

θ θ

θ

;

( ) ( ) ( )

( )

k

m' r ' rr k k r

x' '

nr r r

i' i 1r

E X x P X x ; = x f (x)dx

m com x

mn

+∞

−∞

=

= = == =

∑ ∫

µ µ

µ ;

( ) ( )

( ) ( )

( ) ( )

n

kk 1

2 2

2 2

L | x f x

dL | x d ln L | x0 ou 0

d d

d L | x d ln L | x0; 0

d d

=

=

= =

< <

∏ θθ

θ θ

θ θ

θ θ

θ θ

Inquérito anónimo realizado aos alunos

Proposta de avaliação do docente e da disciplina

Probabilidades e Estatística 2005/2006 Departamento de Matemática da Universidade de Évora

Caro aluno, Com o objectivo de melhorar a forma e o conteúdo desta disciplina nos próximos anos, muito lhe agradecíamos se pudesse partilhar a sua opinião sobre o conteúdo e a docência desta disciplina. Nos pontos que a seguir se seguem, avalie, por favor, o Docente e a Disciplina, assinalando com uma cruz a sua opção. Use as seguintes categorias de resposta:

A – Muito Bom B – Bom C – Suficiente D – Insuficiente E – Muito insuficiente

Avaliação da disciplina

1. Adequação do número de horas lectivas ____________ A B C D E 2. Acesso à bibliografia recomendada ______________________ A B C D E 3. Coordenação entre os docentes _______ A B C D E 4. Correspondência entre conhecimentos avaliados e matéria leccionada _ A B C D E 5. Adequação dos recursos utilizados para a leccionação desta disciplina A B C D E 6. Considera a sua assiduidade às aulas desta disciplina ______ A B C D E 7. Em média quantas horas de estudo pensa ter dedicado à disciplina por semana ___

Avaliação dos Docentes

Docente: Paulo Infante

7. Preparação, organização e utilização do tempo de aula _______ A B C D E 8. Clareza com que o Docente expõe a matéria __ A B C D E 9. Empenho e o entusiasmo mostrados no ensino _ A B C D E 10. Aptidão para incentivar e para estimular o interesse dos Alunos A B C D E 11. Disponibilidade para esclarecer dúvidas __________ A B C D E 12. Respeito, tolerância e honestidade para com os Alunos A B C D E 13. Assiduidade e pontualidade ________ A B C D E 14. Transparência, lealdade e igualdade na avaliação dos Alunos _ A B C D E 15. Classificação global do Docente é:__ A B C D E

Docente: Gonçalo Jacinto

7. Preparação, organização e utilização do tempo de aula _______ A B C D E 8. Clareza com que o Docente expõe a matéria __ A B C D E 9. Empenho e o entusiasmo mostrados no ensino _ A B C D E 10. Aptidão para incentivar e para estimular o interesse dos Alunos A B C D E 11. Disponibilidade para esclarecer dúvidas __________ A B C D E 12. Respeito, tolerância e honestidade para com os Alunos A B C D E 13. Assiduidade e pontualidade ________ A B C D E 14. Transparência, lealdade e igualdade na avaliação dos Alunos _ A B C D E 15. Classificação global do Docente é:__ A B C D E

CRÍTICAS / COMENTÁRIOS / SUGESTÕES