Prévia do material em texto
01-10-2021
Draft de Apontamentos Teóricos
Albertina Delgado
UNIVERSIDADE CATÓLICA DE ANGOLA
FACULDADE DE ECONOMIA E GESTÃO
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
1
Este apontamento é para uso exclusivo para os
Estudantes da Faculdade de Economia e Gestão
da Universidade Católica de Angola. Constitui
um resumo dos apontamentos de aulas da
Professora Albertina Delgado.
Nota: Ainda é um draft, texto ainda carece de
correções ortográfica. Substitui todos os
anteriores.
Draft de Apontamentos Teóricos
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
2
Conteúdo
1. Introdução ................................................................................................................................................................ 4
1.1 Conceitos Básicos .................................................................................................................................................. 4
1.1.1- Objectivo da Estatística ................................................................................................................................. 5
1.1.2- Utilidade da Estatística .................................................................................................................................. 5
1.2 Evolução histórica da Estatística ........................................................................................................................... 6
1.3- Método Estatístico de Resolução de um Problema .............................................................................................. 8
1.4- Escalas de medidas de dados Estatísticos ............................................................................................................. 9
2. Estatística Descritiva ............................................................................................................................................. 11
2.1- Classificação das Variáveis ................................................................................................................................ 11
2.2- Apresentação dos Dados .................................................................................................................................... 13
2.2.1 Quadros e Gráficos ....................................................................................................................................... 13
Gráficos para dados qualitativos ........................................................................................................................ 14
Gráficos para dados quantitativos discretos ...................................................................................................... 17
Gráficos para dados quantitativos contínuos ..................................................................................................... 17
2.2.2- Distribuição de Frequências ........................................................................................................................ 19
Variáveis qualitativas e variáveis quantitativas discretas .................................................................................. 20
Variáveis quantitativas contínuas ...................................................................................................................... 22
2.3-Medidas de Estatística Descritiva ....................................................................................................................... 24
2.3.1- Medidas de localização ............................................................................................................................... 24
2.3.1.1 Medidas de Tendência Central .............................................................................................................. 24
Média Aritmética ........................................................................................................................................... 24
Mediana ......................................................................................................................................................... 26
Moda .............................................................................................................................................................. 28
2.3.1.2 Medidas de Tendência não Central ........................................................................................................ 29
Quartis ........................................................................................................................................................... 29
Decis .............................................................................................................................................................. 31
Percentis ........................................................................................................................................................ 31
2.3.2- Medidas de dispersão e concentração ......................................................................................................... 32
2.3.2.1 Medidas de Dispersão Absoluta ............................................................................................................ 32
2.3.2.2 Medidas de dispersão relativa ................................................................................................................ 34
2.3.3- Medidas de assimetria e Curtose ................................................................................................................. 34
2.3.3.1 Medidas de assimetria ........................................................................................................................... 34
2.3.3.2 Medidas de Achatamento ou de Curtose ............................................................................................... 35
2.3.4- Medidas de Concentração e Desigualdade .................................................................................................. 36
2.3.4.1 Curva de Lorenz .................................................................................................................................... 36
2.3.4.2 Índice de Gini ........................................................................................................................................ 36
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
3
2.4- Associação entre duas variáveis ......................................................................................................................... 37
2.4.1 Regressão linear simples .............................................................................................................................. 38
2.4.2 A Função de Regressão Populacional (FRP) ................................................................................................ 39
2.4.3 Propriedades ................................................................................................................................................. 39
2.4.4 Mínimos Quadrados Ordinários – (OLS- Ordinary Least Squases) ............................................................. 40
2.4.4.1 Hipóteses do Mínimos Quadrados Ordinários ....................................................................................... 42
2.4.5 Análise do grau de associação entre variáveis .............................................................................................. 43
2.4.5.1 Coeficiente de determinação.................................................................................................................. 43
2.4.5.2 Coeficiente de correlação linear ............................................................................................................ 43
2.4.5.3 Coeficiente de correlação linear de Person ............................................................................................44
2.4.5.4 Coeficiente de correlação linear de Sperman ........................................................................................ 44
2.4.5.5 Covariância ............................................................................................................................................ 44
3. Teoria da Probabilidade ......................................................................................................................................... 45
3.1 Conceito da teoria das Probabilidades ................................................................................................................. 46
3.2- Acontecimentos .................................................................................................................................................. 46
3.2.1- Álgebra dos Acontecimentos....................................................................................................................... 47
3.3 - Conceitos de Probabilidade ............................................................................................................................... 48
3.1.1 - Definição clássica de probabilidade ........................................................................................................... 48
3.3.2- Definição frequencista de probabilidade ..................................................................................................... 49
3.3.3- Definição subjectiva de probabilidade ........................................................................................................ 49
3.4- Axiomas da teoria das probabilidades ............................................................................................................ 50
3.5- Teoremas da probabilidade ............................................................................................................................ 51
3.6- Probabilidade condicionada ........................................................................................................................... 52
3.7- Acontecimentos independentes ...................................................................................................................... 53
3.7.1- Acontecimentos independentes versus acontecimentos incompatíveis ou mutuamente exclusivos ........... 53
3.8- Teorema da Probabilidade Total .................................................................................................................... 54
3.9- Teorema de BAYES ....................................................................................................................................... 54
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
4
1. Introdução
SUMÁRIO
1.1. Conceitos básicos
1.2. Evolução histórica da Estatística
1.3. Método estatístico de resolução de um problema
1.4. Escalas de medidas de dados estatísticos
1.1 Conceitos Básicos
O que é a Estatística?
A Estatística é a ciência que se ocupa da obtenção de informação, seu tratamento inicial, com a
finalidade de, através de resultados probabilísticos adequados, inferir de uma amostra para a
população, e eventualmente prever a evolução futura de um fenómeno. Em outras palavras, é um
instrumento de leitura de informação, e da sua transformação em conhecimento.
De forma mais clara:
Estatística é a ciência de colectar, organizar, apresentar, analisar e interpretar dados numéricos ou
não (informações) com o objectivo de tomar melhores decisões.
Estatística, refere-se a ciência em objecto de estudo.
Estatísticas, referem-se a dados numéricos.
Estatística descritiva, consiste na recolha, apresentação, análise e interpretação de dados
numéricos através da criação de instrumentos adequados que podem ser quadros, gráficos e
indicadores numéricos.
Estatística Aplicada, refere-se as técnicas pelas quais os dados de natureza quantitativa são
colectados, organizados, apresentados e analisados.
Inferência Estatística, permite estimar as características desconhecidas de uma população
e testar se determinadas hipóteses sobre essas características são plausíveis.
Parâmetros – Resumem as características da população e assumem valores numéricos fixos
(constantes), isto é, são valores exactos e são designado por letras maiúsculas do alfabeto
Grego. Ex: média da população (µ), variância populacional ( σ2), desvio-padrão populacional
(σ).
Estatísticas – É toda a função que opera sobre a amostra. Isto é, são valores não exactos,
dado que de uma população se podem retirar diversas amostras estamos perante valores que
variam de amostra para amostra, e são designado por letras maiúsculas do alfabeto
Romano. Ex: média amostral (�̅� ), a variância amostral (S2), desvio-padrão amostral (S).
População (ou Universo): Conjunto de unidades com uma ou mais características comuns
(n.º de elementos é N).
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
5
Amostra: Subconjunto da População (nº de elementos é n).
Exemplos:
1) População: Intenção de voto dos eleitores de Luanda
Amostra: Intenção de voto de alguns dos eleitores de Luanda seleccionados a partir da lista
telefónica.
2) População: Consumo de um novo detergente pelos clientes de um supermercado
Amostra: Consumo do produto recolhido por entrevista à porta do Supermercado
1.1.1- Objectivo da Estatística
O objectivo fundamental deste ramo do conhecimento consiste na recolha, compilação, análise e
interpretação de dados, havendo a necessidade de se distinguir entre estatística descritiva e
inferência estatística.
Estatística Descritiva: conjunto de métodos estatísticos que visam sumariar e descrever os atributos
mais proeminentes aos dados.
Estatística Inferencial: conjunto de métodos estatísticos que visam caracterizar (ou inferir sobre)
uma população a partir de uma parte dela (a amostra).
1.1.2- Utilidade da Estatística
A utilidade da estatística pode ser resumida do seguinte modo:
Permite descrever e compreender relações entre variáveis de forma imediata: a informação
é apresentada de modo a possibilitar uma rápida interpretação e identificação das relações
mais importantes;
Permite a tomada de melhores e mais rápidas decisões: é possível controlar mais
informações num espaço de tempo mais curto;
Facilita a tomada de decisões: o conhecimento de situações passadas e presentes,
acompanhadas por uma previsão fundamentada da evolução futura, são as bases para as
tomadas de decisões.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
6
1.2 Evolução histórica da Estatística
O termo estatística vem da expressão em Latim statisticum collegium isto é, palestra sobre os
assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de
estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A
palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de
Lena e adoptada pelo académico alemão Godofredo Achenwall. Aparece como vocabulário na
Enciclopédia Britânica em 1797, e adquiriu um significado de colecta e classificação de dados, no
início do século 19.
A medida que a sociedade primitiva se desenvolvia e organizava-se houve necessidade de se
conhecer dados numéricos dos recursos disponíveis, os Estados, desde tempos longínquos,
precisaram conhecer determinadas características da população, efectuar a sua contagem e saber a
sua composição ou os seus rendimentos.
Para que os governantes das grandes civilizações antigas tivessem conhecimento dos bens que o
Estado possuía e como estavam distribuídos pelos seus habitantes, realizaram-se as primeiras
estatísticas, nomeadamente para determinarem leis sobre impostos e números de homens disponíveis
para combater.Estas estatísticas, eram frequentemente limitadas à população adulta masculina.
O primeiro dado disponível sobre um levantamento estatístico foi referido por Heródoto, que
afirmava ter-se efectuado em 3050 a.c um estudo das riquezas da população do Egipto com a
finalidade de averiguar quais os recursos humanos e económicos disponíveis para a construção das
pirâmides.
Existem indícios, que constam da Bíblia, relativamente a recenseamentos feitos por Moisés (1490
a.c). Outra estatística referida pelos investigadores foi feita no ano 1400 a.c, quando Ramsés II
mandou realizar um levantamento das terras do Egipto.
As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que eram
propriedade da Igreja, são algumas das estatísticas importantes de que há referências desde a queda
do império romano.
Para responder ao desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar,
apresentar, interpretar os dados recolhidos foram para os censos e são para a Estatística um aspecto
essencial do método utilizado. Mas, um longo caminho havia de ser percorrido até aos dias de hoje.
Até ao início do séc. XVII, a Estatística limitou-se ao estudo dos “assuntos de Estado”. Usada pelas
autoridades políticas na inventariação ou arrolamento dos recursos disponíveis, a Estatística
limitava-se a uma simples técnica de contagem, traduzindo numericamente factos ou fenómenos
observados fase da Estatística Descritiva.
No séc. XVII, com os aritméticos políticos, nomeadamente John Graunt (1620-1674) e Sir William
Petty (1623-1687), inicia-se em Inglaterra uma nova fase de desenvolvimento da Estatística, virada
para a análise dos fenómenos observados na fase da Estatística Analítica.
John Graunt, uma pessoa engenhosa e estudiosa, tinha o hábito de se levantar cedo para estudar,
antes da abertura da sua loja, inspirado nas tábuas de mortalidade que semanalmente se publicavam
na sua paróquia, publicou, em 1660, um trabalho estatístico sobre a mortalidade dos habitantes de
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
7
Londres, procurando dar interpretações sociais às listas de tempos de vida. Sir William Petty,
baseado neste trabalho, escreveu um livro de largo sucesso, divulgando a nova ciência da Aritmética
Política.
Em 1692, o astrónomo Edmund Halley (1658-1744), famoso pela descoberta do cometa de órbita
elíptica que se aproxima da Terra de 75 em 75 anos, baseando-se também em listas de nascimento e
falecimento, foi o percursor das actuais tabelas de mortalidade, base das anuidades dos seguros de
vida.
O desenvolvimento do Cálculo das Probabilidades surgiu também no século XVII. A ligação das
probabilidades com os conhecimentos estatísticos veio dar uma nova dimensão à Estatística, que
progressivamente se foi tornando um instrumento científico poderoso e indispensável. Considera-
se assim uma nova fase, a terceira, em que se começa a fazer inferência estatística: quando a partir
de observações se procurou deduzir relações causais, entre variáveis, realizando-se previsões a partir
daquelas relações.
A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem
ao alemão Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik,
do grego statizein; outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento
que dela tiravam os políticos e o Estado.
De acordo com a Revista do Instituto Internacional de Estatística, “Cinco homens, Hermann
Conring; Gottfried Achenwall; Johann Peter Süssmilch; John Graunt e William Petty já receberam
a honra de serem chamados de fundadores da estatística, por diferentes autores.1”
A partir do século XVIII são vários os nomes que se destacaram na história da evolução da estatística,
tais como Quételet (1796-1874), Galton (1822-1911), Karl Pearson (1857-1936), Weldon (1860-
1906), Ronald Fisher (1890-1962).
Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantém esta ligação, como
todos os Estados e a sociedade em geral dependem cada vez mais dela. Por isso, em todos os Estados
existe um Departamento ou Instituto Nacional de Estatística. Na actualidade, a Estatística já não se
limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicação alargou-se à
análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia,
Educação, etc., e ainda a domínios aparentemente desligados, como estrutura de linguagem e estudo
de formas literárias.
1 Cfr WILLCOX, Walter (1938) The Founder of Statistics. Review of the International Statistical Institute
5(4):321-328.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
8
1.3- Método Estatístico de Resolução de um Problema
O método estatístico de resolução de um problema, é constituído por diferentes etapas, a identificação, a
recolha, apresentação e interpretação dos dados. Elas podem ser apresentadas pelo diagrama:
Identificação do Problema
É importante desde início do estudo, ter claro, qual é problema a analisar, e uma vez conhecido é importante
saber, qual o tipo de decisões que se pretende tomar.
Recolha dos Dados
A recolha de toda a informação pode ser feita directamente (quando os dados são obtidos da fonte originária)
ou de uma forma indirecta (quando dados recolhidos provém já de uma recolha indirecta).
Os dados obtidos de fonte originária, isto é, quando é possível encontrar em registos ou ficheiros, chamam-
se dados primários; enquanto que os valores não disponíveis nestas fontes e calculados a partir daqueles
são dados secundários.
Exemplos:
Dados Primários: Todos os dados resultantes de inquéritos feitos directamente a uma população ou a um
grupo desta população.
Dados Secundários: Todos os dados disponíveis nas estatísticas publicadas do INE. As fontes dos dados
podem ainda ser classificados como internas e externas.
Fontes Internas, os serviços de contabilidade, produção ou marketing de uma empresa,
constituem fontes internas de informação económicas e comercial que deverá ser posta ao
dispor dos órgãos de decisão da empresa.
Fontes Externas, informação externa a empresa é a proveniente dos organismos públicos
como o Governo, INE, semanários económicos e revistas de especialidade.
No que diz respeito à periodicidade, a recolha dos dados pode ser classificada como:
Continua, quando se realiza permanentemente;
Periódica, quando feita em intervalos de tempo;
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
9
Ocasional, quando realizada de modo casual.
Muitas vezes acontece, não estar disponível toda informação necessária ou porque não existe, ou
porque, se encontra desactualizada. Nestes casos é necessário fazer uma nova recolha de informação
Crítica dos Dados
Uma vez recolhidos os dados, é necessário proceder-se a uma revisão crítica, de modo ao suprir
valores estranhos ou eliminar erros capazes de provocar futuros enganos de apresentação e análise
ou mesmo de enviesar conclusões obtidas.
Apresentação dos Dados
Aqui começa o principal objectivo da estatística descritiva, criar os instrumentos necessários para
classificar e apresentar conjuntos de dados numéricos, de modo que a informação neles contida seja
compreendida mais fácil e rapidamente. Este processo de classificação consiste na identificação de
unidades de informação com características comuns e no agrupamento em classes.
Uma vez classificados os dados, passa a ser possível sintetizar a informação neles contida com ajuda
de quadros e valores numéricos descritivos, que ajudem a compreender a situação e a identificar
relações importantes entre as variáveis.
Análise e InterpretaçãoPor último é necessário, interpretar os resultados encontrados. A interpretação será tanto mais
facilitada quanto se tiver escolhido em etapas anteriores, os instrumentos mais apropriados à
representação e análise do tipo de dados recolhidos.
1.4- Escalas de medidas de dados Estatísticos
Dependendo do tipo de variáveis que constituem os dados estes podem ser expressos em quatro
escalas distintas: nominal, ordinal, por intervalo e por rácios.
Os dados qualitativos exprimem-se nas duas primeiras escalas e os dados quantitativos nas duas
últimas.
Escala Nominal – são os valores (numéricos ou não) que não possuem uma ordem
intrínseca. Um caso particular deste tipo de escala de medida ocorre quando a característica
em estudo envolve apenas duas categorias. Essas características são denominadas binárias
ou diatómicas.
Exemplos:
O tipo de sangue de uma pessoa (O, A, B e AB)
Categorias taxionómicas das plantas ou animais.
O sexo (0 - Feminino, 1 - Masculino) ou questões que apenas podem ser
respondidas com “sim” ou “não”.
Escala Ordinal – são os valores (numéricos ou não) que possuem uma ordem intrínseca.
Esta escala de medida pode ser construída a partir de escalas nominais quando existe
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
10
paralelismo evidente entre a escala nominal e uma sequência crescente ou decrescente com
significado.
Exemplos:
Pode-se perguntar a um consumidor qual é a sua opinião sobre um determinado
produto alimentar de acordo com a seguinte lista: (detesta; gosta pouco;
indiferente; gosta; adora), sendo evidente que esta lista corresponde a uma
sequência ordenada com cinco categorias.
Classificações obtidas no 2º e 3º ciclos do ensino básico (1 a 5).
Classificação dos camarões para venda.
Grupos etários (crianças, jovens, adultos e idosos)
Escala de Intervalos – os valores numéricos possuem ordem e têm diferenças significado.
Este tipo de escala é usado com dados quantitativos tanto discretos como contínuos sendo
que a distância entre os valores que constituem os intervalos deve ser igual.
Exemplos:
O número de automóveis que atravessa a ponte Elisabeth em cada hora pode ser
definido numa escala por intervalos de valores discretos, por exemplo, entre 0 e
150; entre 150 e 300; entre 300 e 450, etc.
A temperatura mínima diária do ar em ºC numa estação meteorológica num
determinado ano pode ser definido numa escala por intervalos de valores
contínuos, por exemplo, [-5, 0[; [0, 5[; [5, 10[; [10, 15[; etc.
Escala de Razões – O valor zero representa ausência da característica e múltiplos de valores
possuem significado. As escalas deste tipo têm as mesmas propriedades que a escala por
intervalos para variáveis contínuas e, adicionalmente, apresentam a característica de
possuírem um zero absoluto como valor mínimo de modo que as razões entre duas medidas
tenham sempre o mesmo valor para qualquer que seja a unidade utilizada.
Exemplos:
O peso pode constituir uma escala por rácios (a razão entre os pesos de dois
pacotes de açúcar, por exemplo, é sempre o mesmo qualquer que seja a unidade
de medida: g, kg, ton., etc.) mas a temperatura não (10ºC = 50 ºF; 30 ºC=86 ºF
porém 10/30 ≠ 50/86.
Medidas de comprimento, áreas, pesos ou intervalos de tempo.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
11
2. Estatística Descritiva
SUMÁRIO
2.1 Classificação das variáveis
2.2 Apresentação de dados
2.2.1 Quadros e Gráficos
2.2.2 Distribuição de frequências
2.3 Medidas de Estatística Descritiva
2.3.1 Medidas de localização
2.3.2 Medidas de dispersão e concentração
2.3.3 Medidas de assimetria e curtose
2.4 Associação entre duas variáveis
2.4.1 Regressão linear
2.4.2 Análise da correlação
2.1- Classificação das Variáveis
A variável é uma característica (quantificada) que pode variar de elemento para elemento, de uma
amostra ou população.
Uma variável, enquanto representar apenas a característica e não estiver concretizada em nenhum
elemento, representa-se habitualmente por uma letra maiúscula. Quando se pretende representar o
valor da variável para um indivíduo utiliza-se a respectiva letra minúscula.
Exemplo:
X representa a hemoglobina no sangue;
x =14,2 representa a hemoglobina de um certo indivíduo
Uma amostra pode conter mais de uma característica para cada uma das unidades observadas.
Por exemplo na população angolana, podem interessar várias características dos indivíduos: o
peso, a altura, a cor dos olhos, a raça, o tipo de sangue, etc.
Tipos de variáveis
Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa,
ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. Com
exemplo temos: comprimento de um escaravelho, o nº de filhos de um casal, a temperatura da água,
etc.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
12
Variáveis discretas: características mensuráveis que assumem apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são
o resultado de contagens. Por exemplo o número de filhos, número de bactérias por litro de
leite, número de cigarros fumados por dia.
Variáveis contínuas, características mensuráveis que assumem valores em uma escala
contínua (na recta real), para as quais valores fraccionais fazem sentido. Usualmente devem
ser medidas através de algum instrumento, a título de exemplo temos o peso (balança), altura
(régua), tempo (relógio), pressão arterial, idade.
Variáveis Qualitativas (ou categóricas): são as características que não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos. Podem ser nominais ou ordinais. Para exemplo deste tipo de variáveis
pode-se citar as seguintes: o tipo de sangue de uma pessoa (O, A, B e AB); o sexo (Feminino,
Masculino).
Variáveis nominais: não existe ordenação dentre as categorias. Por exemplo: sexo, cor dos
olhos, fumante/não fumante, doente/sadio.
Variáveis ordinais: existe uma ordenação entre as categorias. Exemplificando temos:
escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de
observação (Janeiro, Fevereiro, ..., Dezembro).
OBS:
Uma variável originalmente quantitativa pode ser colectada de forma qualitativa.
Exemplos:
1- A variável idade, medida em anos completos, é quantitativa (contínua); mas, se for informada
apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc.), é qualitativa (ordinal).
2- O peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalha com o valor obtido
na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso - pena, peso-
leve, peso -pesado, etc.).
Outro ponto importante é que nem sempre uma variável representada por números é quantitativa.
Exemplos:
1- O número do telefone de uma pessoa, o número da casa, o número de sua identidade.
2- Às vezes o sexo do indivíduo é registrado na placa de dados como 1 se for masculino e 2 se for
feminino. Isto não significa que a variável sexo passou a ser quantitativa!
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
13
2.2- Apresentação dos Dados
A estatística descritiva pretende organizar, sintetizar e analisar os dados obtidos no estudo de
variáveis relativas a uma população de modo a permitir caracterizar a população e conhecer o seu
comportamento.
A informação fornecida pelos dados é compilada e sintetizada em tabelas e gráficos e através do
cálculo de indicadores numéricos. O desafio da Estatística Descritiva consiste não na própria
construção das tabelas ou dos gráficos mas na escolha mais adequada destasferramentas de modo a
caracterizar correctamente as variáveis em estudo.
2.2.1 Quadros e Gráficos
Quando nos deparamos com muitos dados não classificados torna-se muito difícil tirar conclusões.
Por isso é necessário proceder a um trabalho prévio de ordenação e apresentação desses valores, e a
mesma pode ser feita por quadros e gráficos.
Quer os quadros, quer os gráficos devem apresentar três partes: o cabeçalho, o corpo e o rodapé. O
cabeçalho deve dar-nos a informação sobre os dados, em que consistem e a que se referem (lugar e
época); o corpo é representado pelas colunas e sub colunas dentro dos quais se apresentam os dados;
no rodapé, para além da identificação dos dados, poderão ainda incluir-se quaisquer observações
pertinentes.
Quadros
A UCAN resolveu observar as alturas (em cm) dos alunos de uma turma de Contabilidade e
Administração do 2º Ano. O resultado obtido foi o seguinte:
Quadro 1: Alturas (em cm) dos alunos de uma turma de C. A do 2º Ano
150 169 174 155 165 170 172
152 158 163 158 166 158 166
170 171 162 171 161 154 168
161 164 166 164 162 156 167
Fonte: UCAN, 2009
O quadro referido pode ser apresentado em ordem crescente.
Quadro 2: Alturas (em cm) dos alunos de uma turma de C. A do 2º Ano
150 156 161 163 166 168 171
152 158 161 164 166 169 171
154 158 162 164 166 170 172
155 158 162 165 167 170 174
Fonte: UCAN, 2009
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
14
Quadro 3: Vendas de Livros no ano de 2005
Meses do Ano Volumes Vendidos
Janeiro 70,436.00
Fevereiro 77,450.00
Março 71,030.00
Abril 71,425.00
Maio 72,260.00
Junho 72,520.00
Julho 73,075.00
Agosto 73,612.00
Setembro 74,085.00
Outubro 74,350.00
Novembro 74,728.00
Dezembro 74,100.00
Fonte: Livraria Novo Horizonte
Gráficos
A representação gráfica dos dados estatísticos tem por finalidade, dar uma ideia, mais imediata dos resultados
obtidos permitindo chegar-se a conclusões mais rápidas sobre a evolução do fenómeno em estudo ou sobre
a relação entre os diferentes valores apresentados.
Gráficos para dados qualitativos
A representação gráfica dos dados estatísticos tem por finalidade, dar uma ideia, mais imediata dos
resultados obtidos permitindo chegar-se a conclusões mais rápidas sobre a evolução do fenómeno em
estudo ou sobre a relação entre os diferentes valores apresentados.
Os mais comuns são: o diagrama de barras, o histograma, gráfico de sectores e o gráfico de linhas.
Gráfico de Linhas
É o mais utilizado de entre todos os tipos de gráficos devido a sua facilidade de execução e de interpretação.
Sua aplicação é mais indicada para representações de séries temporais sendo por tal razão, conhecidos
também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo vertical (y) a
mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem crescente.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
15
Gráficos de Barras e Colunas
Constrói-se colocando os valores da variável em observação num dos eixos (Horizontal) e as frequências no
outro eixo (Vertical).
O gráfico de barras é um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles
representa a intensidade de uma modalidade ou atributo. É recomendável que cada coluna conserve uma
distância entre si de aproximadamente 2/3 da largura da base de cada barra, evidenciando deste modo, a não
continuidade na sequência dos dados.
O gráfico de colunas é o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de
barras por serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando
as designações das categorias são breves.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
16
Gráficos de Sectores
Consiste na representação gráfica dos resultados num círculo, por meio de sectores. Este tipo de gráfico onde
a variável em estudo é projetada num círculo, de raio arbitrário, dividido em setores com áreas proporcionais
às frequências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
17
Gráficos para dados quantitativos discretos
Diagrama diferencial
Este gráfico é formado por segmentos de retas perpendiculares ao eixo horizontal (eixo da variável), cujo comprimento
corresponde à frequência absoluta ou relativa de cada elemento da distribuição. Suas coordenadas não podem ser unidas
porque a leitura do gráfico deve tornar claro que não há continuidade entre os valores individuais assumidos pela
variável em estudo.
Número de irmãos dos alunos da disciplina Estatística
Diagrama Integral
É o gráfico para frequência acumulada de uma variável quantitativa discreta. Na abscissa são alocados os valores
assumidos pela variável número de irmãos e no eixo das ordenadas suas frequências acumuladas.
Número de irmãos dos alunos da disciplina Estatística
Gráficos para dados quantitativos contínuos
Histograma
Os histogramas são diagramas de barras utilizados para variáveis quantitativas. São formados por rectângulos
justapostos.
A frequência correspondente a cada classe ou intervalo é representada pela superfície de um rectângulo, cuja
base, situada no eixo horizontal, é limitada pelos valores extremos. Cada rectângulo é proporcional à
frequência de cada classe ou intervalo. Pode ser construído para frequências relativas e para frequência
absolutas.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
18
Polígono de frequência simples
É um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas
correspondentes aos pontos médios de cada classe e as ordenadas, às frequências absolutas ou relativas
dessas mesmas classes. O polígono de frequência é um gráfico que deve ser fechado no eixo das abscissas.
Então, para finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e outra à
direita, ambas com frequências zero. Tal procedimento permite que a área sob a linha de frequências seja
igual à área do histograma.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
19
Polígono de frequências acumuladas
É um gráfico que permite descrever dados quantitativos por meio da frequência acumulada. O polígono de frequências
acumuladas é um gráfico de linha que une os pontos cujas abscissas são os limites superiores das classes, e, ordenadas
suas respectivas frequências acumuladas. Quando os dados contidos em cada classe são distribuídos uniformemente,
pode-se estimar, a partir do polígono, o número de elementos pertencentes a qualquer uma das classes que compõe a
distribuição de frequência dos dados e a quantidade ou percentagem de elementos que estão abaixo de certo valor
pertencente ao conjunto de dados.
2.2.2- Distribuição de Frequências
Considerando uma população (N) ou uma amostra (n) de indivíduos com a característica que representa p
modalidades observadas X1,X2, X3, …,Xp . Chama-se distribuição de frequências ao conjunto de todos os
valores ou modalidades de uma variável e das frequências ou numero de ocorrências correspondentes.
Nas tabelas de distribuição de frequências representa-se a forma como uma dada variável se encontra
distribuída pelo conjunto dos indivíduos em que essa variável foi analisada, tendo aplicação tanto em
variáveis qualitativas como quantitativas.
O Quadro de distribuição de frequências é construído da seguinte forma: numa coluna colocam-se todos os
valores que a variável apresenta e na outra coluna o número de ocorrência correspondentes a cada valor da
variável.
Draft Estatistica1, Outubro 2021 | Albertina Delgado
20
Xi Fi
X1 n1
X2 n2
X3 n3
. .
. .
. .
Xp np
Variáveis qualitativas e variáveis quantitativas discretas
Quando se trata de uma variável discreta, a construção de um quadro de distribuição de frequências é
imediata, a cada valor da variável faz-se corresponder o número de ocorrências.
A frequência absoluta (Fi), é o número de vezes que cada modalidade da variável se repete na amostra ou
população. A partir destas podem-se calcular as frequências relativas e as frequências absolutas e relativas
acumuladas.
A frequência relativa (fi), é dada por fi = Fi/N, isto é, o número de vezes que esse valor ocorre (Fi)
relativamente ao total da amostra (n) ou população (N).
As frequências acumuladas (cum Fi; cum fi), representam a soma do número de ocorrências para os valores
da variável inferiores ou iguais ao valor dado, isto é, o número ou proporção de elementos observados que
possuem o valor da característica igual ou inferir à modalidade em causa.
Exemplos:
Variável Qualitativa
Suponha que se pretende estudar a marca de computadores portáteis preferida pelos estudantes do ensino
superior. Tendo-se questionado 50 estudantes obtiveram-se os dados representados na Tabela seguinte:
Marca de computadores portáteis preferida por 50 estudantes do ensino superior
COMPAQ HP COMPAQ COMPAQ COMPAQ ACER ACER ACER FUJITSU TOSHIBA
TOSHIBA COMPAQ COMPAQ TOSHIBA TOSHIBA ACER ACER COMPAQ FUJITSU COMPAQ
FUJITSU IBM FUJITSU IBM COMPAQ TOSHIBA FUJITSU FUJITSU IBM TOSHIBA
ACER TOSHIBA IBM IBM IBM IBM FUJITSU COMPAQ TOSHIBA ACER
FUJITSU COMPAQ ACER IBM IBM TOSHIBA COMPAQ TOSHIBA COMPAQ TOSHIBA
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
21
Fazendo o quadro de distribuição de frequências teremos:
Marcas de Computadores Fi fi Cum Fi Cum fi
COMPAQ 13 0,26 13 0,26
TOSHIBA 11 0,22 24 0,48
FUJITSU 8 0,16 32 0,64
ACER 8 0,16 40 0,80
HP 1 0,02 41 0,82
IBM 9 0,18 50 1,00
Soma 50 1,00
Os gráficos que podem ser feitos de uma variável qualitativa são:
Gráfico de barras ou colunas
Gráfico sectorial
Porque a marca de computadores é uma variável qualitativa não é possível fazer outro tipo de gráficos.
Interpretação:
Dos 50 estudantes entrevistados 26 preferem a marca compaq, ao passo que apenas um prefere a
marca HP;
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
22
26% dos alunos entrevistados preferem a marca compaq;
As marcas Compaq e Toshiba são as marcas mais preferidas pelos estudantes universitários,
representando 48% dos entrevistados.
Variável Discreta
Suponha-se uma experiência concebida para verificar se um dado é ou não viciado. A experiência consistiu
em lançar os dados 112 vezes e registar o resultado obtido em cada lançamento. O espaço amostral desta
experiência é um conjunto discreto, limitado e de dimensão reduzida, correspondendo a A ={1, 2, 3, 4, 5, 6}.
Resultados obtidos em 112 lançamentos de um dado
Variáveis quantitativas contínuas
Nesse caso recorre-se à distribuição dos dados por classes ou células. Aqui será necessário introduzir alguns
conceitos novos como: o número de classes (K), a amplitude (ai), limite e ponto médio ou centro de classes.
Existem algumas regras básicas que deverão ser consideradas na construção os intervalos:
1- Em geral, o número de classes (K) deverá estar compreendido entre 4 e 14;
2- Nenhuma classe deverá ter uma frequência nula;
3- As classes deverão ter, sempre que possível, amplitudes iguais;
4- Os pontos médios das classes deverão ser números de cálculo fácil;
5- As classes abertas deverão ser evitadas embora nem sempre seja possível fazê-lo;
6- Os limites das classes definidos de modo a que cada valor da variável é incluído num e só num
intervalo.
Levando em consideração as regras básicas, para se determinar o número de classes (K), por vezes é
adoptada a seguintes soluções:
1) N.º de classes K= 5 para n < 25 e 𝐾 ≅ √𝑁 para n ≥ 25
2) Fórmula de Sturges: K ≈ 1 + 3,22 log n
A amplitude das classes (ai), poderá ser calculada da seguinte formula:
K
ValorValor
K
R
a mínimomáximoi
)(
Existem diversas maneiras de expressar os limites das classes, como:
1- [10; 12]: compreende todos os valores entre 10 e 12;
2- [10; 12[: compreende todos os valores entre 10 e 12, excluindo o 12;
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
23
3- ]10;12]: compreende todos os valores entre 10 e 12, excluindo o 10;
O exemplo n.º 2, é mais utilizado, e será o adoptado nas aulas para estudo da estatística descritiva.
O ponto médio ou centro da classe (Ci), é a média aritmética entre o limite inferior e superior da classe.
Exemplo:
A UCAN resolveu observar as alturas (em cm) dos alunos de uma turma de Contabilidade e Administração
do 2º Ano. O resultado obtido foi o seguinte:
Alturas (em cm) dos alunos de uma turma de C. A do 2º Ano
150 169 174 155 165 170 172
152 158 163 158 166 158 166
170 171 162 171 161 154 168
161 164 166 164 162 156 167
𝐾 ≅ √28 ≅ 5,29 553,4
29,5
150174
ia
Classes Fi fi CumFi Cumfi
150-155 3 0,1071 3 0,1071
155-160 5 0,1786 8 0,2857
160-165 7 0,2500 15 0,5357
165-170 7 0,2500 22 0,7857
170-175 6 0,2143 28 1,0000
Soma 28 1
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
24
2.3-Medidas de Estatística Descritiva
Entre as medidas de estatística descritiva, encontramos as medidas de localização, de dispersão, de
concentração, de assimetria e de curtose.
2.3.1- Medidas de localização
Estas podem ser agrupadas da seguinte forma:
2.3.1.1 Medidas de Tendência Central
Média Aritmética
A média é uma medida de localização de tendência central, sendo representada por �̅� por μ conforme se
trate, da média amostral (estatística) ou da média populacional (parâmetro).
A média de um conjunto de dados quantitativos, que se obtém somando todos os valores e dividindo o
resultado pelo nº total de observações.
Dados não tabelado
n
x
X
n
i
i
1
Onde:
xi é o valor observado
n é o número total de observações
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
25
Dados Discretos
i
n
i
i
i
n
i
i
fX
N
FX
1
1
i
n
i
i
i
n
i
i
fX
n
FX
X
1
1
Onde:.
Xi : valor observado; N : é somatório de Fi; Fi: é a frequência absoluta e fi a frequência relativa.
Dados Contínuos
i
n
i
i
i
n
i
i
fC
N
FC
1
1
i
n
i
i
i
n
i
i
fC
n
FC
X
1
1
Onde:
Ci : centro da classe; N : é somatório de Fi; Fi: é a frequência absoluta e fi a frequência relativa.
Propriedades da Média Aritmética
1- A média é um valor calculado facilmente e depende de todas as observações;
2- É única em um conjunto de dados e nem sempre tem existência real, ou seja, nem sempre é igual a um
determinado valor observado;
3- A média é afetada por valores extremos observados;
4- Por depender de todos os valores observados, qualquer modificação nos dados fará com que a média
fique alterada. Isto quer dizer que somando-se, subtraindo-se, multiplicando-se ou dividindo-se uma
constante a cada valor observado, a média ficará acrescida, diminuída, multiplicada ou dividida desse
valor;
5- A média dos desvios dos valores da variável em relação à média é nulo.
0 ii Xf
6- A média do quadrado dos desvios dos valores da variável em relação à média é mínima.
2
ii Xf é mínimo
A média aritmética tem vantagens e desvantagens.
Vantagens:
- Facilidade de calculo e de interpretação, e por isso é muito utilizada;
- Utilizar toda a informação disponível e poder ser calculada com precisãomatemática.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
26
Desvantagens:
- Ser influenciada por valores extremos que tomam um peso significativo no calculo da média;
- Poder não corresponder a um valor concreto da variável
Mediana
É o valor que divide uma série ordenada de tal forma que pelo menos a metade das observações
sejam iguais ou maiores do que ela, e que haja pelo menos outra metade de observações maiores do
que ela.
Isto é, é o valor da variável que ocupa a posição central na sucessão de observações ou na distribuição
de frequências.
É mais usada quando os dados apresentam distribuição assimétrica.
Dados discretos
Quando se tratam de dados discreto, primeiramente temos que saber se a distribuição é par ou
impar.
- Se Fi N For impar então, a mediana será o central de ordem
2
1N
- Se Fi N For impar então, a mediana será o central de ordem
2
22
2 NN
Exemplo 1:
Xi Fi CumFi
1 1 1
2 3 4
3 7 11
4 2 13
Soma 13
Como podemos ver no nosso exemplo a distribuição em referência é impar, então:
1- Calcular:
7
2
113
2
1
N
2- Achar a frequência acumulada absoluta que contém este valor 7, neste caso a frequência
acumulada que contém 7 é a 11;
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
27
3- A Mediana será o valor Xi correspondente a esta frequência acumulada. Me = 3
Exemplo 2:
Xi Fi CumFi
82 5 5
85 10 15
87 15 30
89 8 38
90 4 42
Soma 42
Como podemos ver no nosso exemplo 2 a distribuição em referência é par, então:
1- Calcular:
5,21
2
2
42
2
242
2
22
2
NN
2- Achar a frequência acumulada absoluta que contém este valor 21,5, neste caso a frequência
acumulada que contém 21,5 é a 30;
3- A Mediana será o valor Xi correspondente a esta frequência acumulada. Me = 87
Dados Contínuos
Quando se tratam de dados contínuos, não interessa saber se a distribuição é par ou impar.
1- Calcula-se
𝑁
2
2- Achar a frequência acumulada absoluta que contém este valor, calculado em 1,
3- Identificar a classe da Mediana, e aplica-se a seguinte formula:
)(
)(
)1(
)(
2
Me
Mei
Mei
Me a
F
CumF
N
liMe
Onde:
li (Me): limite inferior da classe mediana
N: dimensão da amostra, isto é somatório de Fi;
CumFi(Me-1): frequência acumulada absoluta da classe anterior à classe mediana
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
28
Fi (Me): frequência absoluta da classe mediana
a(Me): amplitude da classe mediana
A expressão para frequências relativas é semelhante:
)(
)(
)1(
)(
5,0
Me
Mei
Mei
Me a
f
Cumf
liMe
Onde:
Cumfi(Me-1): frequência acumulada relativa da classe anterior à classe mediana
fi (Me): frequência relativa da classe mediana
a(Me): amplitude da classe mediana
A mediana é uma medida comum das propriedades de conjuntos de dados em estatística e em teoria das
probabilidades, com importância central na estatística robusta. A estatística robusta é mais resistente, com
ponto de rotura de 50%. A mediana não fornece resultados arbitrariamente grandes desde que mais da metade
dos dados não esteja contaminada.
A vantagem da mediana em relação à média é que a mediana pode dar uma ideia melhor de um valor típico
porque não é tão distorcida por valores extremamente altos ou baixos. Em estudos estatísticos sobre renda
familiar ou outros ativos voláteis, a média pode ser distorcida por um pequeno número de valores
extremamente altos ou baixos.
Moda
A moda (Mo), é o valor mais frequente da distribuição, ou ainda o valor que mais observações apresentam
no conjunto dados.
Ela pode ser determinada para dados quantitativos e qualitativos.
Para variáveis quantitativas discretas ou qualitativas é simplesmente a variável mais frequente (ou mais
observada), isto é o valor Xi da frequência absoluta mais elevada.
Para variáveis quantitativas agrupadas (contínuos) em classes é necessário:
1- Determinar a Fi mais elevada;
2- Achar a classe correspondente a este Fi mais alto, e aplicar a seguinte fórmula:
)(
)1()1(
)1(
)( Mo
MoiMoi
Moi
Moi a
FF
F
lMo
Onde:
li (Mo): limite inferior da classe modal
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
29
Fi(Mo-1): frequência absoluta da classe anterior à classe da moda;
Fi(Mo+1): frequência absoluta da classe da moda
a(Mo): amplitude da classe da moda
A expressão para frequências relativas é semelhante:
)(
)1()1(
)1(
)( Mo
MoiMoi
Moi
Moi a
ff
f
lMo
Onde:
Fi(Mo-1): frequência relativa da classe anterior à classe da moda
Fi(Mo+1): frequência relativa da classe da moda
a(Mo): amplitude da classe da moda
Graficamente, utilizando-se um conjunto de dados hipotéticos, identifica-se a classe modal como aquela que
apresenta o retângulo de maior altura (frequência). A intersecção das retas que unem os pontos AD e os
pontos BC, determina o ponto P que, projetado perpendicularmente no eixo da variável, corresponderá ao
valor da moda Mo.
Vantagens:
Fácil de calcular e interpretar e não é afectada por valores extremos;
Desvantagem
Não pode ser definida com rigor e o seu valor exacto ser muitas das vezes incerto
2.3.1.2 Medidas de Tendência não Central
Quartis
Os quartis são os valores da variável observada que dividem a distribuição de frequências em 4 partes
iguais.
Q1 – Primeiro Quartil – é o valor da variável observada tal que o nº de observações para valores inferiores
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
30
i
a Q1 será de 25% e o nº de observações para valores superiores a Q1 será de 75%;
Q2 – Segundo Quartil – é o valor da variável tal que metade das observações encontram-se à sua esquerda
e a outra metade à sua direita, logo, coincide com a mediana;
Q3 – Terceiro Quartil – é o valor da variável observada tal que o nº de observações para valores inferiores
a Q3 será de 75% (3/4) e o nº de observações para valores superiores a Q3 será de 25% (1/4).
Descrição dos quartis (dados amostrais)
Estatística Notação Interpretação
1º quartil Q1 25% dos dados são valores menores ou iguais ao valor do primeiro
quartil.
2º quartil Q2 =Md 50% dos dados são valores menores ou iguais ao valor do segundo
quartil.
3º quartil Q3 75% dos dados são valores menores ou iguais ao valor do terceiro
quartil.
Dados discretos
1- Primeiramente temos que calcular N %Qi
2- Achar a frequência acumulada absoluta que contém este valor calculado em 1;
3- O quartil será o valor Xi correspondente a esta frequência acumulada.
Dados contínuos
1- Primeiramente temos que calcular: % N x Qi
2- Achar a frequência acumulada absoluta que contém este valor calculado em 1;
3- Achar classe do quartil, correspondente a esta frequência acumulada, então aplica-se a
fórmula:
)(
)(
)1(
)(
%
i
i
i
i Q
Qi
Qi
Qi a
F
CumFQN
liQ
Onde:
li (Qi): limite inferior da classe do quartil
Fi(Qi-1): frequência absoluta da classe anterior à classe do quartil;
Fi(Qi+1): frequência absoluta da classe do quartil
a(Qi): amplitude da classe do quartil
A expressão para frequências relativas é semelhante:
)(
)(
)1(
)(
%
i
i
i
Q
Qi
Qi
Qi a
f
CumfQ
liQ
Onde:
Fi(Qi-1): frequência relativa da classe anterior à classe do quartil
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
31
Fi(Qi+1): frequência relativa da classe do quartil
a(Qi): amplitude da classe do quartil
Decis
Os decis são os valores da variável que dividem a distribuição em 10 partes iguais. O número de decis é 9
(do D1 até o D9).
Dados discretos
Uti1iza-se os mesmos passos do quartil e representa-secom a letra D.
Dados Contínuos
Uti1iza-se os mesmos passos do quartil, diferenciando a penas as letras, representa-se com a letra D para o decil:
)(
)(
)1(
)(
%
i
i
i
D
Di
Di
Qi a
F
CumFDN
liD
Onde:
li (Di): limite inferior da classe do decil
Fi(Di-1): frequência absoluta da classe anterior à classe do decil
Fi(Di+1): frequência absoluta da classe do decil
a(Di): amplitude da classe do decil
A expressão para frequências relativas é semelhante:
)(
)(
)1(
)(
%
i
i
i
i D
Di
Di
Di a
f
CumfD
liD
Fi(Di-1): frequência relativa da classe anterior à classe do decil
Fi(Di+1): frequência relativa da classe do decil
a(Di): amplitude da classe do decil
Percentis
Os percentis dividem a distribuição em 100 partes iguais. O número de percentis é 99 (do P1 ao P99).
Dados discretos
Uti1iza-se os mesmos passos do quartil e representa-se com a letra P para o percentil.
Dados Contínuos
Uti1iza-se os mesmos passos do quartil, diferenciando a penas as letras, representa-se com a letra P:
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
32
)(
)(
)1(
)(
%
i
i
i
i P
Pi
Pi
Pi a
F
CumFPN
liP
Onde:
li (Pi): limite inferior da classe do percentil
Fi(Pi-1): frequência absoluta da classe anterior à classe do percentil
Fi(Pi+1): frequência absoluta da classe do percentil
a(Pi): amplitude da classe do percentil
A expressão para frequências relativas é semelhante:
)(
)(
)1(
)(
%
i
i
i
i P
Pi
Pi
Pi a
f
CumfP
liP
Fi(Pi-1): frequência relativa da classe anterior à classe do percentil
Fi(Pi+1): frequência relativa da classe do percentil
a(Pi): amplitude da classe do percentil
2.3.2- Medidas de dispersão e concentração
As medidas de dispersão têm por finalidade verificar a representatividade das medidas de localização.
2.3.2.1 Medidas de Dispersão Absoluta
Medidas de distância
São aqueles cujos valores estão representados nas mesmas unidades que os dados e onde não é
necessário o cálculo de uma medida de localização.
Exemplo:
Intervalo de Variação, é a medida de dispersão mais simples de calcular. É a diferença entre os
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
33
valores máximo e mínimo. A sua utilização tem como principal desvantagem o facto de ter em conta
apenas 2 extremos que a variável toma, e portanto, não ser sensível a valores intermédios.
minVVR máx
Intervalo Inter-quartis, é a diferença entre o 3º e o 1º quartil e corresponde a um intervalo de 50%
das observações centrais. Tem a desvantagem de não ser influenciada por metade dos valores
observados e que são extremos.
13 QQIQ
Medidas de dispersão propriamente ditas
Esta utiliza uma medida de localização como termo de comparação.
Exemplo:
Desvio Médio Absoluto, é uma media de dispersão não negativa e quanto maior o seu valor maior a dispersão
da variável.
Para dados não tabelados:
N
X
DM
i
Para dados discretos:
ii XfDM
Para dados contínuos:
ii CfDM
Variância, é a soma dos quadrados das diferenças entre os valores da variável e a média, dividida pelo
número de observações. Tem a desvantagem de se traduzir no quadrado das unidades em que está definida a
variável X.
Para dados não tabelados:
N
X
n
i
i
1
2
2
)(
n
XX
S
n
i
i
1
2
2
)(
Para dados discretos:
2
1
2 )(
i
n
i
i Xf
22
1
2
i
n
i
i Xf
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
34
Para dados contínuos:
22
1
2
i
n
i
iCf
22
1
2 XCfS i
n
i
i
Desvio Padrão, é a raiz quadrada positiva da variância.
2
2SS
2.3.2.2 Medidas de dispersão relativa
coeficiente de variação
O Coeficiente de variação (Cv), é uma média relativa de dispersão, útil para a compreensão em termos
relativos do grau de concentração em torno da média, de distribuição de frequências distintas. É dado pela
relação em termos percentuais entre o desvio padrão e a média da distribuição.
100
Cv
100
X
s
Cv
2.3.3- Medidas de assimetria e Curtose
2.3.3.1 Medidas de assimetria
A medida de assimetria é um indicador da forma da distribuição dos dados. Ao construir uma distribuição de
frequências e/ou um histograma, está-se buscando, também, identificar visualmente, a forma da distribuição
dos dados que é ou não confirmada pelo coeficiente de assimetria de Pearson.
A distribuição pode ser simétrica e assimétrica.
Considera-se que a distribuição é simétrica se:
MoMe
A distribuição é assimétrica positiva se:
MoMe
É assimétrica negativa se:
MoMe
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
35
O grau de assimétrica pode ser medido pela fórmula seguinte:
)(3 Me
G
S
MeX
G
)(3
Existem outros indicadores quantitativos que permitem estimar, com maior precisão, o grau de uma
distribuição.
O coeficiente de Pearson:
Mo
G
1
IQ
MeQQ
G
213
2
Se G = 0, a distribuição é simétrica;
Se G > 0, a distribuição é assimétrica positiva;
Se G < 0, a distribuição é assimétrica negativa.
2.3.3.2 Medidas de Achatamento ou de Curtose
Curtose é o grau de achatamento de uma distribuição. A curtose ou achatamento é mais uma medida com a
finalidade de complementar a caracterização da dispersão em uma distribuição. Esta medida quantifica a
concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central
em uma distribuição de frequências. O achatamento pode ser: leptocúrtica, mesocúrtica e platicúrtica.
10902 PP
IQ
K
Se K = 0,263; a distribuição é mesocúrtica;
Se K < 0,263; a distribuição é leptocúrtica;
Se K > 0,263; a distribuição é platicúrtica.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
36
2.3.4- Medidas de Concentração e Desigualdade
2.3.4.1 Curva de Lorenz
A curva de Lorenz é um gráfico que é muitas das vezes usado para representar a distribuição relativa de uma variável
num domínio determinado. O domínio geralmente pode ser pessoas de uma região ou país, por exemplo. A variável
em estudo pode ser o rendimento das pessoas. A curva é traçada considerando-se a percentagem acumulada de pessoas
no eixo das abcissas e a percentagem acumulada do rendimento no eixo das ordenadas.
Cada ponto da curva é lido como percentagem acumulativa das pessoas. A curva parte da origem (0,0) e termina no
ponto (1,1). Portanto, quanto mais próxima da diagonal estiver a curva de Lorenz, mais equitativa é a distribuição e
quanto mais afastada estiver, mais desigual é a distribuição.
Dado uma característica(Yi) e as suas frequências (Fi), para cada intervalo ou classe i, calcula-se a curva de lorenz
unindo, um referencial cartesiano, as frequências acumuladas para cada classe relativamente ao total.
𝑐𝑢𝑚 𝑓𝑖 =
𝐶𝑢𝑚𝐹𝑖
∑ 𝐹𝑖
𝑛
𝑖=1
𝑐𝑢𝑚 𝑦𝑖 =
𝐶𝑢𝑚𝑌𝑖
∑ 𝑌𝑖
𝑛
𝑖=1
2.3.4.2 Índice de Gini
O Índice de Gini é uma medida de desigualdade é geralmente utilizada para calcular a desigualdade de distribuição de
renda mas pode ser usada para qualquer distribuição. Ele consiste em um número entre 0 e 1, onde 0 corresponde à
completa igualdade de renda (onde todos têm a mesma renda) e 1 corresponde à completa desigualdade (onde uma
pessoa tem toda a renda, e as demais nada têm).
Quanto maior a concentração, mais a curva de Lorenz se afastara da reta de igual distribuição.
𝑝𝑖 =
𝐶𝑢𝑚𝐹𝑖
∑ 𝐹𝑖
𝑛
𝑖=1
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
37
𝑞𝑖 =
𝐶𝑢𝑚𝑌𝑖
∑ 𝑌𝑖
𝑛
𝑖=1
Quanto maior for a diferençaentre pi e qi, mais acentuada será a concentração. É nesta verificação que Gini propôs o
índice para medir o grau de concentração:
𝐼𝐺 =
∑ (𝑝𝑖 − 𝑞𝑖)𝑛−1𝑖=1
∑ 𝑝𝑖𝑛−1𝑖=1
= 1 −
∑ 𝑞𝑖𝑛−1𝑖=1
∑ 𝑝𝑖𝑛−1𝑖=1
Sendo n o numero de classes, o IG varia entre 0 e 1, quando igual a zero, temos igual distribuição, quanto mais próximo
estiver de 1 maior é a desigualdade.
2.4- Associação entre duas variáveis
Estudar a associação entre variáveis permitirá, numa fase posterior, elaborar previsões, é o facto de se poder
estabelecer uma relação do tipo causa-efeito entre as variáveis. Isto é, só é viável fazer previsões com base
em relações estatísticas entre variáveis se a variação de uma delas puder ser atribuída à variação da outra.
Um diagrama de dispersão consiste num gráfico constituído por pontos discretos onde cada ponto, Pi,
representa um par de valores observados, (xi, yi). xi representa o valor da variável independente observada
para o indivíduo Pi e yi representa o valor da variável dependente observada para esse mesmo indivíduo.
O diagrama de dispersão tem uma função dupla: por um lado ajuda a destrinçar se existe alguma associação
entre as variáveis, por outro permite identificar qual o modelo matemático (equação) mais apropriado para
descrever essa associação.
Nos gráficos da Figura seguinte apresentam-se vários exemplos de diagramas de dispersão e as conclusões
que deles se podem tirar acerca da relação entre as variáveis.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
38
No caso de existir uma relação entre as variáveis esta pode ser de vários tipos: linear (casos (a) e (b) da
figura), polinomial (caso (c) da figura – polinómio do 2º grau), exponencial, logarítmica, etc.
A relação mais simples é do tipo linear, sendo possível linearizar algumas das relações não lineares
exemplificadas no parágrafo anterior.
2.4.1 Regressão linear simples
Uma relação do tipo linear entre as variáveis pode ser descrita matematicamente pela equação:
Y a bX e
Esta equação constitui o modelo de regressão linear simples sendo:
Y: variável explicada ou dependente
X: variável explicativa ou independente
e: variável residual que inclui outros factores explicativos de y não incluídos em x ou erros de medição
a e b: parâmetros da regressão. a é a intersecção da recta com o eixo vertical e b é o seu declive.
A equação anterior representa pois uma recta que, quando ajustada aos dados do diagrama de dispersão,
se chama recta de regressão ou recta ajustada.
Ao ajustar uma recta de regressão aos dados observados anulamos os efeitos da variável residual. A recta
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
39
ajustada terá então a forma:
Ya a bX
2.4.2 A Função de Regressão Populacional (FRP)
Diremos que geometricamente, a curva de uma função de regressão é o espaço geométrico onde as médias ou
expectativas condicionais das variáveis dependentes para os valores fixados da variável explicativa;
)()( ii XfXYE Equação 1
Onde X é uma função explicativa e Y a variável explicada, linear em X. Chamaremos assim a equação 1 como
função de população de regressão (FPR) de duas variáveis. Assim, assumindo que X pode tomar valores nulos,
podemos transcrever a FPR em
ii bXaXYE )( Equação 2
Onde os parâmetros a e b são desconhecidos, todavia fixos e chama-se coeficientes de regressão.
Também são conhecidos como intercepto e coeficiente de inclinação, respectivamente.
O objectivo presente consiste em estimar os parâmetros desconhecidos da FRP descrita na equação Nº 2.
2.4.3 Propriedades
a) A LINEARIDADE
Assumimos que a nossa FRP é linear, o que significa que a expectativa condicional de Y em relação a X é
consequência de uma função linear, podendo esta ser representada geometricamente por um gráfico.
Semelhantemente, a FRP é linear nos parâmetros.
b) A ESPECIFICAÇÃO ESTOCÁSTICA
Consideremos que dada a variável Y e a sua estimativa condicional em relação a Y, ocorrerá sempre um
desvio a que chamaremos o erro termo, a perturbação estocástica ou ainda o white noise:
iii eXYEY )( Equação 3
Alternativamente, podermos escrever da seguinte maneira iii eXYEY )( e consequentemente
iii ebXaY
Assim sendo o primeiro elemento do lado esquerdo será o elemento sistemático ou determinístico, e o
segundo termo, corresponde ao componente assistemática ou aleatória, cuja propriedade facilmente podemos
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
40
obter quando aplicamos expectativas em ambos os lados da equação condicional a X:
)()()( iiii XeEXYEEXYE Equação 4
)()()( iiii XeEXYEXYE
note que para que a igualdade vigore, é necessário que )( ii XeE seja igual a zero
0)( ii XeE Equação 5
Neste contexto, considerando que ao extrapolar o caso para a vida prática, encontraremos variáveis
sendo explicadas por outras, o termo erro i representará sempre aqueles factores não considerados na
explicação da variável dependente. Isso pode ser o caso de variáveis omissas.
c) A PERTURBAÇÃO ESTOCÁSTICA E A FUNÇÃO DE REGRESSÃO AMOSTRAL
Para além do aspecto da omissão de variáveis destacado no ponto anterior, existem outros factores que
justificam a razão de existência da perturbação estocástica no nosso modelo, apontando-se:
1. Inexactidão da teoria
2. Escassez de dados
3. Forma funcional errada
4. Casualidade intrínseca ao comportamento humano
5. Variáveis essenciais versus variáveis periféricas
Considerando a aleatoriedade do erro, a representações de uma função de regressão populacional para varias
amostragens, da origem a chamada função de regressão amostral (FRA), tal que a amostra da equação 2
pode ser representada por:
ibXaaY
ˆ Equação 6
Assim sendo, podemos representar a FRP de duas formas, demonstradas pelas equações 2 e a extensão da
equação 3, teremos:
iii eXbaY ˆ
ˆˆ Equação 7
2.4.4 Mínimos Quadrados Ordinários – (OLS- Ordinary Least Squases)
Conforme referido anteriormente, constitui objecto principal testar a FRP tendo como referência a FRA. Dos
enumeras métodos existentes, vamos aqui considerar o método dos quadrados mínimos MQO também
denominado por Ordinary Least Squares –OLS desenvolvido pelo matemático Alemão Car Friederich Gauss.
O método em causa baseia-se no princípio dos mínimos quadrados.
Sabe-se que a FRP
iii ebXaY não é directamente observável, o que nós conhecemos é sim
iia eXbaY ˆ
ˆˆˆ conforme as equações 6 e 7 o elemento erro ou resíduo é dado pela diferença do Y
observado e Ya estimado.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
41
aii YYe
ˆ Equação 8
O interesse consistirá neste caso em determinar a FRA mais próxima do Y observado, o que em outras
palavras pressupõe dizer que quanto menor for resíduo quadrado melhor será. aii YYe ˆˆ . Note que
o critério MQO consiste em minimizar a soma do erro. Porém, veja na figura, a soma do erro 4321 ˆ,ˆ,ˆ,ˆ eeee é
nula, dada a sua assimetria. Entretanto, nós estamos mais interessados é no quadrado da soma, pois fazendo
assim tornamos os valores negativos em positivos e o interesse consistirá em encontrar o menor valor possível
o que em outras palavras significa obter resíduos mais próximos da FRA.
Demonstração do critério dos mínimos quadrados.
Uma vez que os valores observados são dados por Y e os valores ajustados são dados por Ya . O que se
pretende através do método dos mínimos quadrados é minimizar o somatório dos quadrados das diferenças,
isto é, minimizar o somatório do quadrado dos resíduos.
2
,
min i
ba
e
Pretendendo determinar-se a e b de tal modo que:
Para o último somatório, ou para qualquer outro polinómio quadrático, os pontos mínimos encontram-se
quando asprimeiras derivadas forem nulas e as segundas derivadas forem positivas (concavidade voltada
para cima). Assim, a função de minimização estabelecida, pode ser resolvida através dos sistemas, que
conduzem às seguintes expressões para b (declive da recta ajustada) e para a (ordenada na origem da recta
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
42
ajustada):
22
ii
iiii
XnX
YXXYn
b
ii
iii
XXX
XYYX
b
2
22 XnX
XYnYX
b
i
ii
XbYa
Assumindo dados centrados então podemos, podemos calcular b pela seguinte fórmula:
2
i
ii
x
yx
b
Onde:
xi é valor centrado, calculado da seguinte forma: 𝑥𝑖 = 𝑋𝑖 − �̅�
yi é valor centrado, calculado da seguinte forma: 𝑦𝑖 = 𝑌𝑖 − �̅�
sendo que o ∑ 𝑥𝑖 = 0
𝑛
𝑖=1 e∑ 𝑦𝑖 = 0
𝑛
𝑖=1
�̅� =
∑ 𝑋𝑖
𝑛
𝑖=1
𝑁
�̅� =
∑ 𝑌𝑖
𝑛
𝑖=1
𝑁
2.4.4.1 Hipóteses do Mínimos Quadrados Ordinários
Veremos agora as hipóteses básicas do Modelo Clássico de Regressão Linear (MCRL), que de uma forma mais
avançada, infere as hipóteses enunciadas por Gauss Markov.
Hipótese 1 - Modelo de Regressão Linear - O modelo é linear nos parâmetros conforme mostrado em;
iii ebXaY
Hipótese 2 - Os valores de X são fixados em amostras iterativas – Os valores assumidos pelo regressor X
são considerados fixados em repetidas amostras. A variável é um dado não estocástico.
Hipótese 3 - O valor médio do resíduo ei é nulo – Dado o valor X, o valor esperado da perturbação
residual é zero.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
43
0ii XeE
Hipótese 4 -Homoskedasticidade ou variância igual ei - Dado o valor da variável independente, a variância
de é invariante ao tempo
22
2
var
ii
iiiii
XeE
XeEeEXe
Hipótese 5 -Não existe auto-correlação entre as perturbações e, entre a perturbação ei e a variável
independente X - Dados dois valores ei e ej tal que (i≠j) a corelação entre quaisquer resíduos de diferentes
períodos é zero.
0
,,cov
jjii
jjjiiijiji
XeXeE
XeEeXeEeEXXee
2.4.5 Análise do grau de associação entre variáveis
Quando se procede ao ajuste de uma determinada recta de regressão aos dados observados, podemos ainda
tirar conclusões acerca da qualidade do ajuste através do cálculo de outro coeficiente: o coeficiente de
determinação.
2.4.5.1 Coeficiente de determinação
O coeficiente de determinação, notado por R2, mede a qualidade do ajuste entre a recta e os dados e o seu
valor é um número real compreendido entre 0 e 1. Se R2 for 1 a qualidade do ajuste é perfeita (positiva ou
negativa), não existindo relação linear se R2 =0.
O coeficiente de determinação representa ainda a proporção (ou percentagem) da variação da variável
dependente (y) que é explicada pelas variações da variável independente (x), sendo o seu valor obtido através
da seguinte expressão:
2
2
i
ii
y
yxb
R
2.4.5.2 Coeficiente de correlação linear
Uma maneira de se analisar a possibilidade de existência de uma associação linear entre um par de variáveis
é através do cálculo do coeficiente de correlação linear. O coeficiente de correlação linear, (R) , é um valor
real compreendido entre -1 e 1.
2RR
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
44
2.4.5.3 Coeficiente de correlação linear de Person
Este coeficiente, mede o grau da correlação (e a direcção dessa correlação - se positiva ou negativa) entre
duas variáveis de escala métrica (intervalar ou de rácio/razão).
2222
iiii
iiii
YYnXXn
YXYXn
R
2.4.5.4 Coeficiente de correlação linear de Sperman
Em estatística, o coeficiente de correlação de postos de Spearman ou rô de Spearman, que recebe este nome
em homenagem ao psicólogo e estatístico Charles Spearman, é uma medida não paramétrica de correlação
de postos (dependência estatística entre a classificação de duas variáveis). O coeficiente avalia com que
intensidade a relação entre duas variáveis pode ser descrita pelo uso de uma função monótona. Se não houver
valores de dados repetidos, uma correlação de Spearman perfeita de +1 ou -1 ocorre quando cada uma das
variáveis é uma função monótona perfeita da outra.
)1(
6
1
2
2
nn
D
r
i
s
YXD
Interpretação do coeficiente de correlação:
Se R =1: correlação linear perfeita positiva;
Se 0,7≤ R<1: correlação linear forte positiva;
Se 0,3≤R<0,7: correlação linear moderada positiva;
Se 0<R≤0,3: correlação linear fraca positiva;
Se R=0: não existe correlação linear (podendo ou não existir outro tipo de relação);
Se R= -1: correlação linear perfeita negativa;
Se -1< R≤-0,7: correlação linear forte negativa;
Se -0,7<R ≤-0,3: correlação linear moderada negativa;
Se -0,3<R<0: correlação linear fraca negativa.
2.4.5.5 Covariância
A covariância é também uma medida do grau de associação linear entre duas variáveis. A covariância, é uma
medida do grau de interdependência (ou inter-relação) numérica entre duas variáveis aleatórias. Assim,
variáveis independentes têm covariância zero.
E pode ser assim calculada:
https://pt.wikipedia.org/wiki/Escala_(estat%C3%ADstica)
https://pt.wikipedia.org/wiki/Estat%C3%ADstica
https://pt.wikipedia.org/wiki/Charles_Spearman
https://pt.wikipedia.org/wiki/Estat%C3%ADstica_n%C3%A3o_param%C3%A9trica
https://pt.wikipedia.org/wiki/Ranking
https://pt.wikipedia.org/wiki/Vari%C3%A1vel_(matem%C3%A1tica)
https://pt.wikipedia.org/wiki/Fun%C3%A7%C3%A3o_mon%C3%B3tona
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
45
n
yx
Cov
ii
yx
,
A covariância é semelhante à correlação, mas quando a covariância é calculada, os dados não são
padronizados. Portanto, a covariância é expressa em unidades que variam de acordo com os dados e não é
convertida para uma escala normalizada de -1 a +1.
3. Teoria da Probabilidade
SUMÁRIO:
3.1 Conceitos da teoria das probabilidades
3.2 Álgebra dos acontecimentos (operações e probabilidades)
3.3 Conceitos de probabilidades
3.4 Axiomas da teoria das probabilidades
3.5 Probabilidades Condicionadas
3.6 Acontecimentos independentes
3.7 Teorema da probabilidade total Teorema de BAYES
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
46
3.1 Conceito da teoria das Probabilidades
A teoria das probabilidades ocupa-se do estudo de experiências aleatórias, ou seja, de experiências
influenciadas pelo acaso.
Uma experiência aleatória é uma experiência sobre a qual não se pode dizer qual vai ser o resultado, antes
de a realizarmos. Por oposição, temos o conceito de experiência determinística, que é aquela cujo resultado
é possível prever, com absoluta certeza.
Por exemplo é possível prever que se atirarmos uma pedra ao ar, ela cai (experiência determinística), mas já
não é possível prever qual vai ser o resultado de um lançamento de um dado (experiência aleatória).
Espaço de resultados
Consideremos a seguinte experiência aleatória: lançamento de um dado.
Os resultados possíveis desta experiência são: saída de face 1, saída de face 2, saída de face 3, saída de face
4, saída de face 5, saída de face 6.
É, assim, natural associar a esta experiência o conjunto {1, 2, 3, 4, 5, 6}.
A este conjunto chama-se espaço de resultados associado à experiência lançamento de um dado.
Espaço de resultados conjunto de todos os resultados possíveis associados a uma experiência aleatória.
O espaço de resultados associado a uma experiência é normalmente representado pela letra Grega Ω.
Exemplo 1:
Experiência aleatória: lançamento de uma moeda duas vezes consecutivas.Espaço de resultados: H = {(C,
C), (C, F), (F, C), (F, F)}
(C representa saída de coroa; F representa saída de face).
3.2- Acontecimentos
A um subconjunto do espaço de resultados dá-se o nome de acontecimento.
Consideremos, uma vez mais, a experiência lançamento de um dado.
Espaço de resultados: Ω = {1, 2, 3, 4, 5, 6}.
São exemplos de acontecimentos:
A = {2, 4, 6} (saída de face par);
B = {5, 6} (saída de face superior a quatro);
C = {1} (saída de face um).
O acontecimento C diz-se elementar, pois a sua realização depende apenas da ocorrência de um único
resultado do espaço de resultados.
A um acontecimento impossível associa-se o conjunto vazio.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
47
O espaço de resultados Ω também é, naturalmente, um acontecimento: diz-se acontecimento certo.
3.2.1- Álgebra dos Acontecimentos
Ao conjunto de todos os acontecimentos que se podem associar a uma experiência aleatória damos o nome
de espaço de acontecimentos.
Consideremos, por exemplo, a experiência aleatória lançamento de um rapa. Espaço de resultados: Ω = {R,
T, D, P} (Rapa, Tira, Deixa, Põe)
Espaço de acontecimentos ou álgebra de acontecimentos:
{ , {R}, {T}, {D}, {P}, {R,T}, {R,D}, {R,P}, {T,D}, {T,P}, {D,P}, {R,T,D}, {R,T,P}, {R,D,P},
{T,D,P}, {R, T, D, P} }
O conjunto de todos os subconjuntos de Ω representa-se por P(Ω ) (conjunto das partes de Ω). Se Ω tiver 8
elementos, então P(Ω ) tem 2n elementos.
No exemplo do rapa, Ω tem 4 elementos, e P(Ω ) tem 24 =16 elementos
Diz-se que A Ω se realizou se o resultado, , da experiência é um elemento de A, isto é,
A.
A B, diz-se A sub acontecimento de B, se e só se a realização de A implica a realização de B;
Ac ou A diz-se acontecimento complementar ou contrário a A, é ao conjunto de todos os elementos de que
não estão em A;
A B, diz-se união de A com B, é o acontecimento que consiste na realização de pelo menos um deles;
AB ou A ∩ B, diz-se produto ou intersecção, é o acontecimento que se realiza apenas quando ambos os
acontecimentos se realizam;
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
48
Os acontecimentos A e B dizem-se mutuamente exclusivos ou incompatíveis se e só se a realização de um
implica a não realização do outro, i.e., se e só se AB = 0;
A − B = A ∩ Bc diz-se diferença dos acontecimentos A e B é o acontecimento que se realiza se e só se A se
realiza e B não se realiza;
diz-se acontecimento impossível;
Ω diz-se acontecimento certo.
3.3 - Conceitos de Probabilidade
A probabilidade é uma medida do grau de incerteza de um dado acontecimento aleatório, donde o estudo da
teoria das probabilidades estar na base da inferência estatística.
3.1.1 - Definição clássica de probabilidade
Se a uma experiência aleatória pode-se classificar à priori todos os resultados os possíveis num número finito
n de casos mutuamente exclusivos e igualmente prováveis, então o cálculo da probabilidade de um
acontecimento A ocorrer resume-se à contagem do número de resultados possíveis N e do número de
resultados favoráveis a A, nA resultados.
N
n
P A[A]
Onde:
nA é o número de casos favoráveis a A
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
49
N é o número de casos possíveis
Exemplo:
Num lançamento de um dado equilibrado qual a probabilidade de sair um número ímpar?
Limitações desta definição:
Só pode ser aplicada se o número de resultados possíveis da experiência aleatória for finito. Só pode ser
aplicada se os resultados forem igualmente prováveis.
Não permite dar resposta a questões do tipo:
Qual a probabilidade de um homem morrer antes dos 50 anos?
Qual a probabilidade de um jornal vender num dia 500 unidades?
Qual a probabilidade de sair uma face no lançamento de uma moeda não equilibrada?
Qual a probabilidade de uma pessoa seleccionada ao acaso ser benfiquista?
3.3.2- Definição frequencista de probabilidade
Uma determinada experiência aleatória é repetida n vezes em idênticas condições, tendo o acontecimento A
se realizado nA vezes. Seja 𝑓𝐴 =
𝑛𝐴
𝑁
sua frequência relativa.
De acordo com a definição frequencista de probabilidade, a probabilidade do acontecimento A ocorrer é o
valor para que tende fA quando se aumenta o número de provas n.
Exemplo:
1- Uma seguradora não pode afirmar quem são as pessoas que terão acidentes com idades
compreendidas entre os 18 e os 30 anos, mas pelo número de observações do passado nA, e em função
do número de segurados n, pode prever a probabilidade de ocorrência de acidentes naquela faixa
etária.
2- O gestor de vendas de um concessionário de uma marca de automóveis precisa saber qual a
probabilidade do stand vender mais de 4 automóveis na próxima semana. Através dos registos da
empresa foi possível saber que somente em 6 semanas das últimas 50 semanas, o número de
automóveis vendidos foi superior a 4 automóveis. Logo a probabilidade será de 6/50.
Esta é uma definição à posteriori.
3.3.3- Definição subjectiva de probabilidade
A probabilidade subjectiva é dada pelo grau de credibilidade ou de confiança que cada pessoa dá à realização
de um dado acontecimento aleatório. Daí que seja subjectiva porque para o mesmo acontecimento diferentes
pessoas podem dar diferentes probabilidades.
Exemplos:
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
50
1- O Miguel acha que a probabilidade do Benfica ganhar o campeonato é superior a 0,6; já o António
acha que essa probabilidade é inferior a 0,5;
2- Um comentador desportivo atribuir uma probabilidade de vitória a determinado clube antes da
ocorrência do jogo;
3- Previsão da adesão a uma greve.
Nota: A definição subjectiva não faz parte da Estatística.
3.4- Axiomas da teoria das probabilidades
Consideremos que P(.) é uma função que associa a todo o acontecimento A definido em Ω um
número compreendido no intervalo [0,1] e satisfaz os seguintes axiomas:
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
51
3.5- Teoremas da probabilidade
Teorema 1:
Dado um acontecimento A com probabilidade 𝑃[𝐴], a probabilidade do seu complementar
obtém-se subtraindo à unidade a probabilidade de A, isto é 𝑃[�̅�] = 1 − 𝑃[𝐴].
Teorema 2:
A probabilidade do acontecimento impossível é zero, isto é P 0 .
Teorema 3:
Dados dois acontecimentos A e B, a probabilidade do acontecimento da diferença B – A
obtém-se pela diferença entre a probabilidade de B e a probabilidade da intersecção de A com
B, isto é
P[B A] P[B] PA B.
Teorema 4:
A probabilidade da união de dois acontecimentos quaisquer, A e B, obtém-se somando as suas
probabilidades e subtraindo a probabilidade da intersecção de A com
B, isto é
P[A B] P[A] P[B] PA B.
Generalização do teorema 4 a mais de dois acontecimentos
Sejam A1, A2,…Na acontecimentos quaisquer definidos por . Então:
Para n = 3
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
52
3.6- Probabilidade condicionada
De um modo geral, dados dois acontecimentos A e B, realizar, supondo que B se realiza.
P[ A | B] designa a probabilidade de A se realizar, supondo que B se realiza.
Esta probabilidade representa a reavaliação da probabilidade de A em face da informação de
que B se realizou.
O conceito de probabilidade condicionada satisfaz todos os três axiomas de probabilidade.
Vejamos:
1- 𝑃𝐴(𝐵) ≥ 0
Tem-se: 𝑃𝐴(𝐵) = 𝑃(𝐵|𝐴) =
𝑃(𝐴⋂𝐵)
𝑃(𝐵)
≥ 0
2- 𝑃(Ω)=1
Tem-se: 𝑃(Ω) = 𝑃(Ω|𝐴) =
𝑃(𝐴⋂Ω)
𝑃(𝐴)
=
𝑃(𝐴)
𝑃(𝐴)
= 1
3- Se 𝐵1 ∩ 𝐵2 = ∅ então 𝑃𝐴(𝐵1 ∪ 𝐵2) = 𝑃𝐴(𝐵1) + 𝑃𝐴(𝐵2)
Tem-se: PA(B1 ∪ B2) = PA(B1 ∪ B2|A) =
P[A∩(B1∪B2)]
P(A)
=
𝑃[(𝐴 ∩ 𝐵1) ∪ (𝐴 ∩ 𝐵2)]
𝑃(𝐴)
=
𝑃[(𝐴 ∩ 𝐵1) + (𝐴 ∩ 𝐵2)]
𝑃(𝐴)
=𝑃[(𝐴∩𝐵1]
𝑃(𝐴)
+
𝑃[(𝐴∩𝐵2]
𝑃(𝐴)
= 𝑃𝐴(𝐵1) + 𝑃𝐴(𝐵2)
A axiomática está verificada. PA é de facto uma probabilidade.
A probabilidade de intersecção de dois acontecimentos, A e B, decorrente da probabilidade
condicionada:
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
53
3.7- Acontecimentos independentes
Dois acontecimentos são independentes quando a realização de um deles não afecta a
probabilidade da realização do outro.
A e B são portanto independentes se P[B | A] P[B]
Portanto, de P[A B] PA PB | A vem: Se A e B são independentes, então P[A B]
PA PB.
Nota: Se os acontecimentos A e B são independentes também o são
3.7.1- Acontecimentos independentes versus acontecimentos incompatíveis ou mutuamente
exclusivos
Sejam A e B dois acontecimentos tais que:
P[ A] 0 e P[B] 0
No caso de acontecimentos serem incompatíveis (mutuamente exclusivos), tem-se, por definição:
(A B) e consequentemente, P[A B] 0 .
Os acontecimentos não podem ser independentes pois, para tal, e por definição, seria têm
probabilidades não nulas.
P[A B] P(A) P(B) 0 , pois ambos os acontecimentos
No caso dos acontecimentos serem independentes não podem ser mutuamente exclusivos, pois se
são independentes então, P[A B] P(A) P(B) é maior que zero; para serem
simultaneamente mutuamente exclusivos esta probabilidade teria de ser nula, facto impossível a
não ser que algum dos acontecimentos tivesse probabilidade nula, o que não é o caso.
Quer dizer, que, dois acontecimentos não podem ser simultaneamente dependente e mutuamente
exclusivos, porem existe excepções, é o caso em que um dos acontecimentos é impossível, porque
este é sempre independente e mutuamente exclusivo de todo e qualquer outro acontecimento
possível.
Dois acontecimentos são mutuamente exclusivos se:
P[A B] 0 e P[ A B] 1
.
Draft Estatistica 1, Outubro 2021 | Albertina Delgado
54
3.8- Teorema da Probabilidade Total
Teorema da probabilidade total:
Se os acontecimentos A1, A2, … An definem uma repartição sobre , então para qualquer
acontecimento B definido em tem-se que:
P[B] P[B | Ai ] P[ Ai ]
i1
3.9- Teorema de BAYES
Em teoria das probabilidades, o teorema de Bayes descreve a probabilidade de um evento, tendo com base
um conhecimento a priori que pode estar relacionado ao evento. O teorema mostra como alterar as
probabilidades a priori tendo em vista novas evidências para obter probabilidades a posteriori.
Uma das muitas aplicações do teorema de Bayes é a inferência bayesiana, uma abordagem da inferência
estatística. Quando aplicado, as probabilidades envolvidas no teorema de Bayes podem ter diferentes
significados de probabilidade.
Se A1, A2, … An definem uma repartição sobre , então para B definido em , com P[B] 0 :
n