Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

01-10-2021 
 
 
 
Draft de Apontamentos Teóricos 
Albertina Delgado 
 
UNIVERSIDADE CATÓLICA DE ANGOLA 
 
FACULDADE DE ECONOMIA E GESTÃO 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
1 
 
 
Este apontamento é para uso exclusivo para os 
Estudantes da Faculdade de Economia e Gestão 
da Universidade Católica de Angola. Constitui 
um resumo dos apontamentos de aulas da 
Professora Albertina Delgado. 
 
Nota: Ainda é um draft, texto ainda carece de 
correções ortográfica. Substitui todos os 
anteriores. 
 
 
Draft de Apontamentos Teóricos 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
2 
 
Conteúdo 
1. Introdução ................................................................................................................................................................ 4 
1.1 Conceitos Básicos .................................................................................................................................................. 4 
1.1.1- Objectivo da Estatística ................................................................................................................................. 5 
1.1.2- Utilidade da Estatística .................................................................................................................................. 5 
1.2 Evolução histórica da Estatística ........................................................................................................................... 6 
1.3- Método Estatístico de Resolução de um Problema .............................................................................................. 8 
1.4- Escalas de medidas de dados Estatísticos ............................................................................................................. 9 
2. Estatística Descritiva ............................................................................................................................................. 11 
2.1- Classificação das Variáveis ................................................................................................................................ 11 
2.2- Apresentação dos Dados .................................................................................................................................... 13 
2.2.1 Quadros e Gráficos ....................................................................................................................................... 13 
Gráficos para dados qualitativos ........................................................................................................................ 14 
Gráficos para dados quantitativos discretos ...................................................................................................... 17 
Gráficos para dados quantitativos contínuos ..................................................................................................... 17 
2.2.2- Distribuição de Frequências ........................................................................................................................ 19 
Variáveis qualitativas e variáveis quantitativas discretas .................................................................................. 20 
Variáveis quantitativas contínuas ...................................................................................................................... 22 
2.3-Medidas de Estatística Descritiva ....................................................................................................................... 24 
2.3.1- Medidas de localização ............................................................................................................................... 24 
2.3.1.1 Medidas de Tendência Central .............................................................................................................. 24 
Média Aritmética ........................................................................................................................................... 24 
Mediana ......................................................................................................................................................... 26 
Moda .............................................................................................................................................................. 28 
2.3.1.2 Medidas de Tendência não Central ........................................................................................................ 29 
Quartis ........................................................................................................................................................... 29 
Decis .............................................................................................................................................................. 31 
Percentis ........................................................................................................................................................ 31 
2.3.2- Medidas de dispersão e concentração ......................................................................................................... 32 
2.3.2.1 Medidas de Dispersão Absoluta ............................................................................................................ 32 
2.3.2.2 Medidas de dispersão relativa ................................................................................................................ 34 
2.3.3- Medidas de assimetria e Curtose ................................................................................................................. 34 
2.3.3.1 Medidas de assimetria ........................................................................................................................... 34 
2.3.3.2 Medidas de Achatamento ou de Curtose ............................................................................................... 35 
2.3.4- Medidas de Concentração e Desigualdade .................................................................................................. 36 
2.3.4.1 Curva de Lorenz .................................................................................................................................... 36 
2.3.4.2 Índice de Gini ........................................................................................................................................ 36 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
3 
2.4- Associação entre duas variáveis ......................................................................................................................... 37 
2.4.1 Regressão linear simples .............................................................................................................................. 38 
2.4.2 A Função de Regressão Populacional (FRP) ................................................................................................ 39 
2.4.3 Propriedades ................................................................................................................................................. 39 
2.4.4 Mínimos Quadrados Ordinários – (OLS- Ordinary Least Squases) ............................................................. 40 
2.4.4.1 Hipóteses do Mínimos Quadrados Ordinários ....................................................................................... 42 
2.4.5 Análise do grau de associação entre variáveis .............................................................................................. 43 
2.4.5.1 Coeficiente de determinação.................................................................................................................. 43 
2.4.5.2 Coeficiente de correlação linear ............................................................................................................ 43 
2.4.5.3 Coeficiente de correlação linear de Person ............................................................................................44 
2.4.5.4 Coeficiente de correlação linear de Sperman ........................................................................................ 44 
2.4.5.5 Covariância ............................................................................................................................................ 44 
3. Teoria da Probabilidade ......................................................................................................................................... 45 
3.1 Conceito da teoria das Probabilidades ................................................................................................................. 46 
3.2- Acontecimentos .................................................................................................................................................. 46 
3.2.1- Álgebra dos Acontecimentos....................................................................................................................... 47 
3.3 - Conceitos de Probabilidade ............................................................................................................................... 48 
3.1.1 - Definição clássica de probabilidade ........................................................................................................... 48 
3.3.2- Definição frequencista de probabilidade ..................................................................................................... 49 
3.3.3- Definição subjectiva de probabilidade ........................................................................................................ 49 
3.4- Axiomas da teoria das probabilidades ............................................................................................................ 50 
3.5- Teoremas da probabilidade ............................................................................................................................ 51 
3.6- Probabilidade condicionada ........................................................................................................................... 52 
3.7- Acontecimentos independentes ...................................................................................................................... 53 
3.7.1- Acontecimentos independentes versus acontecimentos incompatíveis ou mutuamente exclusivos ........... 53 
3.8- Teorema da Probabilidade Total .................................................................................................................... 54 
3.9- Teorema de BAYES ....................................................................................................................................... 54 
 
 
 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
4 
1. Introdução 
SUMÁRIO 
 
1.1. Conceitos básicos 
1.2. Evolução histórica da Estatística 
1.3. Método estatístico de resolução de um problema 
1.4. Escalas de medidas de dados estatísticos 
 
1.1 Conceitos Básicos 
 
 O que é a Estatística? 
 
A Estatística é a ciência que se ocupa da obtenção de informação, seu tratamento inicial, com a 
finalidade de, através de resultados probabilísticos adequados, inferir de uma amostra para a 
população, e eventualmente prever a evolução futura de um fenómeno. Em outras palavras, é um 
instrumento de leitura de informação, e da sua transformação em conhecimento. 
 
De forma mais clara: 
Estatística é a ciência de colectar, organizar, apresentar, analisar e interpretar dados numéricos ou 
não (informações) com o objectivo de tomar melhores decisões. 
 
 Estatística, refere-se a ciência em objecto de estudo. 
 
 Estatísticas, referem-se a dados numéricos. 
 
 Estatística descritiva, consiste na recolha, apresentação, análise e interpretação de dados 
numéricos através da criação de instrumentos adequados que podem ser quadros, gráficos e 
indicadores numéricos. 
 
 Estatística Aplicada, refere-se as técnicas pelas quais os dados de natureza quantitativa são 
colectados, organizados, apresentados e analisados. 
 
 Inferência Estatística, permite estimar as características desconhecidas de uma população 
e testar se determinadas hipóteses sobre essas características são plausíveis. 
 
 Parâmetros – Resumem as características da população e assumem valores numéricos fixos 
(constantes), isto é, são valores exactos e são designado por letras maiúsculas do alfabeto 
Grego. Ex: média da população (µ), variância populacional ( σ2), desvio-padrão populacional 
(σ). 
 
 Estatísticas – É toda a função que opera sobre a amostra. Isto é, são valores não exactos, 
dado que de uma população se podem retirar diversas amostras estamos perante valores que 
variam de amostra para amostra, e são designado por letras maiúsculas do alfabeto 
Romano. Ex: média amostral (�̅� ), a variância amostral (S2), desvio-padrão amostral (S). 
 
 População (ou Universo): Conjunto de unidades com uma ou mais características comuns 
(n.º de elementos é N). 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
5 
 Amostra: Subconjunto da População (nº de elementos é n). 
 
Exemplos: 
 
1) População: Intenção de voto dos eleitores de Luanda 
Amostra: Intenção de voto de alguns dos eleitores de Luanda seleccionados a partir da lista 
telefónica. 
 
2) População: Consumo de um novo detergente pelos clientes de um supermercado 
Amostra: Consumo do produto recolhido por entrevista à porta do Supermercado 
 
 
 
1.1.1- Objectivo da Estatística 
 
O objectivo fundamental deste ramo do conhecimento consiste na recolha, compilação, análise e 
interpretação de dados, havendo a necessidade de se distinguir entre estatística descritiva e 
inferência estatística. 
 
Estatística Descritiva: conjunto de métodos estatísticos que visam sumariar e descrever os atributos 
mais proeminentes aos dados. 
 
Estatística Inferencial: conjunto de métodos estatísticos que visam caracterizar (ou inferir sobre) 
uma população a partir de uma parte dela (a amostra). 
 
 
1.1.2- Utilidade da Estatística 
 
A utilidade da estatística pode ser resumida do seguinte modo: 
 
 Permite descrever e compreender relações entre variáveis de forma imediata: a informação 
é apresentada de modo a possibilitar uma rápida interpretação e identificação das relações 
mais importantes; 
 
 Permite a tomada de melhores e mais rápidas decisões: é possível controlar mais 
informações num espaço de tempo mais curto; 
 
 Facilita a tomada de decisões: o conhecimento de situações passadas e presentes, 
acompanhadas por uma previsão fundamentada da evolução futura, são as bases para as 
tomadas de decisões. 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
6 
1.2 Evolução histórica da Estatística 
O termo estatística vem da expressão em Latim statisticum collegium isto é, palestra sobre os 
assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de 
estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A 
palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de 
Lena e adoptada pelo académico alemão Godofredo Achenwall. Aparece como vocabulário na 
Enciclopédia Britânica em 1797, e adquiriu um significado de colecta e classificação de dados, no 
início do século 19. 
 
A medida que a sociedade primitiva se desenvolvia e organizava-se houve necessidade de se 
conhecer dados numéricos dos recursos disponíveis, os Estados, desde tempos longínquos, 
precisaram conhecer determinadas características da população, efectuar a sua contagem e saber a 
sua composição ou os seus rendimentos. 
 
Para que os governantes das grandes civilizações antigas tivessem conhecimento dos bens que o 
Estado possuía e como estavam distribuídos pelos seus habitantes, realizaram-se as primeiras 
estatísticas, nomeadamente para determinarem leis sobre impostos e números de homens disponíveis 
para combater.Estas estatísticas, eram frequentemente limitadas à população adulta masculina. 
 
O primeiro dado disponível sobre um levantamento estatístico foi referido por Heródoto, que 
afirmava ter-se efectuado em 3050 a.c um estudo das riquezas da população do Egipto com a 
finalidade de averiguar quais os recursos humanos e económicos disponíveis para a construção das 
pirâmides. 
 
Existem indícios, que constam da Bíblia, relativamente a recenseamentos feitos por Moisés (1490 
a.c). Outra estatística referida pelos investigadores foi feita no ano 1400 a.c, quando Ramsés II 
mandou realizar um levantamento das terras do Egipto. 
 
As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que eram 
propriedade da Igreja, são algumas das estatísticas importantes de que há referências desde a queda 
do império romano. 
 
Para responder ao desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar, 
apresentar, interpretar os dados recolhidos foram para os censos e são para a Estatística um aspecto 
essencial do método utilizado. Mas, um longo caminho havia de ser percorrido até aos dias de hoje. 
 
Até ao início do séc. XVII, a Estatística limitou-se ao estudo dos “assuntos de Estado”. Usada pelas 
autoridades políticas na inventariação ou arrolamento dos recursos disponíveis, a Estatística 
limitava-se a uma simples técnica de contagem, traduzindo numericamente factos ou fenómenos 
observados fase da Estatística Descritiva. 
 
No séc. XVII, com os aritméticos políticos, nomeadamente John Graunt (1620-1674) e Sir William 
Petty (1623-1687), inicia-se em Inglaterra uma nova fase de desenvolvimento da Estatística, virada 
para a análise dos fenómenos observados na fase da Estatística Analítica. 
 
John Graunt, uma pessoa engenhosa e estudiosa, tinha o hábito de se levantar cedo para estudar, 
antes da abertura da sua loja, inspirado nas tábuas de mortalidade que semanalmente se publicavam 
na sua paróquia, publicou, em 1660, um trabalho estatístico sobre a mortalidade dos habitantes de 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
7 
Londres, procurando dar interpretações sociais às listas de tempos de vida. Sir William Petty, 
baseado neste trabalho, escreveu um livro de largo sucesso, divulgando a nova ciência da Aritmética 
Política. 
 
Em 1692, o astrónomo Edmund Halley (1658-1744), famoso pela descoberta do cometa de órbita 
elíptica que se aproxima da Terra de 75 em 75 anos, baseando-se também em listas de nascimento e 
falecimento, foi o percursor das actuais tabelas de mortalidade, base das anuidades dos seguros de 
vida. 
 
O desenvolvimento do Cálculo das Probabilidades surgiu também no século XVII. A ligação das 
probabilidades com os conhecimentos estatísticos veio dar uma nova dimensão à Estatística, que 
progressivamente se foi tornando um instrumento científico poderoso e indispensável. Considera- 
se assim uma nova fase, a terceira, em que se começa a fazer inferência estatística: quando a partir 
de observações se procurou deduzir relações causais, entre variáveis, realizando-se previsões a partir 
daquelas relações. 
 
A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem 
ao alemão Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik, 
do grego statizein; outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento 
que dela tiravam os políticos e o Estado. 
 
De acordo com a Revista do Instituto Internacional de Estatística, “Cinco homens, Hermann 
Conring; Gottfried Achenwall; Johann Peter Süssmilch; John Graunt e William Petty já receberam 
a honra de serem chamados de fundadores da estatística, por diferentes autores.1” 
 
A partir do século XVIII são vários os nomes que se destacaram na história da evolução da estatística, 
tais como Quételet (1796-1874), Galton (1822-1911), Karl Pearson (1857-1936), Weldon (1860-
1906), Ronald Fisher (1890-1962). 
 
Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantém esta ligação, como 
todos os Estados e a sociedade em geral dependem cada vez mais dela. Por isso, em todos os Estados 
existe um Departamento ou Instituto Nacional de Estatística. Na actualidade, a Estatística já não se 
limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicação alargou-se à 
análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia, 
Educação, etc., e ainda a domínios aparentemente desligados, como estrutura de linguagem e estudo 
de formas literárias. 
 
 
 
 
 
 
 
 
 
1 Cfr WILLCOX, Walter (1938) The Founder of Statistics. Review of the International Statistical Institute 
5(4):321-328. 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
8 
1.3- Método Estatístico de Resolução de um Problema 
 
O método estatístico de resolução de um problema, é constituído por diferentes etapas, a identificação, a 
recolha, apresentação e interpretação dos dados. Elas podem ser apresentadas pelo diagrama: 
 
 
Identificação do Problema 
 
É importante desde início do estudo, ter claro, qual é problema a analisar, e uma vez conhecido é importante 
saber, qual o tipo de decisões que se pretende tomar. 
 
Recolha dos Dados 
 
A recolha de toda a informação pode ser feita directamente (quando os dados são obtidos da fonte originária) 
ou de uma forma indirecta (quando dados recolhidos provém já de uma recolha indirecta). 
 
Os dados obtidos de fonte originária, isto é, quando é possível encontrar em registos ou ficheiros, chamam-
se dados primários; enquanto que os valores não disponíveis nestas fontes e calculados a partir daqueles 
são dados secundários. 
 
Exemplos: 
 
Dados Primários: Todos os dados resultantes de inquéritos feitos directamente a uma população ou a um 
grupo desta população. 
 
Dados Secundários: Todos os dados disponíveis nas estatísticas publicadas do INE. As fontes dos dados 
podem ainda ser classificados como internas e externas. 
 Fontes Internas, os serviços de contabilidade, produção ou marketing de uma empresa, 
constituem fontes internas de informação económicas e comercial que deverá ser posta ao 
dispor dos órgãos de decisão da empresa. 
 
 Fontes Externas, informação externa a empresa é a proveniente dos organismos públicos 
como o Governo, INE, semanários económicos e revistas de especialidade. 
No que diz respeito à periodicidade, a recolha dos dados pode ser classificada como: 
 Continua, quando se realiza permanentemente; 
 Periódica, quando feita em intervalos de tempo; 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
9 
 Ocasional, quando realizada de modo casual. 
 
Muitas vezes acontece, não estar disponível toda informação necessária ou porque não existe, ou 
porque, se encontra desactualizada. Nestes casos é necessário fazer uma nova recolha de informação 
 
Crítica dos Dados 
 
Uma vez recolhidos os dados, é necessário proceder-se a uma revisão crítica, de modo ao suprir 
valores estranhos ou eliminar erros capazes de provocar futuros enganos de apresentação e análise 
ou mesmo de enviesar conclusões obtidas. 
 
Apresentação dos Dados 
 
Aqui começa o principal objectivo da estatística descritiva, criar os instrumentos necessários para 
classificar e apresentar conjuntos de dados numéricos, de modo que a informação neles contida seja 
compreendida mais fácil e rapidamente. Este processo de classificação consiste na identificação de 
unidades de informação com características comuns e no agrupamento em classes. 
 
Uma vez classificados os dados, passa a ser possível sintetizar a informação neles contida com ajuda 
de quadros e valores numéricos descritivos, que ajudem a compreender a situação e a identificar 
relações importantes entre as variáveis. 
 
Análise e InterpretaçãoPor último é necessário, interpretar os resultados encontrados. A interpretação será tanto mais 
facilitada quanto se tiver escolhido em etapas anteriores, os instrumentos mais apropriados à 
representação e análise do tipo de dados recolhidos. 
 
1.4- Escalas de medidas de dados Estatísticos 
Dependendo do tipo de variáveis que constituem os dados estes podem ser expressos em quatro 
escalas distintas: nominal, ordinal, por intervalo e por rácios. 
 
Os dados qualitativos exprimem-se nas duas primeiras escalas e os dados quantitativos nas duas 
últimas. 
 
 Escala Nominal – são os valores (numéricos ou não) que não possuem uma ordem 
intrínseca. Um caso particular deste tipo de escala de medida ocorre quando a característica 
em estudo envolve apenas duas categorias. Essas características são denominadas binárias 
ou diatómicas. 
 
Exemplos: 
 O tipo de sangue de uma pessoa (O, A, B e AB) 
 Categorias taxionómicas das plantas ou animais. 
 O sexo (0 - Feminino, 1 - Masculino) ou questões que apenas podem ser 
respondidas com “sim” ou “não”. 
 
 Escala Ordinal – são os valores (numéricos ou não) que possuem uma ordem intrínseca. 
Esta escala de medida pode ser construída a partir de escalas nominais quando existe 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
10 
paralelismo evidente entre a escala nominal e uma sequência crescente ou decrescente com 
significado. 
 
Exemplos: 
 Pode-se perguntar a um consumidor qual é a sua opinião sobre um determinado 
produto alimentar de acordo com a seguinte lista: (detesta; gosta pouco; 
indiferente; gosta; adora), sendo evidente que esta lista corresponde a uma 
sequência ordenada com cinco categorias. 
 Classificações obtidas no 2º e 3º ciclos do ensino básico (1 a 5). 
 Classificação dos camarões para venda. 
 Grupos etários (crianças, jovens, adultos e idosos) 
 
 Escala de Intervalos – os valores numéricos possuem ordem e têm diferenças significado. 
Este tipo de escala é usado com dados quantitativos tanto discretos como contínuos sendo 
que a distância entre os valores que constituem os intervalos deve ser igual. 
 
Exemplos: 
 O número de automóveis que atravessa a ponte Elisabeth em cada hora pode ser 
definido numa escala por intervalos de valores discretos, por exemplo, entre 0 e 
150; entre 150 e 300; entre 300 e 450, etc. 
 A temperatura mínima diária do ar em ºC numa estação meteorológica num 
determinado ano pode ser definido numa escala por intervalos de valores 
contínuos, por exemplo, [-5, 0[; [0, 5[; [5, 10[; [10, 15[; etc. 
 
 Escala de Razões – O valor zero representa ausência da característica e múltiplos de valores 
possuem significado. As escalas deste tipo têm as mesmas propriedades que a escala por 
intervalos para variáveis contínuas e, adicionalmente, apresentam a característica de 
possuírem um zero absoluto como valor mínimo de modo que as razões entre duas medidas 
tenham sempre o mesmo valor para qualquer que seja a unidade utilizada. 
 
Exemplos: 
 
 O peso pode constituir uma escala por rácios (a razão entre os pesos de dois 
pacotes de açúcar, por exemplo, é sempre o mesmo qualquer que seja a unidade 
de medida: g, kg, ton., etc.) mas a temperatura não (10ºC = 50 ºF; 30 ºC=86 ºF 
porém 10/30 ≠ 50/86. 
 Medidas de comprimento, áreas, pesos ou intervalos de tempo. 
 
 
 
 
 
 
 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
11 
2. Estatística Descritiva 
SUMÁRIO 
 
2.1 Classificação das variáveis 
2.2 Apresentação de dados 
 2.2.1 Quadros e Gráficos 
 2.2.2 Distribuição de frequências 
2.3 Medidas de Estatística Descritiva 
2.3.1 Medidas de localização 
2.3.2 Medidas de dispersão e concentração 
2.3.3 Medidas de assimetria e curtose 
2.4 Associação entre duas variáveis 
2.4.1 Regressão linear 
2.4.2 Análise da correlação 
 
 
2.1- Classificação das Variáveis 
A variável é uma característica (quantificada) que pode variar de elemento para elemento, de uma 
amostra ou população. 
 
Uma variável, enquanto representar apenas a característica e não estiver concretizada em nenhum 
elemento, representa-se habitualmente por uma letra maiúscula. Quando se pretende representar o 
valor da variável para um indivíduo utiliza-se a respectiva letra minúscula. 
 
Exemplo: 
X representa a hemoglobina no sangue; 
x =14,2 representa a hemoglobina de um certo indivíduo 
 
Uma amostra pode conter mais de uma característica para cada uma das unidades observadas. 
Por exemplo na população angolana, podem interessar várias características dos indivíduos: o 
peso, a altura, a cor dos olhos, a raça, o tipo de sangue, etc. 
 
Tipos de variáveis 
Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, 
ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. Com 
exemplo temos: comprimento de um escaravelho, o nº de filhos de um casal, a temperatura da água, 
etc. 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
12 
 Variáveis discretas: características mensuráveis que assumem apenas um número finito ou 
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são 
o resultado de contagens. Por exemplo o número de filhos, número de bactérias por litro de 
leite, número de cigarros fumados por dia. 
 
 Variáveis contínuas, características mensuráveis que assumem valores em uma escala 
contínua (na recta real), para as quais valores fraccionais fazem sentido. Usualmente devem 
ser medidas através de algum instrumento, a título de exemplo temos o peso (balança), altura 
(régua), tempo (relógio), pressão arterial, idade. 
 
Variáveis Qualitativas (ou categóricas): são as características que não possuem valores 
quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma 
classificação dos indivíduos. Podem ser nominais ou ordinais. Para exemplo deste tipo de variáveis 
pode-se citar as seguintes: o tipo de sangue de uma pessoa (O, A, B e AB); o sexo (Feminino, 
Masculino). 
 
 Variáveis nominais: não existe ordenação dentre as categorias. Por exemplo: sexo, cor dos 
olhos, fumante/não fumante, doente/sadio. 
 
 Variáveis ordinais: existe uma ordenação entre as categorias. Exemplificando temos: 
escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de 
observação (Janeiro, Fevereiro, ..., Dezembro). 
 
OBS: 
 
 Uma variável originalmente quantitativa pode ser colectada de forma qualitativa. 
 
Exemplos: 
 
1- A variável idade, medida em anos completos, é quantitativa (contínua); mas, se for informada 
apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc.), é qualitativa (ordinal). 
 
2- O peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalha com o valor obtido 
na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso - pena, peso-
leve, peso -pesado, etc.). 
 
 Outro ponto importante é que nem sempre uma variável representada por números é quantitativa. 
 
Exemplos: 
1- O número do telefone de uma pessoa, o número da casa, o número de sua identidade. 
 
2- Às vezes o sexo do indivíduo é registrado na placa de dados como 1 se for masculino e 2 se for 
feminino. Isto não significa que a variável sexo passou a ser quantitativa! 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
13 
2.2- Apresentação dos Dados 
A estatística descritiva pretende organizar, sintetizar e analisar os dados obtidos no estudo de 
variáveis relativas a uma população de modo a permitir caracterizar a população e conhecer o seu 
comportamento. 
 
A informação fornecida pelos dados é compilada e sintetizada em tabelas e gráficos e através do 
cálculo de indicadores numéricos. O desafio da Estatística Descritiva consiste não na própria 
construção das tabelas ou dos gráficos mas na escolha mais adequada destasferramentas de modo a 
caracterizar correctamente as variáveis em estudo. 
 
2.2.1 Quadros e Gráficos 
Quando nos deparamos com muitos dados não classificados torna-se muito difícil tirar conclusões. 
Por isso é necessário proceder a um trabalho prévio de ordenação e apresentação desses valores, e a 
mesma pode ser feita por quadros e gráficos. 
 
Quer os quadros, quer os gráficos devem apresentar três partes: o cabeçalho, o corpo e o rodapé. O 
cabeçalho deve dar-nos a informação sobre os dados, em que consistem e a que se referem (lugar e 
época); o corpo é representado pelas colunas e sub colunas dentro dos quais se apresentam os dados; 
no rodapé, para além da identificação dos dados, poderão ainda incluir-se quaisquer observações 
pertinentes. 
 
 Quadros 
A UCAN resolveu observar as alturas (em cm) dos alunos de uma turma de Contabilidade e 
Administração do 2º Ano. O resultado obtido foi o seguinte: 
Quadro 1: Alturas (em cm) dos alunos de uma turma de C. A do 2º Ano 
150 169 174 155 165 170 172 
152 158 163 158 166 158 166 
170 171 162 171 161 154 168 
161 164 166 164 162 156 167 
Fonte: UCAN, 2009 
 
O quadro referido pode ser apresentado em ordem crescente. 
Quadro 2: Alturas (em cm) dos alunos de uma turma de C. A do 2º Ano 
150 156 161 163 166 168 171 
152 158 161 164 166 169 171 
154 158 162 164 166 170 172 
155 158 162 165 167 170 174 
Fonte: UCAN, 2009 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
14 
Quadro 3: Vendas de Livros no ano de 2005 
Meses do Ano Volumes Vendidos 
Janeiro 70,436.00 
Fevereiro 77,450.00 
Março 71,030.00 
Abril 71,425.00 
Maio 72,260.00 
Junho 72,520.00 
Julho 73,075.00 
Agosto 73,612.00 
Setembro 74,085.00 
Outubro 74,350.00 
Novembro 74,728.00 
Dezembro 74,100.00 
Fonte: Livraria Novo Horizonte 
 
 Gráficos 
 
A representação gráfica dos dados estatísticos tem por finalidade, dar uma ideia, mais imediata dos resultados 
obtidos permitindo chegar-se a conclusões mais rápidas sobre a evolução do fenómeno em estudo ou sobre 
a relação entre os diferentes valores apresentados. 
 
 
Gráficos para dados qualitativos 
 
A representação gráfica dos dados estatísticos tem por finalidade, dar uma ideia, mais imediata dos 
resultados obtidos permitindo chegar-se a conclusões mais rápidas sobre a evolução do fenómeno em 
estudo ou sobre a relação entre os diferentes valores apresentados. 
 
Os mais comuns são: o diagrama de barras, o histograma, gráfico de sectores e o gráfico de linhas. 
 
 Gráfico de Linhas 
 
É o mais utilizado de entre todos os tipos de gráficos devido a sua facilidade de execução e de interpretação. 
Sua aplicação é mais indicada para representações de séries temporais sendo por tal razão, conhecidos 
também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo vertical (y) a 
mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem crescente. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
15 
 
 
 
 
 Gráficos de Barras e Colunas 
 
Constrói-se colocando os valores da variável em observação num dos eixos (Horizontal) e as frequências no 
outro eixo (Vertical). 
 
O gráfico de barras é um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles 
representa a intensidade de uma modalidade ou atributo. É recomendável que cada coluna conserve uma 
distância entre si de aproximadamente 2/3 da largura da base de cada barra, evidenciando deste modo, a não 
continuidade na sequência dos dados. 
 
O gráfico de colunas é o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de 
barras por serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando 
as designações das categorias são breves. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
16 
 
 
 
 
 
 Gráficos de Sectores 
 
Consiste na representação gráfica dos resultados num círculo, por meio de sectores. Este tipo de gráfico onde 
a variável em estudo é projetada num círculo, de raio arbitrário, dividido em setores com áreas proporcionais 
às frequências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
17 
 
Gráficos para dados quantitativos discretos 
 
 Diagrama diferencial 
 
 Este gráfico é formado por segmentos de retas perpendiculares ao eixo horizontal (eixo da variável), cujo comprimento 
corresponde à frequência absoluta ou relativa de cada elemento da distribuição. Suas coordenadas não podem ser unidas 
porque a leitura do gráfico deve tornar claro que não há continuidade entre os valores individuais assumidos pela 
variável em estudo. 
 
Número de irmãos dos alunos da disciplina Estatística 
 
 
 
 Diagrama Integral 
 
É o gráfico para frequência acumulada de uma variável quantitativa discreta. Na abscissa são alocados os valores 
assumidos pela variável número de irmãos e no eixo das ordenadas suas frequências acumuladas. 
 
Número de irmãos dos alunos da disciplina Estatística 
 
 
Gráficos para dados quantitativos contínuos 
 
 Histograma 
 
Os histogramas são diagramas de barras utilizados para variáveis quantitativas. São formados por rectângulos 
justapostos. 
 
A frequência correspondente a cada classe ou intervalo é representada pela superfície de um rectângulo, cuja 
base, situada no eixo horizontal, é limitada pelos valores extremos. Cada rectângulo é proporcional à 
frequência de cada classe ou intervalo. Pode ser construído para frequências relativas e para frequência 
absolutas. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
18 
 
 
 
 
 Polígono de frequência simples 
 
 É um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas 
correspondentes aos pontos médios de cada classe e as ordenadas, às frequências absolutas ou relativas 
dessas mesmas classes. O polígono de frequência é um gráfico que deve ser fechado no eixo das abscissas. 
 
 Então, para finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e outra à 
direita, ambas com frequências zero. Tal procedimento permite que a área sob a linha de frequências seja 
igual à área do histograma. 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
19 
 
 
 Polígono de frequências acumuladas 
 
É um gráfico que permite descrever dados quantitativos por meio da frequência acumulada. O polígono de frequências 
acumuladas é um gráfico de linha que une os pontos cujas abscissas são os limites superiores das classes, e, ordenadas 
suas respectivas frequências acumuladas. Quando os dados contidos em cada classe são distribuídos uniformemente, 
pode-se estimar, a partir do polígono, o número de elementos pertencentes a qualquer uma das classes que compõe a 
distribuição de frequência dos dados e a quantidade ou percentagem de elementos que estão abaixo de certo valor 
pertencente ao conjunto de dados. 
 
 
 
 
2.2.2- Distribuição de Frequências 
Considerando uma população (N) ou uma amostra (n) de indivíduos com a característica que representa p 
modalidades observadas X1,X2, X3, …,Xp . Chama-se distribuição de frequências ao conjunto de todos os 
valores ou modalidades de uma variável e das frequências ou numero de ocorrências correspondentes. 
 
Nas tabelas de distribuição de frequências representa-se a forma como uma dada variável se encontra 
distribuída pelo conjunto dos indivíduos em que essa variável foi analisada, tendo aplicação tanto em 
variáveis qualitativas como quantitativas. 
 
O Quadro de distribuição de frequências é construído da seguinte forma: numa coluna colocam-se todos os 
valores que a variável apresenta e na outra coluna o número de ocorrência correspondentes a cada valor da 
variável. 
 
 
 
Draft Estatistica1, Outubro 2021 | Albertina Delgado 
 
 
20 
Xi Fi 
X1 n1 
X2 n2 
X3 n3 
. . 
. . 
. . 
Xp np 
 
 
Variáveis qualitativas e variáveis quantitativas discretas 
 
Quando se trata de uma variável discreta, a construção de um quadro de distribuição de frequências é 
imediata, a cada valor da variável faz-se corresponder o número de ocorrências. 
 
A frequência absoluta (Fi), é o número de vezes que cada modalidade da variável se repete na amostra ou 
população. A partir destas podem-se calcular as frequências relativas e as frequências absolutas e relativas 
acumuladas. 
 
A frequência relativa (fi), é dada por fi = Fi/N, isto é, o número de vezes que esse valor ocorre (Fi) 
relativamente ao total da amostra (n) ou população (N). 
 
As frequências acumuladas (cum Fi; cum fi), representam a soma do número de ocorrências para os valores 
da variável inferiores ou iguais ao valor dado, isto é, o número ou proporção de elementos observados que 
possuem o valor da característica igual ou inferir à modalidade em causa. 
 
Exemplos: 
 
Variável Qualitativa 
 
Suponha que se pretende estudar a marca de computadores portáteis preferida pelos estudantes do ensino 
superior. Tendo-se questionado 50 estudantes obtiveram-se os dados representados na Tabela seguinte: 
 
Marca de computadores portáteis preferida por 50 estudantes do ensino superior 
COMPAQ HP COMPAQ COMPAQ COMPAQ ACER ACER ACER FUJITSU TOSHIBA 
TOSHIBA COMPAQ COMPAQ TOSHIBA TOSHIBA ACER ACER COMPAQ FUJITSU COMPAQ 
FUJITSU IBM FUJITSU IBM COMPAQ TOSHIBA FUJITSU FUJITSU IBM TOSHIBA 
ACER TOSHIBA IBM IBM IBM IBM FUJITSU COMPAQ TOSHIBA ACER 
FUJITSU COMPAQ ACER IBM IBM TOSHIBA COMPAQ TOSHIBA COMPAQ TOSHIBA 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
21 
Fazendo o quadro de distribuição de frequências teremos: 
Marcas de Computadores Fi fi Cum Fi Cum fi 
COMPAQ 13 0,26 13 0,26 
TOSHIBA 11 0,22 24 0,48 
FUJITSU 8 0,16 32 0,64 
ACER 8 0,16 40 0,80 
HP 1 0,02 41 0,82 
IBM 9 0,18 50 1,00 
Soma 50 1,00 
 
Os gráficos que podem ser feitos de uma variável qualitativa são: 
 
Gráfico de barras ou colunas 
 
 
 
 
Gráfico sectorial 
 
Porque a marca de computadores é uma variável qualitativa não é possível fazer outro tipo de gráficos. 
 
Interpretação: 
 
 Dos 50 estudantes entrevistados 26 preferem a marca compaq, ao passo que apenas um prefere a 
marca HP; 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
22 
 26% dos alunos entrevistados preferem a marca compaq; 
 
 As marcas Compaq e Toshiba são as marcas mais preferidas pelos estudantes universitários, 
representando 48% dos entrevistados. 
 
Variável Discreta 
 
Suponha-se uma experiência concebida para verificar se um dado é ou não viciado. A experiência consistiu 
em lançar os dados 112 vezes e registar o resultado obtido em cada lançamento. O espaço amostral desta 
experiência é um conjunto discreto, limitado e de dimensão reduzida, correspondendo a A ={1, 2, 3, 4, 5, 6}. 
Resultados obtidos em 112 lançamentos de um dado 
 
Variáveis quantitativas contínuas 
 
Nesse caso recorre-se à distribuição dos dados por classes ou células. Aqui será necessário introduzir alguns 
conceitos novos como: o número de classes (K), a amplitude (ai), limite e ponto médio ou centro de classes. 
 
 
Existem algumas regras básicas que deverão ser consideradas na construção os intervalos: 
1- Em geral, o número de classes (K) deverá estar compreendido entre 4 e 14; 
2- Nenhuma classe deverá ter uma frequência nula; 
3- As classes deverão ter, sempre que possível, amplitudes iguais; 
4- Os pontos médios das classes deverão ser números de cálculo fácil; 
5- As classes abertas deverão ser evitadas embora nem sempre seja possível fazê-lo; 
6- Os limites das classes definidos de modo a que cada valor da variável é incluído num e só num 
intervalo. 
 
Levando em consideração as regras básicas, para se determinar o número de classes (K), por vezes é 
adoptada a seguintes soluções: 
 
1) N.º de classes K= 5 para n < 25 e 𝐾 ≅ √𝑁 para n ≥ 25 
2) Fórmula de Sturges: K ≈ 1 + 3,22 log n 
 
A amplitude das classes (ai), poderá ser calculada da seguinte formula: 
 
K
ValorValor
K
R
a mínimomáximoi
)( 

 
 
Existem diversas maneiras de expressar os limites das classes, como: 
1- [10; 12]: compreende todos os valores entre 10 e 12; 
2- [10; 12[: compreende todos os valores entre 10 e 12, excluindo o 12; 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
23 
3- ]10;12]: compreende todos os valores entre 10 e 12, excluindo o 10; 
 
O exemplo n.º 2, é mais utilizado, e será o adoptado nas aulas para estudo da estatística descritiva. 
 
O ponto médio ou centro da classe (Ci), é a média aritmética entre o limite inferior e superior da classe. 
 
Exemplo: 
 
A UCAN resolveu observar as alturas (em cm) dos alunos de uma turma de Contabilidade e Administração 
do 2º Ano. O resultado obtido foi o seguinte: 
 
Alturas (em cm) dos alunos de uma turma de C. A do 2º Ano 
150 169 174 155 165 170 172 
152 158 163 158 166 158 166 
170 171 162 171 161 154 168 
161 164 166 164 162 156 167 
 
𝐾 ≅ √28 ≅ 5,29 553,4
29,5
150174


ia 
Classes Fi fi CumFi Cumfi 
150-155 3 0,1071 3 0,1071 
155-160 5 0,1786 8 0,2857 
160-165 7 0,2500 15 0,5357 
165-170 7 0,2500 22 0,7857 
170-175 6 0,2143 28 1,0000 
Soma 28 1 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
24 
2.3-Medidas de Estatística Descritiva 
Entre as medidas de estatística descritiva, encontramos as medidas de localização, de dispersão, de 
concentração, de assimetria e de curtose. 
 
2.3.1- Medidas de localização 
 
Estas podem ser agrupadas da seguinte forma: 
 
 
 
2.3.1.1 Medidas de Tendência Central 
 
 
 Média Aritmética 
 
A média é uma medida de localização de tendência central, sendo representada por �̅� por μ conforme se 
trate, da média amostral (estatística) ou da média populacional (parâmetro). 
 
A média de um conjunto de dados quantitativos, que se obtém somando todos os valores e dividindo o 
resultado pelo nº total de observações. 
 
 
Dados não tabelado 
n
x
X
n
i
i
 1
 
Onde: 
xi é o valor observado 
n é o número total de observações 
 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
25 
Dados Discretos 
i
n
i
i
i
n
i
i
fX
N
FX



 


1
1
 
 
i
n
i
i
i
n
i
i
fX
n
FX
X 


 


1
1
 
Onde:. 
 
Xi : valor observado; N : é somatório de Fi; Fi: é a frequência absoluta e fi a frequência relativa. 
 
Dados Contínuos 
 
i
n
i
i
i
n
i
i
fC
N
FC



 


1
1
 
 
i
n
i
i
i
n
i
i
fC
n
FC
X 


 


1
1
 
 
 
Onde: 
Ci : centro da classe; N : é somatório de Fi; Fi: é a frequência absoluta e fi a frequência relativa. 
 
Propriedades da Média Aritmética 
 
1- A média é um valor calculado facilmente e depende de todas as observações; 
2- É única em um conjunto de dados e nem sempre tem existência real, ou seja, nem sempre é igual a um 
determinado valor observado; 
3- A média é afetada por valores extremos observados; 
4- Por depender de todos os valores observados, qualquer modificação nos dados fará com que a média 
fique alterada. Isto quer dizer que somando-se, subtraindo-se, multiplicando-se ou dividindo-se uma 
constante a cada valor observado, a média ficará acrescida, diminuída, multiplicada ou dividida desse 
valor; 
5- A média dos desvios dos valores da variável em relação à média é nulo. 
  0 ii Xf 
6- A média do quadrado dos desvios dos valores da variável em relação à média é mínima. 
 
2
  ii Xf é mínimo 
A média aritmética tem vantagens e desvantagens. 
Vantagens: 
- Facilidade de calculo e de interpretação, e por isso é muito utilizada; 
- Utilizar toda a informação disponível e poder ser calculada com precisãomatemática. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
26 
 
Desvantagens: 
- Ser influenciada por valores extremos que tomam um peso significativo no calculo da média; 
- Poder não corresponder a um valor concreto da variável 
 
Mediana 
 
É o valor que divide uma série ordenada de tal forma que pelo menos a metade das observações 
sejam iguais ou maiores do que ela, e que haja pelo menos outra metade de observações maiores do 
que ela. 
 
Isto é, é o valor da variável que ocupa a posição central na sucessão de observações ou na distribuição 
de frequências. 
 
É mais usada quando os dados apresentam distribuição assimétrica. 
 
Dados discretos 
 
Quando se tratam de dados discreto, primeiramente temos que saber se a distribuição é par ou 
impar. 
 
- Se Fi  N For impar então, a mediana será o central de ordem 
2
1N
 
 
- Se Fi  N For impar então, a mediana será o central de ordem
2
22
2 NN


 
 
 
Exemplo 1: 
Xi Fi CumFi 
1 1 1 
2 3 4 
3 7 11 
4 2 13 
Soma 13 
 
Como podemos ver no nosso exemplo a distribuição em referência é impar, então: 
 
1- Calcular: 
 
7
2
113
2
1



N
 
 
2- Achar a frequência acumulada absoluta que contém este valor 7, neste caso a frequência 
acumulada que contém 7 é a 11; 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
27 
 
3- A Mediana será o valor Xi correspondente a esta frequência acumulada. Me = 3 
 
 
 
Exemplo 2: 
Xi Fi CumFi 
82 5 5 
85 10 15 
87 15 30 
89 8 38 
90 4 42 
Soma 42 
 
Como podemos ver no nosso exemplo 2 a distribuição em referência é par, então: 
 
1- Calcular: 
5,21
2
2
42
2
242
2
22
2





 NN
 
 
2- Achar a frequência acumulada absoluta que contém este valor 21,5, neste caso a frequência 
acumulada que contém 21,5 é a 30; 
 
3- A Mediana será o valor Xi correspondente a esta frequência acumulada. Me = 87 
 
Dados Contínuos 
 
Quando se tratam de dados contínuos, não interessa saber se a distribuição é par ou impar. 
 
1- Calcula-se 
𝑁
2
 
 
2- Achar a frequência acumulada absoluta que contém este valor, calculado em 1, 
 
3- Identificar a classe da Mediana, e aplica-se a seguinte formula: 
 
)(
)(
)1(
)(
2
Me
Mei
Mei
Me a
F
CumF
N
liMe 



 
 
Onde: 
 li (Me): limite inferior da classe mediana 
 N: dimensão da amostra, isto é somatório de Fi; 
 CumFi(Me-1): frequência acumulada absoluta da classe anterior à classe mediana 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
28 
 Fi (Me): frequência absoluta da classe mediana 
 a(Me): amplitude da classe mediana 
 
 
 
A expressão para frequências relativas é semelhante: 
 
)(
)(
)1(
)(
5,0
Me
Mei
Mei
Me a
f
Cumf
liMe 



 
Onde: 
 
 Cumfi(Me-1): frequência acumulada relativa da classe anterior à classe mediana 
 fi (Me): frequência relativa da classe mediana 
 a(Me): amplitude da classe mediana 
 
A mediana é uma medida comum das propriedades de conjuntos de dados em estatística e em teoria das 
probabilidades, com importância central na estatística robusta. A estatística robusta é mais resistente, com 
ponto de rotura de 50%. A mediana não fornece resultados arbitrariamente grandes desde que mais da metade 
dos dados não esteja contaminada. 
 
A vantagem da mediana em relação à média é que a mediana pode dar uma ideia melhor de um valor típico 
porque não é tão distorcida por valores extremamente altos ou baixos. Em estudos estatísticos sobre renda 
familiar ou outros ativos voláteis, a média pode ser distorcida por um pequeno número de valores 
extremamente altos ou baixos. 
 
Moda 
 
A moda (Mo), é o valor mais frequente da distribuição, ou ainda o valor que mais observações apresentam 
no conjunto dados. 
 
Ela pode ser determinada para dados quantitativos e qualitativos. 
 
Para variáveis quantitativas discretas ou qualitativas é simplesmente a variável mais frequente (ou mais 
observada), isto é o valor Xi da frequência absoluta mais elevada. 
Para variáveis quantitativas agrupadas (contínuos) em classes é necessário: 
1- Determinar a Fi mais elevada; 
2- Achar a classe correspondente a este Fi mais alto, e aplicar a seguinte fórmula: 
 
)(
)1()1(
)1(
)( Mo
MoiMoi
Moi
Moi a
FF
F
lMo 




 
 
Onde: 
 li (Mo): limite inferior da classe modal 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
29 
 Fi(Mo-1): frequência absoluta da classe anterior à classe da moda; 
 Fi(Mo+1): frequência absoluta da classe da moda 
 a(Mo): amplitude da classe da moda 
 
A expressão para frequências relativas é semelhante: 
 
)(
)1()1(
)1(
)( Mo
MoiMoi
Moi
Moi a
ff
f
lMo 




 
 
Onde: 
 
 Fi(Mo-1): frequência relativa da classe anterior à classe da moda 
 Fi(Mo+1): frequência relativa da classe da moda 
 a(Mo): amplitude da classe da moda 
 
Graficamente, utilizando-se um conjunto de dados hipotéticos, identifica-se a classe modal como aquela que 
apresenta o retângulo de maior altura (frequência). A intersecção das retas que unem os pontos AD e os 
pontos BC, determina o ponto P que, projetado perpendicularmente no eixo da variável, corresponderá ao 
valor da moda Mo. 
 
 
Vantagens: 
Fácil de calcular e interpretar e não é afectada por valores extremos; 
 
Desvantagem 
Não pode ser definida com rigor e o seu valor exacto ser muitas das vezes incerto 
 
 
2.3.1.2 Medidas de Tendência não Central 
 
Quartis 
 
Os quartis são os valores da variável observada que dividem a distribuição de frequências em 4 partes 
iguais. 
Q1 – Primeiro Quartil – é o valor da variável observada tal que o nº de observações para valores inferiores 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
30 
i 
a Q1 será de 25% e o nº de observações para valores superiores a Q1 será de 75%; 
Q2 – Segundo Quartil – é o valor da variável tal que metade das observações encontram-se à sua esquerda 
e a outra metade à sua direita, logo, coincide com a mediana; 
Q3 – Terceiro Quartil – é o valor da variável observada tal que o nº de observações para valores inferiores 
a Q3 será de 75% (3/4) e o nº de observações para valores superiores a Q3 será de 25% (1/4). 
 
Descrição dos quartis (dados amostrais) 
Estatística Notação Interpretação 
 1º quartil Q1 25% dos dados são valores menores ou iguais ao valor do primeiro 
quartil. 
2º quartil Q2 =Md 50% dos dados são valores menores ou iguais ao valor do segundo 
quartil. 
3º quartil Q3 75% dos dados são valores menores ou iguais ao valor do terceiro 
quartil. 
 
 
 
Dados discretos 
 
1- Primeiramente temos que calcular N %Qi 
2- Achar a frequência acumulada absoluta que contém este valor calculado em 1; 
3- O quartil será o valor Xi correspondente a esta frequência acumulada. 
 
Dados contínuos 
 
1- Primeiramente temos que calcular: % N x Qi 
2- Achar a frequência acumulada absoluta que contém este valor calculado em 1; 
3- Achar classe do quartil, correspondente a esta frequência acumulada, então aplica-se a 
fórmula: 
)(
)(
)1(
)(
%
i
i
i
i Q
Qi
Qi
Qi a
F
CumFQN
liQ 



 
 
Onde: 
 li (Qi): limite inferior da classe do quartil 
 Fi(Qi-1): frequência absoluta da classe anterior à classe do quartil; 
 Fi(Qi+1): frequência absoluta da classe do quartil 
 a(Qi): amplitude da classe do quartil 
 
A expressão para frequências relativas é semelhante: 
 
)(
)(
)1(
)(
%
i
i
i
Q
Qi
Qi
Qi a
f
CumfQ
liQ 



 
Onde: 
 
 Fi(Qi-1): frequência relativa da classe anterior à classe do quartil 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
31 
 Fi(Qi+1): frequência relativa da classe do quartil 
 a(Qi): amplitude da classe do quartil 
 
 
Decis 
 
Os decis são os valores da variável que dividem a distribuição em 10 partes iguais. O número de decis é 9 
(do D1 até o D9). 
 
Dados discretos 
 
Uti1iza-se os mesmos passos do quartil e representa-secom a letra D. 
 
Dados Contínuos 
 
Uti1iza-se os mesmos passos do quartil, diferenciando a penas as letras, representa-se com a letra D para o decil: 
 
)(
)(
)1(
)(
%
i
i
i
D
Di
Di
Qi a
F
CumFDN
liD 



 
 
Onde: 
 li (Di): limite inferior da classe do decil 
 Fi(Di-1): frequência absoluta da classe anterior à classe do decil 
 Fi(Di+1): frequência absoluta da classe do decil 
 a(Di): amplitude da classe do decil 
 
A expressão para frequências relativas é semelhante: 
 
)(
)(
)1(
)(
%
i
i
i
i D
Di
Di
Di a
f
CumfD
liD 



 
 Fi(Di-1): frequência relativa da classe anterior à classe do decil 
 Fi(Di+1): frequência relativa da classe do decil 
 a(Di): amplitude da classe do decil 
 
 
 
Percentis 
Os percentis dividem a distribuição em 100 partes iguais. O número de percentis é 99 (do P1 ao P99). 
 
Dados discretos 
 
Uti1iza-se os mesmos passos do quartil e representa-se com a letra P para o percentil. 
 
Dados Contínuos 
 
Uti1iza-se os mesmos passos do quartil, diferenciando a penas as letras, representa-se com a letra P: 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
32 
 
)(
)(
)1(
)(
%
i
i
i
i P
Pi
Pi
Pi a
F
CumFPN
liP 



 
Onde: 
 li (Pi): limite inferior da classe do percentil 
 Fi(Pi-1): frequência absoluta da classe anterior à classe do percentil 
 Fi(Pi+1): frequência absoluta da classe do percentil 
 a(Pi): amplitude da classe do percentil 
 
A expressão para frequências relativas é semelhante: 
 
)(
)(
)1(
)(
%
i
i
i
i P
Pi
Pi
Pi a
f
CumfP
liP 



 
 Fi(Pi-1): frequência relativa da classe anterior à classe do percentil 
 Fi(Pi+1): frequência relativa da classe do percentil 
 a(Pi): amplitude da classe do percentil 
 
 
2.3.2- Medidas de dispersão e concentração 
 
As medidas de dispersão têm por finalidade verificar a representatividade das medidas de localização. 
 
 
2.3.2.1 Medidas de Dispersão Absoluta 
Medidas de distância 
São aqueles cujos valores estão representados nas mesmas unidades que os dados e onde não é 
necessário o cálculo de uma medida de localização. 
 
Exemplo: 
 
Intervalo de Variação, é a medida de dispersão mais simples de calcular. É a diferença entre os 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
33 
valores máximo e mínimo. A sua utilização tem como principal desvantagem o facto de ter em conta 
apenas 2 extremos que a variável toma, e portanto, não ser sensível a valores intermédios. 
minVVR máx  
 
 
Intervalo Inter-quartis, é a diferença entre o 3º e o 1º quartil e corresponde a um intervalo de 50% 
das observações centrais. Tem a desvantagem de não ser influenciada por metade dos valores 
observados e que são extremos. 
13 QQIQ  
 
Medidas de dispersão propriamente ditas 
 
Esta utiliza uma medida de localização como termo de comparação. 
 
Exemplo: 
 
Desvio Médio Absoluto, é uma media de dispersão não negativa e quanto maior o seu valor maior a dispersão 
da variável. 
 
Para dados não tabelados: 
 
N
X
DM
i 


 
 
Para dados discretos: 
 
 ii XfDM 
 
Para dados contínuos: 
 
   ii CfDM 
 
Variância, é a soma dos quadrados das diferenças entre os valores da variável e a média, dividida pelo 
número de observações. Tem a desvantagem de se traduzir no quadrado das unidades em que está definida a 
variável X. 
 
 
Para dados não tabelados: 
 
N
X
n
i
i


 1
2
2
)( 

 n
XX
S
n
i
i


 1
2
2
)(
 
Para dados discretos: 
2
1
2 )(  

i
n
i
i Xf
 
22
1
2  

i
n
i
i Xf
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
34 
Para dados contínuos: 
22
1
2  

i
n
i
iCf
 
22
1
2 XCfS i
n
i
i 

 
 
Desvio Padrão, é a raiz quadrada positiva da variância. 
 
2  
2SS  
 
2.3.2.2 Medidas de dispersão relativa 
 
coeficiente de variação 
 
O Coeficiente de variação (Cv), é uma média relativa de dispersão, útil para a compreensão em termos 
relativos do grau de concentração em torno da média, de distribuição de frequências distintas. É dado pela 
relação em termos percentuais entre o desvio padrão e a média da distribuição. 
 
100








Cv
 
 
100






X
s
Cv 
 
2.3.3- Medidas de assimetria e Curtose 
 
2.3.3.1 Medidas de assimetria 
 
A medida de assimetria é um indicador da forma da distribuição dos dados. Ao construir uma distribuição de 
frequências e/ou um histograma, está-se buscando, também, identificar visualmente, a forma da distribuição 
dos dados que é ou não confirmada pelo coeficiente de assimetria de Pearson. 
 
A distribuição pode ser simétrica e assimétrica. 
 
Considera-se que a distribuição é simétrica se: 
MoMe  
 
A distribuição é assimétrica positiva se: 
MoMe 
 
É assimétrica negativa se: 
MoMe 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
35 
 
O grau de assimétrica pode ser medido pela fórmula seguinte: 

 )(3 Me
G


 S
MeX
G
)(3 

 
 
Existem outros indicadores quantitativos que permitem estimar, com maior precisão, o grau de uma 
distribuição. 
O coeficiente de Pearson: 

 Mo
G

1
 IQ
MeQQ
G
213
2


 
Se G = 0, a distribuição é simétrica; 
Se G > 0, a distribuição é assimétrica positiva; 
 Se G < 0, a distribuição é assimétrica negativa. 
 
 
 
 
2.3.3.2 Medidas de Achatamento ou de Curtose 
 
Curtose é o grau de achatamento de uma distribuição. A curtose ou achatamento é mais uma medida com a 
finalidade de complementar a caracterização da dispersão em uma distribuição. Esta medida quantifica a 
concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central 
em uma distribuição de frequências. O achatamento pode ser: leptocúrtica, mesocúrtica e platicúrtica. 
 
 
 10902 PP
IQ
K


 
 
Se K = 0,263; a distribuição é mesocúrtica; 
Se K < 0,263; a distribuição é leptocúrtica; 
Se K > 0,263; a distribuição é platicúrtica. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
36 
2.3.4- Medidas de Concentração e Desigualdade 
 
2.3.4.1 Curva de Lorenz 
 
 
A curva de Lorenz é um gráfico que é muitas das vezes usado para representar a distribuição relativa de uma variável 
num domínio determinado. O domínio geralmente pode ser pessoas de uma região ou país, por exemplo. A variável 
em estudo pode ser o rendimento das pessoas. A curva é traçada considerando-se a percentagem acumulada de pessoas 
no eixo das abcissas e a percentagem acumulada do rendimento no eixo das ordenadas. 
 
Cada ponto da curva é lido como percentagem acumulativa das pessoas. A curva parte da origem (0,0) e termina no 
ponto (1,1). Portanto, quanto mais próxima da diagonal estiver a curva de Lorenz, mais equitativa é a distribuição e 
quanto mais afastada estiver, mais desigual é a distribuição. 
 
Dado uma característica(Yi) e as suas frequências (Fi), para cada intervalo ou classe i, calcula-se a curva de lorenz 
unindo, um referencial cartesiano, as frequências acumuladas para cada classe relativamente ao total. 
 
𝑐𝑢𝑚 𝑓𝑖 =
𝐶𝑢𝑚𝐹𝑖
∑ 𝐹𝑖
𝑛
𝑖=1
 
 
𝑐𝑢𝑚 𝑦𝑖 =
𝐶𝑢𝑚𝑌𝑖
∑ 𝑌𝑖
𝑛
𝑖=1
 
 
 
 
 
2.3.4.2 Índice de Gini 
 
O Índice de Gini é uma medida de desigualdade é geralmente utilizada para calcular a desigualdade de distribuição de 
renda mas pode ser usada para qualquer distribuição. Ele consiste em um número entre 0 e 1, onde 0 corresponde à 
completa igualdade de renda (onde todos têm a mesma renda) e 1 corresponde à completa desigualdade (onde uma 
pessoa tem toda a renda, e as demais nada têm). 
 
Quanto maior a concentração, mais a curva de Lorenz se afastara da reta de igual distribuição. 
 𝑝𝑖 =
𝐶𝑢𝑚𝐹𝑖
∑ 𝐹𝑖
𝑛
𝑖=1
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
37 
𝑞𝑖 =
𝐶𝑢𝑚𝑌𝑖
∑ 𝑌𝑖
𝑛
𝑖=1
 
Quanto maior for a diferençaentre pi e qi, mais acentuada será a concentração. É nesta verificação que Gini propôs o 
índice para medir o grau de concentração: 
 
𝐼𝐺 =
∑ (𝑝𝑖 − 𝑞𝑖)𝑛−1𝑖=1
∑ 𝑝𝑖𝑛−1𝑖=1
= 1 −
∑ 𝑞𝑖𝑛−1𝑖=1
∑ 𝑝𝑖𝑛−1𝑖=1
 
 
Sendo n o numero de classes, o IG varia entre 0 e 1, quando igual a zero, temos igual distribuição, quanto mais próximo 
estiver de 1 maior é a desigualdade. 
 
 
2.4- Associação entre duas variáveis 
 
Estudar a associação entre variáveis permitirá, numa fase posterior, elaborar previsões, é o facto de se poder 
estabelecer uma relação do tipo causa-efeito entre as variáveis. Isto é, só é viável fazer previsões com base 
em relações estatísticas entre variáveis se a variação de uma delas puder ser atribuída à variação da outra. 
 
Um diagrama de dispersão consiste num gráfico constituído por pontos discretos onde cada ponto, Pi, 
representa um par de valores observados, (xi, yi). xi representa o valor da variável independente observada 
para o indivíduo Pi e yi representa o valor da variável dependente observada para esse mesmo indivíduo. 
 
O diagrama de dispersão tem uma função dupla: por um lado ajuda a destrinçar se existe alguma associação 
entre as variáveis, por outro permite identificar qual o modelo matemático (equação) mais apropriado para 
descrever essa associação. 
 
Nos gráficos da Figura seguinte apresentam-se vários exemplos de diagramas de dispersão e as conclusões 
que deles se podem tirar acerca da relação entre as variáveis. 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
38 
 
 
No caso de existir uma relação entre as variáveis esta pode ser de vários tipos: linear (casos (a) e (b) da 
figura), polinomial (caso (c) da figura – polinómio do 2º grau), exponencial, logarítmica, etc. 
 
A relação mais simples é do tipo linear, sendo possível linearizar algumas das relações não lineares 
exemplificadas no parágrafo anterior. 
 
2.4.1 Regressão linear simples 
 
Uma relação do tipo linear entre as variáveis pode ser descrita matematicamente pela equação: 
Y  a  bX  e 
 
Esta equação constitui o modelo de regressão linear simples sendo: 
Y: variável explicada ou dependente 
X: variável explicativa ou independente 
e: variável residual que inclui outros factores explicativos de y não incluídos em x ou erros de medição 
a e b: parâmetros da regressão. a é a intersecção da recta com o eixo vertical e b é o seu declive. 
 
A equação anterior representa pois uma recta que, quando ajustada aos dados do diagrama de dispersão, 
se chama recta de regressão ou recta ajustada. 
 
Ao ajustar uma recta de regressão aos dados observados anulamos os efeitos da variável residual. A recta 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
39 
ajustada terá então a forma: 
Ya  a  bX 
 
 
2.4.2 A Função de Regressão Populacional (FRP) 
 
Diremos que geometricamente, a curva de uma função de regressão é o espaço geométrico onde as médias ou 
expectativas condicionais das variáveis dependentes para os valores fixados da variável explicativa; 
)()( ii XfXYE  Equação 1 
 Onde X é uma função explicativa e Y a variável explicada, linear em X. Chamaremos assim a equação 1 como 
função de população de regressão (FPR) de duas variáveis. Assim, assumindo que X pode tomar valores nulos, 
podemos transcrever a FPR em 
ii bXaXYE )( Equação 2 
Onde os parâmetros a e b são desconhecidos, todavia fixos e chama-se coeficientes de regressão. 
Também são conhecidos como intercepto e coeficiente de inclinação, respectivamente. 
O objectivo presente consiste em estimar os parâmetros desconhecidos da FRP descrita na equação Nº 2. 
 
2.4.3 Propriedades 
 
a) A LINEARIDADE 
Assumimos que a nossa FRP é linear, o que significa que a expectativa condicional de Y em relação a X é 
consequência de uma função linear, podendo esta ser representada geometricamente por um gráfico. 
Semelhantemente, a FRP é linear nos parâmetros. 
 
 
b) A ESPECIFICAÇÃO ESTOCÁSTICA 
 
Consideremos que dada a variável Y e a sua estimativa condicional em relação a Y, ocorrerá sempre um 
desvio a que chamaremos o erro termo, a perturbação estocástica ou ainda o white noise: 
iii eXYEY  )( Equação 3 
Alternativamente, podermos escrever da seguinte maneira iii eXYEY  )( e consequentemente 
iii ebXaY  
Assim sendo o primeiro elemento do lado esquerdo será o elemento sistemático ou determinístico, e o 
segundo termo, corresponde ao componente assistemática ou aleatória, cuja propriedade facilmente podemos 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
40 
obter quando aplicamos expectativas em ambos os lados da equação condicional a X: 
  )()()( iiii XeEXYEEXYE  Equação 4 
)()()( iiii XeEXYEXYE  
note que para que a igualdade vigore, é necessário que )( ii XeE seja igual a zero 
0)( ii XeE Equação 5 
 
Neste contexto, considerando que ao extrapolar o caso para a vida prática, encontraremos variáveis 
sendo explicadas por outras, o termo erro i representará sempre aqueles factores não considerados na 
explicação da variável dependente. Isso pode ser o caso de variáveis omissas. 
 
c) A PERTURBAÇÃO ESTOCÁSTICA E A FUNÇÃO DE REGRESSÃO AMOSTRAL 
 
Para além do aspecto da omissão de variáveis destacado no ponto anterior, existem outros factores que 
justificam a razão de existência da perturbação estocástica no nosso modelo, apontando-se: 
1. Inexactidão da teoria 
2. Escassez de dados 
3. Forma funcional errada 
4. Casualidade intrínseca ao comportamento humano 
5. Variáveis essenciais versus variáveis periféricas 
 
Considerando a aleatoriedade do erro, a representações de uma função de regressão populacional para varias 
amostragens, da origem a chamada função de regressão amostral (FRA), tal que a amostra da equação 2 
pode ser representada por: 
ibXaaY 
ˆ Equação 6 
Assim sendo, podemos representar a FRP de duas formas, demonstradas pelas equações 2 e a extensão da 
equação 3, teremos: 
iii eXbaY ˆ
ˆˆ  Equação 7 
 
 
2.4.4 Mínimos Quadrados Ordinários – (OLS- Ordinary Least Squases) 
 
Conforme referido anteriormente, constitui objecto principal testar a FRP tendo como referência a FRA. Dos 
enumeras métodos existentes, vamos aqui considerar o método dos quadrados mínimos MQO também 
denominado por Ordinary Least Squares –OLS desenvolvido pelo matemático Alemão Car Friederich Gauss. 
O método em causa baseia-se no princípio dos mínimos quadrados. 
Sabe-se que a FRP 
iii ebXaY  não é directamente observável, o que nós conhecemos é sim 
iia eXbaY ˆ
ˆˆˆ  conforme as equações 6 e 7 o elemento erro ou resíduo é dado pela diferença do Y 
observado e Ya estimado. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
41 
aii YYe
ˆ Equação 8 
 
 O interesse consistirá neste caso em determinar a FRA mais próxima do Y observado, o que em outras 
palavras pressupõe dizer que quanto menor for resíduo quadrado melhor será.    aii YYe ˆˆ . Note que 
o critério MQO consiste em minimizar a soma do erro. Porém, veja na figura, a soma do erro 4321 ˆ,ˆ,ˆ,ˆ eeee é 
nula, dada a sua assimetria. Entretanto, nós estamos mais interessados é no quadrado da soma, pois fazendo 
assim tornamos os valores negativos em positivos e o interesse consistirá em encontrar o menor valor possível 
o que em outras palavras significa obter resíduos mais próximos da FRA. 
 
Demonstração do critério dos mínimos quadrados. 
 
Uma vez que os valores observados são dados por Y e os valores ajustados são dados por Ya . O que se 
pretende através do método dos mínimos quadrados é minimizar o somatório dos quadrados das diferenças, 
isto é, minimizar o somatório do quadrado dos resíduos. 
 
 2
,
min i
ba
e
 
 
Pretendendo determinar-se a e b de tal modo que: 
 
Para o último somatório, ou para qualquer outro polinómio quadrático, os pontos mínimos encontram-se 
quando asprimeiras derivadas forem nulas e as segundas derivadas forem positivas (concavidade voltada 
para cima). Assim, a função de minimização estabelecida, pode ser resolvida através dos sistemas, que 
conduzem às seguintes expressões para b (declive da recta ajustada) e para a (ordenada na origem da recta 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
42 
ajustada): 
  
  



22
ii
iiii
XnX
YXXYn
b
  
 



ii
iii
XXX
XYYX
b
2
 
 



22 XnX
XYnYX
b
i
ii
 
 
 
XbYa  
 
Assumindo dados centrados então podemos, podemos calcular b pela seguinte fórmula: 



2
i
ii
x
yx
b
 
Onde: 
 xi é valor centrado, calculado da seguinte forma: 𝑥𝑖 = 𝑋𝑖 − �̅� 
 
yi é valor centrado, calculado da seguinte forma: 𝑦𝑖 = 𝑌𝑖 − �̅� 
 
sendo que o ∑ 𝑥𝑖 = 0
𝑛
𝑖=1 e∑ 𝑦𝑖 = 0
𝑛
𝑖=1 
 
�̅� =
∑ 𝑋𝑖
𝑛
𝑖=1
𝑁
 
 
�̅� =
∑ 𝑌𝑖
𝑛
𝑖=1
𝑁
 
 
 
 
 
 
2.4.4.1 Hipóteses do Mínimos Quadrados Ordinários 
 
Veremos agora as hipóteses básicas do Modelo Clássico de Regressão Linear (MCRL), que de uma forma mais 
avançada, infere as hipóteses enunciadas por Gauss Markov. 
 
 Hipótese 1 - Modelo de Regressão Linear - O modelo é linear nos parâmetros conforme mostrado em; 
iii ebXaY  
 
 Hipótese 2 - Os valores de X são fixados em amostras iterativas – Os valores assumidos pelo regressor X 
são considerados fixados em repetidas amostras. A variável é um dado não estocástico. 
 
 Hipótese 3 - O valor médio do resíduo ei é nulo – Dado o valor X, o valor esperado da perturbação 
residual é zero. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
43 
  0ii XeE 
 
 Hipótese 4 -Homoskedasticidade ou variância igual ei - Dado o valor da variável independente, a variância 
de é invariante ao tempo 
    
  22
2
var


ii
iiiii
XeE
XeEeEXe
 
 
 Hipótese 5 -Não existe auto-correlação entre as perturbações e, entre a perturbação ei e a variável 
independente X - Dados dois valores ei e ej tal que (i≠j) a corelação entre quaisquer resíduos de diferentes 
períodos é zero. 
 
       
  
0
,,cov



jjii
jjjiiijiji
XeXeE
XeEeXeEeEXXee
 
 
 
 
2.4.5 Análise do grau de associação entre variáveis 
 
Quando se procede ao ajuste de uma determinada recta de regressão aos dados observados, podemos ainda 
tirar conclusões acerca da qualidade do ajuste através do cálculo de outro coeficiente: o coeficiente de 
determinação. 
 
2.4.5.1 Coeficiente de determinação 
 
O coeficiente de determinação, notado por R2, mede a qualidade do ajuste entre a recta e os dados e o seu 
valor é um número real compreendido entre 0 e 1. Se R2 for 1 a qualidade do ajuste é perfeita (positiva ou 
negativa), não existindo relação linear se R2 =0. 
 
O coeficiente de determinação representa ainda a proporção (ou percentagem) da variação da variável 
dependente (y) que é explicada pelas variações da variável independente (x), sendo o seu valor obtido através 
da seguinte expressão: 



2
2
i
ii
y
yxb
R
 
 
2.4.5.2 Coeficiente de correlação linear 
 
Uma maneira de se analisar a possibilidade de existência de uma associação linear entre um par de variáveis 
é através do cálculo do coeficiente de correlação linear. O coeficiente de correlação linear, (R) , é um valor 
real compreendido entre -1 e 1. 
 
 
2RR  
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
44 
2.4.5.3 Coeficiente de correlação linear de Person 
 
Este coeficiente, mede o grau da correlação (e a direcção dessa correlação - se positiva ou negativa) entre 
duas variáveis de escala métrica (intervalar ou de rácio/razão). 
 
        
 



2222
iiii
iiii
YYnXXn
YXYXn
R
 
 
2.4.5.4 Coeficiente de correlação linear de Sperman 
 
Em estatística, o coeficiente de correlação de postos de Spearman ou rô de Spearman, que recebe este nome 
em homenagem ao psicólogo e estatístico Charles Spearman, é uma medida não paramétrica de correlação 
de postos (dependência estatística entre a classificação de duas variáveis). O coeficiente avalia com que 
intensidade a relação entre duas variáveis pode ser descrita pelo uso de uma função monótona. Se não houver 
valores de dados repetidos, uma correlação de Spearman perfeita de +1 ou -1 ocorre quando cada uma das 
variáveis é uma função monótona perfeita da outra. 
)1(
6
1
2
2



nn
D
r
i
s
 
 
YXD  
Interpretação do coeficiente de correlação: 
 
 Se R =1: correlação linear perfeita positiva; 
 Se 0,7≤ R<1: correlação linear forte positiva; 
 Se 0,3≤R<0,7: correlação linear moderada positiva; 
 Se 0<R≤0,3: correlação linear fraca positiva; 
 Se R=0: não existe correlação linear (podendo ou não existir outro tipo de relação); 
 Se R= -1: correlação linear perfeita negativa; 
 Se -1< R≤-0,7: correlação linear forte negativa; 
 Se -0,7<R ≤-0,3: correlação linear moderada negativa; 
 Se -0,3<R<0: correlação linear fraca negativa. 
 
2.4.5.5 Covariância 
 
A covariância é também uma medida do grau de associação linear entre duas variáveis. A covariância, é uma 
medida do grau de interdependência (ou inter-relação) numérica entre duas variáveis aleatórias. Assim, 
variáveis independentes têm covariância zero. 
 
E pode ser assim calculada: 
 
https://pt.wikipedia.org/wiki/Escala_(estat%C3%ADstica)
https://pt.wikipedia.org/wiki/Estat%C3%ADstica
https://pt.wikipedia.org/wiki/Charles_Spearman
https://pt.wikipedia.org/wiki/Estat%C3%ADstica_n%C3%A3o_param%C3%A9trica
https://pt.wikipedia.org/wiki/Ranking
https://pt.wikipedia.org/wiki/Vari%C3%A1vel_(matem%C3%A1tica)
https://pt.wikipedia.org/wiki/Fun%C3%A7%C3%A3o_mon%C3%B3tona
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
45 
 
n
yx
Cov
ii
yx

,
 
 
A covariância é semelhante à correlação, mas quando a covariância é calculada, os dados não são 
padronizados. Portanto, a covariância é expressa em unidades que variam de acordo com os dados e não é 
convertida para uma escala normalizada de -1 a +1. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3. Teoria da Probabilidade 
 
SUMÁRIO: 
3.1 Conceitos da teoria das probabilidades 
3.2 Álgebra dos acontecimentos (operações e probabilidades) 
3.3 Conceitos de probabilidades 
3.4 Axiomas da teoria das probabilidades 
3.5 Probabilidades Condicionadas 
3.6 Acontecimentos independentes 
3.7 Teorema da probabilidade total Teorema de BAYES 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
46 
3.1 Conceito da teoria das Probabilidades 
A teoria das probabilidades ocupa-se do estudo de experiências aleatórias, ou seja, de experiências 
influenciadas pelo acaso. 
 
Uma experiência aleatória é uma experiência sobre a qual não se pode dizer qual vai ser o resultado, antes 
de a realizarmos. Por oposição, temos o conceito de experiência determinística, que é aquela cujo resultado 
é possível prever, com absoluta certeza. 
 
Por exemplo é possível prever que se atirarmos uma pedra ao ar, ela cai (experiência determinística), mas já 
não é possível prever qual vai ser o resultado de um lançamento de um dado (experiência aleatória). 
 
Espaço de resultados 
 
Consideremos a seguinte experiência aleatória: lançamento de um dado. 
 
Os resultados possíveis desta experiência são: saída de face 1, saída de face 2, saída de face 3, saída de face 
4, saída de face 5, saída de face 6. 
 
É, assim, natural associar a esta experiência o conjunto {1, 2, 3, 4, 5, 6}. 
 
A este conjunto chama-se espaço de resultados associado à experiência lançamento de um dado. 
 
Espaço de resultados conjunto de todos os resultados possíveis associados a uma experiência aleatória. 
 
O espaço de resultados associado a uma experiência é normalmente representado pela letra Grega Ω. 
 
Exemplo 1: 
Experiência aleatória: lançamento de uma moeda duas vezes consecutivas.Espaço de resultados: H = {(C, 
C), (C, F), (F, C), (F, F)} 
(C representa saída de coroa; F representa saída de face). 
 
3.2- Acontecimentos 
A um subconjunto do espaço de resultados dá-se o nome de acontecimento. 
Consideremos, uma vez mais, a experiência lançamento de um dado. 
Espaço de resultados: Ω = {1, 2, 3, 4, 5, 6}. 
São exemplos de acontecimentos: 
A = {2, 4, 6} (saída de face par); 
 
B = {5, 6} (saída de face superior a quatro); 
C = {1} (saída de face um). 
 
 
O acontecimento C diz-se elementar, pois a sua realização depende apenas da ocorrência de um único 
resultado do espaço de resultados. 
 
A um acontecimento impossível associa-se o conjunto vazio. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
47 
 
O espaço de resultados Ω também é, naturalmente, um acontecimento: diz-se acontecimento certo. 
 
3.2.1- Álgebra dos Acontecimentos 
Ao conjunto de todos os acontecimentos que se podem associar a uma experiência aleatória damos o nome 
de espaço de acontecimentos. 
 
Consideremos, por exemplo, a experiência aleatória lançamento de um rapa. Espaço de resultados: Ω = {R, 
T, D, P} (Rapa, Tira, Deixa, Põe) 
 
Espaço de acontecimentos ou álgebra de acontecimentos: 
{ , {R}, {T}, {D}, {P}, {R,T}, {R,D}, {R,P}, {T,D}, {T,P}, {D,P}, {R,T,D}, {R,T,P}, {R,D,P}, 
{T,D,P}, {R, T, D, P} } 
 
O conjunto de todos os subconjuntos de Ω representa-se por P(Ω ) (conjunto das partes de Ω). Se Ω tiver 8 
elementos, então P(Ω ) tem 2n elementos. 
 
No exemplo do rapa, Ω tem 4 elementos, e P(Ω ) tem 24 =16 elementos 
 
Diz-se que A  Ω se realizou se o resultado,  , da experiência é um elemento de A, isto é,  
A. 
 
A  B, diz-se A sub acontecimento de B, se e só se a realização de A implica a realização de B; 
Ac ou A diz-se acontecimento complementar ou contrário a A, é ao conjunto de todos os elementos de que 
não estão em A; 
 
A  B, diz-se união de A com B, é o acontecimento que consiste na realização de pelo menos um deles; 
 
AB ou A ∩ B, diz-se produto ou intersecção, é o acontecimento que se realiza apenas quando ambos os 
acontecimentos se realizam; 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
48 
Os acontecimentos A e B dizem-se mutuamente exclusivos ou incompatíveis se e só se a realização de um 
implica a não realização do outro, i.e., se e só se AB = 0; 
 
A − B = A ∩ Bc diz-se diferença dos acontecimentos A e B é o acontecimento que se realiza se e só se A se 
realiza e B não se realiza; 
 
 
 diz-se acontecimento impossível; 
Ω diz-se acontecimento certo. 
 
 
 
 
 
3.3 - Conceitos de Probabilidade 
A probabilidade é uma medida do grau de incerteza de um dado acontecimento aleatório, donde o estudo da 
teoria das probabilidades estar na base da inferência estatística. 
 
3.1.1 - Definição clássica de probabilidade 
Se a uma experiência aleatória pode-se classificar à priori todos os resultados os possíveis num número finito 
n de casos mutuamente exclusivos e igualmente prováveis, então o cálculo da probabilidade de um 
acontecimento A ocorrer resume-se à contagem do número de resultados possíveis N e do número de 
resultados favoráveis a A, nA resultados. 
N
n
P A[A]
 
Onde: 
nA é o número de casos favoráveis a A 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
49 
N é o número de casos possíveis 
 
Exemplo: 
Num lançamento de um dado equilibrado qual a probabilidade de sair um número ímpar? 
 
Limitações desta definição: 
 
Só pode ser aplicada se o número de resultados possíveis da experiência aleatória for finito. Só pode ser 
aplicada se os resultados forem igualmente prováveis. 
 
Não permite dar resposta a questões do tipo: 
 
 Qual a probabilidade de um homem morrer antes dos 50 anos? 
 Qual a probabilidade de um jornal vender num dia 500 unidades? 
 Qual a probabilidade de sair uma face no lançamento de uma moeda não equilibrada? 
 Qual a probabilidade de uma pessoa seleccionada ao acaso ser benfiquista? 
 
 
3.3.2- Definição frequencista de probabilidade 
Uma determinada experiência aleatória é repetida n vezes em idênticas condições, tendo o acontecimento A 
se realizado nA vezes. Seja 𝑓𝐴 =
𝑛𝐴
𝑁
 sua frequência relativa. 
De acordo com a definição frequencista de probabilidade, a probabilidade do acontecimento A ocorrer é o 
valor para que tende fA quando se aumenta o número de provas n. 
Exemplo: 
1- Uma seguradora não pode afirmar quem são as pessoas que terão acidentes com idades 
compreendidas entre os 18 e os 30 anos, mas pelo número de observações do passado nA, e em função 
do número de segurados n, pode prever a probabilidade de ocorrência de acidentes naquela faixa 
etária. 
2- O gestor de vendas de um concessionário de uma marca de automóveis precisa saber qual a 
probabilidade do stand vender mais de 4 automóveis na próxima semana. Através dos registos da 
empresa foi possível saber que somente em 6 semanas das últimas 50 semanas, o número de 
automóveis vendidos foi superior a 4 automóveis. Logo a probabilidade será de 6/50. 
 
Esta é uma definição à posteriori. 
 
3.3.3- Definição subjectiva de probabilidade 
 
A probabilidade subjectiva é dada pelo grau de credibilidade ou de confiança que cada pessoa dá à realização 
de um dado acontecimento aleatório. Daí que seja subjectiva porque para o mesmo acontecimento diferentes 
pessoas podem dar diferentes probabilidades. 
 
Exemplos: 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 
50 
1- O Miguel acha que a probabilidade do Benfica ganhar o campeonato é superior a 0,6; já o António 
acha que essa probabilidade é inferior a 0,5; 
 
2- Um comentador desportivo atribuir uma probabilidade de vitória a determinado clube antes da 
ocorrência do jogo; 
 
3- Previsão da adesão a uma greve. 
 
Nota: A definição subjectiva não faz parte da Estatística. 
 
3.4- Axiomas da teoria das probabilidades 
 
Consideremos que P(.) é uma função que associa a todo o acontecimento A definido em Ω um 
número compreendido no intervalo [0,1] e satisfaz os seguintes axiomas: 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 51 
3.5- Teoremas da probabilidade 
Teorema 1: 
 
Dado um acontecimento A com probabilidade 𝑃[𝐴], a probabilidade do seu complementar 
obtém-se subtraindo à unidade a probabilidade de A, isto é 𝑃[�̅�] = 1 − 𝑃[𝐴]. 
 
Teorema 2: 
A probabilidade do acontecimento impossível é zero, isto é P  0 . 
 
Teorema 3: 
 
Dados dois acontecimentos A e B, a probabilidade do acontecimento da diferença B – A 
obtém-se pela diferença entre a probabilidade de B e a probabilidade da intersecção de A com 
B, isto é 
P[B  A]  P[B]  PA  B. 
Teorema 4: 
 
A probabilidade da união de dois acontecimentos quaisquer, A e B, obtém-se somando as suas 
probabilidades e subtraindo a probabilidade da intersecção de A com
 B, isto é 
P[A  B]  P[A]  P[B]  PA  B. 
 
Generalização do teorema 4 a mais de dois acontecimentos 
 
Sejam A1, A2,…Na acontecimentos quaisquer definidos por  . Então: 
 
 
Para n = 3 
 
 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 52 
3.6- Probabilidade condicionada 
 
De um modo geral, dados dois acontecimentos A e B, realizar, supondo que B se realiza. 
P[ A | B] designa a probabilidade de A se realizar, supondo que B se realiza. 
 
Esta probabilidade representa a reavaliação da probabilidade de A em face da informação de 
que B se realizou. 
 
O conceito de probabilidade condicionada satisfaz todos os três axiomas de probabilidade. 
Vejamos: 
 
1- 𝑃𝐴(𝐵) ≥ 0 
Tem-se: 𝑃𝐴(𝐵) = 𝑃(𝐵|𝐴) =
𝑃(𝐴⋂𝐵)
𝑃(𝐵)
≥ 0 
2- 𝑃(Ω)=1 
Tem-se: 𝑃(Ω) = 𝑃(Ω|𝐴) =
𝑃(𝐴⋂Ω)
𝑃(𝐴)
=
𝑃(𝐴)
𝑃(𝐴)
= 1 
 
3- Se 𝐵1 ∩ 𝐵2 = ∅ então 𝑃𝐴(𝐵1 ∪ 𝐵2) = 𝑃𝐴(𝐵1) + 𝑃𝐴(𝐵2) 
 
 Tem-se: PA(B1 ∪ B2) = PA(B1 ∪ B2|A) =
P[A∩(B1∪B2)]
P(A)
 
 
=
𝑃[(𝐴 ∩ 𝐵1) ∪ (𝐴 ∩ 𝐵2)]
𝑃(𝐴)
=
𝑃[(𝐴 ∩ 𝐵1) + (𝐴 ∩ 𝐵2)]
𝑃(𝐴)
 
 
=𝑃[(𝐴∩𝐵1]
𝑃(𝐴)
+
𝑃[(𝐴∩𝐵2]
𝑃(𝐴)
= 𝑃𝐴(𝐵1) + 𝑃𝐴(𝐵2) 
 
A axiomática está verificada. PA é de facto uma probabilidade. 
 
A probabilidade de intersecção de dois acontecimentos, A e B, decorrente da probabilidade 
condicionada: 
 
 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 53 
3.7- Acontecimentos independentes 
Dois acontecimentos são independentes quando a realização de um deles não afecta a 
probabilidade da realização do outro. 
 
A e B são portanto independentes se P[B | A]  P[B] 
Portanto, de P[A  B]  PA PB | A vem: Se A e B são independentes, então P[A  B]  
PA PB. 
 
 
 
Nota: Se os acontecimentos A e B são independentes também o são 
 
 
3.7.1- Acontecimentos independentes versus acontecimentos incompatíveis ou mutuamente 
exclusivos 
 
Sejam A e B dois acontecimentos tais que: 
 
P[ A]  0 e P[B]  0 
 
 No caso de acontecimentos serem incompatíveis (mutuamente exclusivos), tem-se, por definição: 
(A  B)   e consequentemente, P[A  B]  0 . 
 
 Os acontecimentos não podem ser independentes pois, para tal, e por definição, seria têm 
probabilidades não nulas. 
 
P[A  B]  P(A)  P(B)  0 , pois ambos os acontecimentos 
 
No caso dos acontecimentos serem independentes não podem ser mutuamente exclusivos, pois se 
são independentes então, P[A  B]  P(A)  P(B) é maior que zero; para serem 
simultaneamente mutuamente exclusivos esta probabilidade teria de ser nula, facto impossível a 
não ser que algum dos acontecimentos tivesse probabilidade nula, o que não é o caso. 
 
Quer dizer, que, dois acontecimentos não podem ser simultaneamente dependente e mutuamente 
exclusivos, porem existe excepções, é o caso em que um dos acontecimentos é impossível, porque 
este é sempre independente e mutuamente exclusivo de todo e qualquer outro acontecimento 
possível. 
 
 
Dois acontecimentos são mutuamente exclusivos se: 
 
P[A  B]  0 e P[ A  B]  1 
. 
Draft Estatistica 1, Outubro 2021 | Albertina Delgado 
 
 54 
3.8- Teorema da Probabilidade Total 
 
Teorema da probabilidade total: 
 
Se os acontecimentos A1, A2, … An definem uma repartição sobre  , então para qualquer 
acontecimento B definido em  tem-se que: 
P[B]   P[B | Ai ] P[ Ai ] 
i1 
 
 
 
3.9- Teorema de BAYES 
 
Em teoria das probabilidades, o teorema de Bayes descreve a probabilidade de um evento, tendo com base 
um conhecimento a priori que pode estar relacionado ao evento. O teorema mostra como alterar as 
probabilidades a priori tendo em vista novas evidências para obter probabilidades a posteriori. 
 
Uma das muitas aplicações do teorema de Bayes é a inferência bayesiana, uma abordagem da inferência 
estatística. Quando aplicado, as probabilidades envolvidas no teorema de Bayes podem ter diferentes 
significados de probabilidade. 
Se A1, A2, … An definem uma repartição sobre  , então para B definido em  , com P[B]  0 : 
 
 
 
n

Mais conteúdos dessa disciplina