Regressão Linear em Matemática

FAVENI

Aldrey Raine

em 27/07/2025

Conteúdos escolhidos para você

16 pág.

AULA-06-MÉTODOS-ESTATÍSTICOS

FAVENI

17 pág.

ESTATÍSTICA - AULA 6

25 pág.

Regressão Linear

UNIFCV

68 pág.

Thomas Nield - Essential Math for Data Science-O'R_241112_150431-200-300 (1)-17-84

43 pág.

estatistica unidade 4

Perguntas dessa disciplina

Em um conjunto de dados a medida de dispersão que calcula a diferença entre o maior e o menor valor denominamos de amplitude. Ela apresenta a dispersã

FACIC

O modelo clássico linear tem algumas hipóteses para que ele produza os melhores resultados, ou os estimadores BLUE. Dentre essas hipóteses, que obs...

UNICIV

Na análise empírica vimos que há três tipos de dados disponíveis, as séries de tempo, os cortes transversais e os dados combinados (ou dados em pai...

UNICIV

Questão 3/10 - Bioestatística Ler em voz altaLeia a passagem de texto:“Há intensa discussão acadêmica sobre quais estratégias analíticas devem ser uti

No contexto da Administração, a tomada de decisão baseada em dados é uma competência essencial. A correlação linear mede o grau de associação entre...

UNICESUMAR EAD

Material

Conteúdos escolhidos para você

16 pág.

AULA-06-MÉTODOS-ESTATÍSTICOS

FAVENI

17 pág.

ESTATÍSTICA - AULA 6

25 pág.

Regressão Linear

UNIFCV

68 pág.

Thomas Nield - Essential Math for Data Science-O'R_241112_150431-200-300 (1)-17-84

43 pág.

estatistica unidade 4

Perguntas dessa disciplina

Em um conjunto de dados a medida de dispersão que calcula a diferença entre o maior e o menor valor denominamos de amplitude. Ela apresenta a dispersã

FACIC

O modelo clássico linear tem algumas hipóteses para que ele produza os melhores resultados, ou os estimadores BLUE. Dentre essas hipóteses, que obs...

UNICIV

Na análise empírica vimos que há três tipos de dados disponíveis, as séries de tempo, os cortes transversais e os dados combinados (ou dados em pai...

UNICIV

Questão 3/10 - Bioestatística Ler em voz altaLeia a passagem de texto:“Há intensa discussão acadêmica sobre quais estratégias analíticas devem ser uti

No contexto da Administração, a tomada de decisão baseada em dados é uma competência essencial. A correlação linear mede o grau de associação entre...

UNICESUMAR EAD

Prévia do material em texto

MATEMÁTICA E 
ESTATÍSTICA 
AULA 8
Abertura 
Regressão 
Linear
Olá,
Nesta aula, abordaremos um método numérico para ajuste de curvas chamado regressão linear. 
BONS ESTUDOS!
Referencial Teórico 
Nesta aula, acompanhe um trecho da obra Métodos Numéricos para a Engenharia, de 
Steven Chapra e Raymond Canale, que aborda a regressão linear.
Ao final, você saberá:
• Definir regressão linear.
• Reconhecer a diferença entre regressão e interpolação.
• Utilizar a regressão linear para ajustar uma reta a um conjunto de dados.
BOA LEITURA!
capítulo 17
RegRessão poR MíniMos 
QuadRados
Quando um erro substancial estiver associado aos dados, a interpolação polinomial é 
inapropriada e pode produzir resultados insatisfatórios quando usada para prever valo
res in termediários. Dados experimentais, em geral, são desse tipo. Por exemplo, a Fi
gura 17.1a mostra sete pontos de dados obtidos experimentalmente exibindo variações
significativas. A inspeção visual dos dados sugere uma possível relação entre y e x. Isto
é, a tendência geral indica que valores mais altos de y estão associados a valores mais
altos de x. Agora, se um polinômio interpolador de grau seis for ajustado a esses dados
(Figura 17.1b), ele irá passar exatamente por todos os pontos. Entretanto, devido à va
riabilidade dos dados, a curva vai oscilar muito no intervalo entre os pontos. Em parti
cular, os valores interpolados em x = 1,5 e x = 6,5 parecem estar bem além do intervalo
sugerido pelos dados. 
Uma estratégia mais adequada para tais casos seria determinar uma função aproxi
madora que ajustasse a forma ou tendência geral dos dados sem necessariamente passar 
pelos pontos individuais. A Figura 17.1c ilustra como uma reta pode ser usada para ca
racterizar a tendência geral dos dados sem passar por nenhum dos pontos particulares. 
Uma forma de determinar a reta na Figura 17.1c é inspecionar visualmente os pon
tos marcados e então esboçar a “melhor” reta pelos pontos. Embora tal abordagem “a 
olho” pareça atrativa do ponto de vista do bom senso e seja válida para cálculos “infor
mais”, ela é deficiente porque é arbitrária. Ou seja, a menos que os pontos definam 
perfeitamente uma reta (em tal caso, a interpolação seria apropriada), analistas diferen
tes desenhariam retas diferentes. 
Para remover essa subjetividade, deve ser desenvolvido algum critério para estabele
cer uma base para o ajuste. Uma forma de fazêlo é determinar a curva que minimize a 
discrepância entre os dados e os pontos da curva. Uma técnica para conseguir esse ob
jetivo, chamada regressão por mínimos quadrados, será discutida no presente capítulo.
17.1 REGRESSÃO LINEAR
O exemplo mais simples de aproximação por mínimos quadrados é ajustar uma reta a 
um conjunto de pares de observação: (x1, y1), (x2, y2), . . . , (xn, yn). A expressão mate
mática do ajuste por uma reta é 
y 5 a0 1 a1x 1 e (17.1)
Capitulo_17.indd 402 18/03/16 16:27
17.1 RegRessão LineaR 403
onde a0 e a1 são coeficientes representando a intersecção com o eixo y e a inclinação,
respectivamente, e e é o erro ou resíduo entre o modelo e a observação, o qual pode ser
representado, depois de se reorganizar a Equação (17.1), por 
e 5 y 2 a0 2 a1x
Portanto, o erro ou resíduo é a discrepância entre o valor verdadeiro de y e o valor
aproximado, a0 + a1x, previsto pela equação linear.
17.1.1 Critério para um “melhor” ajuste
Uma estratégia para ajustar uma “melhor” reta pelos dados seria minimizar o valor 
absoluto da soma dos erros residuais para todos os dados disponíveis, como em
n
i51
n
i51
ei 5 (yi 2 a0 2 a1 xi) 
(17.2)
onde n é o número total de pontos. Entretanto, esse é um critério inadequado, como
ilustrado pela Figura 17.2a, a qual descreve o ajuste de uma reta a dois pontos. Obvia
FIGURA 17.1
(a) Dados exibindo erros 
significativos. (b) Ajuste 
polinomial oscilando além 
do intervalo dos dados. (c) 
Resultado mais satisfatório 
usando ajuste por mínimos 
quadrados. 
y
x
(a)
5
50
0
y
x
(b)
5
50
0
y
x
(c)
5
50
0
Capitulo_17.indd 403 18/03/16 16:27
404 CapíTuLo 17 RegRessão poR MíniMos QuadRados
mente, o melhor ajuste é a reta ligando os pontos. Entretanto, qualquer reta passando 
pelo ponto médio do segmento que liga os pontos (exceto uma reta perfeitamente 
 vertical) resulta em um valor mínimo da Equação (17.2) igual a zero, pois os erros se 
cancelam. 
Portanto, outro critério lógico poderia ser minimizar a soma dos valores absolutos 
das discrepâncias, como em 
n
i51
|ei | 5
n
i51
|yi 2 a0 2 a1xi |
A Figura 17.2b ilustra por que esse critério também é inadequado. Para os quatro pontos
mostrados, qualquer reta caindo dentro das retas tracejadas minimizaria a soma dos 
valores absolutos. Portanto, esse critério também não forneceria um melhor ajuste único. 
Uma terceira estratégia para ajustar a melhor reta seria o critério minimax. Nessa
técnica, é escolhida a reta que minimize a distância máxima que um ponto individual 
tenha da reta. Como descrito na Figura 17.2c, tal estratégia não é adequada para a re
gressão porque ela permite uma influência indevida a um “ponto discrepante”, isto é, a 
um único ponto com um erro grande. Deve ser observado que o princípio minimax às 
vezes é adequado para ajustar uma função simples a uma função complicada (Car
nahan, Luther e Wilkes, 1969).
Uma estratégia que supera as deficiências das abordagens anteriores é minimizar a 
soma dos quadrados dos resíduos entre o y medido e o y calculado com o modelo linear
Sr 5 e2
i 5 (yi, medido 2 yi, modelo)2 5 (yi 2 a0 2 a1xi)
2 
n
i51
n
i51
n
i51 (17.3)
FIGURA 17.2
Exemplos de alguns critérios 
para “melhor ajuste” que são 
inadequados para a regressão: 
(a) minimizar a soma dos 
resíduos, (b) minimizar a soma 
dos valores absolutos dos 
resíduos e (c) minimizar o erro 
máximo por qualquer ponto 
individual.
y
Ponto médio
Ponto fora
x
(a)
y
x
(b)
y
x
(c)
Capitulo_17.indd 404 18/03/16 16:27
17.1 RegRessão LineaR 405
Esse critério tem diversas vantagens, incluindo o fato de que ele fornece uma única reta 
para um dado conjunto de dados. Antes de se discutir essas propriedades, será apresen
tada uma técnica para determinar os valores de a0 e a1 que minimizam a Equação
(17.3). 
17.1.2 Ajuste por mínimos quadrados por uma reta
Para determinar os valores de a0 e a1, a Equação (17.3) é derivada com relação a cada
coeficiente: 
Sr
a0
5 22
2
(yi 2 a0 2 a1xi)
Sr
a1
5 2 [(yi 2 a0 2 a1xi)xi]
Observe que simplificamos os símbolos de somatória; a menos que haja menção em 
contrário, todas as somatórias irão de i = 1 a n. Igualando essas derivadas a zero, será
obtido um Sr mínimo. Se isso for feito, as equações podem ser expressas como
0 5 yi 2 a0 2 a1xi
0 5 yi xi 2 a0 xi 2 a1x
2
i
Agora, percebendo que Sa0 = na0, é possível expressar essas equações como um con
junto de duas equações lineares simultâneas em duas variáveis (a0 e a1):
na0 1 ( xi)a1 5 yi (17.4)
( xi)a0 1 ( x2
i )a1 5 xi yi (17.5)
Essas são as chamadas equações normais. Elas podem ser resolvidas simultaneamente
a1 5
n xi yi 2 xi yi
n x2
i 2 ( xi)2
(17.6)
Esse resultado pode, então, ser usado junto à Equação (17.4) para determinar 
a0 5 y 2 a1x 
(17.7)
onde y̅ e x̅ são as médias de y e x, respectivamente.
EXEMPLO 17.1 Regressão linear
enunciado do problema. Ajuste uma reta aos valores de x e y nas primeiras duas co
lunas da Tabela 17.1.
solução. As seguintes quantidades podem ser calculadas: 
n 5 7 xi yi 5 119,5 x2
i 5 140
xi 5 28 x 5
28
7
7
5 4
yi 5 24 y 5
24
5 3,428571
Usando as Equações (17.6) e (17.7),
Capitulo_17.indd 405 18/03/16 16:27
406 CapíTuLo 17 RegRessão poR MíniMos QuadRados
a1 5
7(119,5) 2 28(24)
7(140) 2 (28)2 5 0,8392857
a0 5 3,428571 2 0,8392857(4) 5 0,07142857
TABELA 17.1 Cálculos para uma análise de erro do ajuste linear. 
xi yi (yi – y–) (yi − a0 − a1xi)2
1 0,5 8,5765 0,1687
2 2,5 0,8622 0,5625
3 2,0 2,0408 0,3473
4 4,0 0,3265 0,3265
5 3,5 0,0051 0,5896
6 6,0 6,6122 0,7972
7 5,5 4,29080,1993
S 24,0 22,7143 2,9911
Portanto, o ajuste por mínimos quadrados é
y = 0,07142857 + 0,8392857x
A reta, junto aos dados, é mostrada na Figura 17.1c
17.1.3 Quantificação do erro da regressão linear
Qualquer outra reta que não a calculada no Exemplo 17.1 resulta em uma soma maior 
dos quadrados dos resíduos. Portanto, a reta é única e, em termos do critério escolhido 
por nós, é a “melhor” reta pelos pontos. Diversas propriedades adicionais desse ajuste 
podem ser elucidadas examinandose com mais detalhe a forma como os resíduos 
foram calculados. Lembrese de que a soma dos quadrados é definida como [Equação 
(17.3)] 
Sr 5 e
2
i 5 (yi 2 a0 2 a1xi)
2 
n
i51
n
i51 (17.8)
Observe a similaridade entre as Equações (PT5.3) e (17.8). No primeiro caso, o 
quadrado do resíduo representava o quadrado da discrepância entre os dados e uma 
única estimativa da medida da tendência central – a média. Na Equação (17.8), o qua
drado do resíduo representa o quadrado da distância vertical entre os dados e uma outra 
medida da tendência central – a reta (Figura 17.3). 
A analogia pode ser estendida ainda mais nos casos em que (1) a dispersão dos 
pontos em torno da reta tem valor absoluto parecido ao longo de todo o intervalo dos 
FIGURA 17.3
O resíduo na regressão linear 
representa a distância vertical 
entre os pontos dados e a reta. 
y
yi
xi
a0 + a1xi
Medida
yi – a0 – a1xi
Reta de re
gressã
o
x
Capitulo_17.indd 406 18/03/16 16:27
17.1 RegRessão LineaR 407
dados e (2) a distribuição desses pontos em torno da reta é normal. Podese demonstrar 
que, se esses critérios forem satisfeitos, a regressão por mínimos quadrados fornecerá 
as melhores estimativas (ou seja, as mais prováveis) de a0 e a1 (Draper e Smith, 1981).
Isso é chamado de princípio da probabilidade máxima em estatística. Além disso, se
tais critérios forem satisfeitos, um “desviopadrão” para a reta de regressão pode ser 
determinado por [compare com a Equação (PT5.2)] 
sy/x 5
Sr
n 2 2
(17.9)
onde sy/x é chamado de erro padrão da estimativa. O subscrito “y/x” indica que o erro
é para um valor previsto de y correspondente a um valor particular de x. Além disso,
observe que agora estamos dividindo por n − 2 porque duas estimativas provenientes
dos dados – a0 e a1 – foram usadas para calcular Sr; portanto, perdemos dois graus de
liberdade. Do mesmo modo como na discussão de desviopadrão em PT5.2.1, uma 
outra justificativa para dividir por n − 2 é que não existe nenhuma “dispersão de dados”
em torno de uma reta ligando dois pontos. Portanto, nos casos nos quais n = 2, a Equa
ção (17.9) fornece um resultado infinito, sem sentido. 
Exatamente como no caso do desviopadrão, o erropadrão da estimativa quantifica 
a dispersão dos dados. Entretanto, sy/x quantifica a dispersão em torno da reta de re-
gressão, como mostrado na Figura 17.4b, em contraste com o desviopadrão original sy
que quantificava a dispersão em torno da média (Figura 17.4a).
Esses conceitos podem ser usados para quantificar “quão bom” é o ajuste. Isso é 
particularmente útil para comparar diversas regressões (Figura 17.5). Para fazer isso, 
voltamos aos dados originais e determinamos a soma total dos quadrados em torno da
média da variável dependente (no caso, y). Como no caso da Equação (PT5.3), essa
quantidade é denotada por St, que é o módulo do erro residual associado com a variável
dependente antes da regressão. Depois de fazer a regressão, podese calcular Sr, a soma
dos quadrados dos resíduos em torno da reta de regressão. Isso caracteriza o erro resi
dual que permanece depois da regressão. Portanto, às vezes ele é chamado de soma dos 
quadrados inexplicável. A diferença entre as duas quantidades, St − Sr, quantifica a
melhora ou a redução de erro decorrente da descrição dos dados em termos de uma 
reta, em vez de um valor médio. Como o módulo dessa quantidade depende da escala, 
a diferença é normalizada por St para fornecer
r2 5
St 2 Sr
St (17.10)
onde r2 é chamado de coeficiente de determinação e r é o coeficiente de correlação 
 (= √r2—). Para um ajuste perfeito, Sr = 0 e r = r2= 1, significando que a reta explica 100% 
da variação dos dados. Para r = r2 = 0, Sr = St e o ajuste não representa nenhuma
FIGURA 17.4
Dados de regressão mostrando 
(a) a dispersão dos dados em 
torno da média da variável 
dependente e (b) a dispersão 
dos dados em torno da reta de 
melhor ajuste. A redução na 
dispersão ao ir de (a) para (b), 
como indicada pelas curvas em 
forma de sino à direita, 
representa a melhora decorrente 
da regressão linear. 
(a) (b)
Capitulo_17.indd 407 18/03/16 16:27
408 CapíTuLo 17 RegRessão poR MíniMos QuadRados
 melhora. Uma formulação alternativa para r que é mais conveniente para implementa
ção computacional é 
r 5
noxi 
yi 2 (oxi)(oyi)
nox2
i 2 (oxi)
2 noy2
i 2 (oyi)
2
(17.11)
EXEMPLO 17.2 estimativa de erros para um ajuste linear por mínimos quadrados
enunciado do problema. Calcule o desviopadrão total, o erropadrão da estimativa e 
o coeficiente de correlação para os dados do Exemplo 17.1.
solução. As somatórias são feitas e apresentadas na Tabela 17.1. O desviopadrão é 
[Equação (PT5.2)]
sy 5
22,7143
7 2 1
5 1,9457
e o erropadrão da estimativa é [Equação (17.9)] 
sy/x 5
2,9911
7 2 2
5 0,7735
Portanto, como sy/xsr 1 (yi 2 a1*xi 2 a0)2
END DO
 syx 5 (sr/(n 2 2))0.5
 r2 5 (st 2 sr)/st
END Regress
Capitulo_17.indd 409 18/03/16 16:27
410 CapíTuLo 17 RegRessão poR MíniMos QuadRados
onde υ é a velocidade (m/s), g é a constante gravitacional (9,8 m/s2), m é a massa do para
quedista, igual a 68,1 kg, e c é o coeficiente de arrasto, de 12,5 kg/s. O modelo prevê a ve
locidade do paraquedista como uma função do tempo, como descrito no Exemplo 1.1. 
Um modelo empírico alternativo para a velocidade do paraquedista é dado por 
(t) 5
gm
c S St
3,75 1 t (E17.3.1)
Suponha que você quisesse testar e comparar a adequação desses dois modelos mate
máticos. Isso poderia ser conseguido medindo a velocidade real do paraquedista em 
valores conhecidos do tempo e comparando tais resultados com as velocidades previs
tas por cada modelo. 
Um programa desse tipo de coleta de dados experimentais foi implementado, e os re
sultados estão listados na coluna (a) da Tabela 17.2. As velocidades calculadas pelos
modelos estão listadas nas colunas (b) e (c).
TABELA 17.2 Velocidades medidas e calculadas de um paraquedista em queda livre. 
Tempo, s
v medida, m/s
(a)
v calculada pelo 
modelo, m/s 
[Equação (1.10)] (b)
v calculada pelo 
modelo, m/s
[Equação (E17.3.1)] (c)
1 10,00 8,953 11,240
2 16,30 16,405 18,570
3 23,00 22,607 23,729
4 27,50 27,769 27,556
5 31,00 32,065 30,509
6 35,60 35,641 32,855
7 39,00 38,617 34,766
8 41,50 41,095 36,351
9 42,90 43,156 37,687
10 45,00 44,872 38,829
11 46,00 46,301 39,816
12 45,50 47,490 40,678
13 46,00 48,479 41,437
14 49,00 49,303 42,110
15 50,00 49,988 42,712
solução. A adequação do modelo pode ser testada traçandose a velocidade calculada 
pelo modelo em função da velocidade medida. A regressão linear pode ser usada para 
calcular a inclinação e a intersecção com o eixo y do gráfico. Essa reta terá uma incli
nação 1, uma intersecção 0 com o eixo y e r2 = 1 se o modelo se adequar perfeitamente
aos dados. Um desvio significativo desses valores pode ser usado como uma indicação 
da inadequação do modelo. 
As Figuras 17.7a e b são gráficos da reta e dos dados para a regressão das colunas (b)
e (c), respectivamente, em função da coluna (a). Para o primeiro modelo [Equação
(1.10) como descrita na Figura 17.7a],
modelo5 20,859 1 1,032 medida
e para o segundo modelo [Equação (E17.3.1) como descrita na Figura 17.7b],
modelo5 5,776 1 0,752 medida
Capitulo_17.indd 410 18/03/16 16:27
17.1 RegRessão LineaR 411
Esses gráficos indicam que a regressão linear entre os dados e cada um dos modelos é 
altamente significativa. Ambos os modelos se ajustam aos dados com um coeficiente 
de correlação maior do que 0,99. 
Entretanto, o modelo descrito pela Equação (1.10) satisfaz o critério de teste de hipótese 
muito melhor do que o descrito pela Equação (E17.3.1) porque a inclinação e a intersecção 
com o eixo y estão mais próximas de 1 e 0. Logo, embora cada gráfico seja bem descrito
por uma reta, a Equação (1.10) parece ser um modelo melhor do que a Equação (E17.3.1).
55
30Y
5 30
X
55
5
(a)
55
30Y
5 30
X
55
5
(b)
FIGURA 17.7
(a) Resultados usando regressão linear para comparar as previsões calculadas pelo modelo teórico 
[Equação (1.10)] com os valores medidos. (b) Resultados usando regressão linear para comparar as 
previsões calculadas pelo modelo empírico [Equação (E17.3.1)] com os valores medidos.
Testar e escolher o modelo são atividades comuns e extremamente importantes exerci
das em todos os campos da engenharia. O material relativo a fundamentos dados neste 
capítulo, junto a seu software, deve possibilitar a resolução de muitos problemas práti
cos desse tipo.
Há uma deficiência na análise do Exemplo 17.3. O exemplo não era ambíguo porque 
o modelo empírico [Equação (E17.3.1)] era claramente inferior à Equação (1.10). Logo,
a inclinação e a intersecção com o eixo y para o primeiro eram tão mais próximas do
resultado desejado de 1 e 0 que se tornava óbvio qual modelo era superior. 
Entretanto, suponha que a inclinação fosse 0,85 e que a intersecção com o eixo y
fosse 2. Obviamente, isso deixaria aberta para debate a conclusão de que a inclinação e 
a intersecção com o eixo y eram 1 e 0. Em vez de depender de um julgamento subjetivo,
seria preferível basear tal conclusão em um critério quantitativo. 
Isso pode ser feito calculandose intervalos de confiança para os parâmetros do 
modelo da mesma forma que desenvolvemos intervalos de confiança para a média na 
Seção PT5.2.3. Esse tópico será retomado no final do presente capítulo. 
Capitulo_17.indd 411 18/03/16 16:27
412 CapíTuLo 17 RegRessão poR MíniMos QuadRados
17.1.5 Linearização de relações não lineares
A regressão linear fornece uma técnica poderosa para ajustar a melhor reta aos dados. 
Entretanto, ela é baseada no fato de que a relação entre as variáveis dependentes e in
dependentes é linear. Esse não é sempre o caso, e o primeiro passo em qualquer análise 
de regressão deveria ser traçar e inspecionar visualmente os dados para verificar se um 
modelo linear se aplica. Por exemplo, a Figura 17.8 mostra alguns dados que são obvia
mente curvilíneos. Em alguns casos, técnicas como regressão polinomial, a qual é 
descrita na Seção 17.2, são apropriadas. Para outros, podem ser usadas transformações 
para expressar os dados em uma forma que seja compatível com a regressão linear. 
Um exemplo é o modelo exponencial
y 5 1e 1x
(17.12)
onde α1 e β1 são constantes. Esse modelo é usado em muitos campos da engenharia
para caracterizar quantidades que aumentam (β1 positivo) ou diminuem (β1 negativo)
a uma taxa que é diretamente proporcional a seu próprio valor absoluto. Por exemplo, 
o crescimento populacional ou o decaimento radioativo podem exibir tal comporta
mento. Como descrito na Figura 17.9a, a equação representa uma relação não linear
(para β1 fi 0) entre y e x.
Outro exemplo de um modelo não linear é a equação de potência simples 
y 5 2x 2
(17.13)
onde α2 e β2 são coeficientes constantes. Esse modelo tem larga aplicabilidade em
todos os campos da engenharia. Como descrito na Figura 17.9b, a equação (para β2 fi
0 ou 1) é não linear. 
Um terceiro exemplo de um modelo não linear é a equação da taxa de crescimento 
da saturação [lembrese da Equação (E17.3.1)] 
y 5 3
x
3 1 x (17.14)
onde α3 e β3 são coeficientes constantes. Esse modelo, que é particularmente adequado
para caracterizar a taxa de crescimento populacional sob condições limitantes, tam
bém representa uma relação não linear entre y e x (Figura 17.9c) que se nivela, ou “sa
tura”, conforme x aumenta.
FIGURA 17.8
(a) Os dados não são 
adequados para uma regressão 
linear por mínimos quadrados. 
(b) Indicação de que uma 
parábola é preferível. 
y
x(a)
y
x
(b)
Capitulo_17.indd 412 18/03/16 16:27
17.1 RegRessão LineaR 413
As técnicas de regressão não linear estão disponíveis para ajustar tais equações aos 
dados experimentais diretamente. (Observe que vamos discutir a regressão não linear 
na Seção 17.5.) Entretanto, uma alternativa simples é usar manipulações matemáticas 
para transformar as equações para uma forma linear. Então, uma simples regressão li
near pode ser usada para ajustar as equações aos dados. 
Por exemplo, a Equação (17.12) pode ser linearizada tomandose seu logaritmo na
tural para obter 
ln y = ln α1 + β1x ln e
No entanto, como ln e = 1,
ln y = ln α1 + β1x (17.15)
Logo, um gráfico de y em função de x irá fornecer uma reta com uma inclinação β1 e
uma intersecção com o eixo y em ln α1 (Figura 17.9d).
A Equação (17.13) será linearizada tomandose seu logaritmo na base 10 para 
obter 
log y = β2 log x + log α2 (17.16)
Logo, um gráfico de log y em função de log x irá fornecer uma reta com uma inclinação
β2 e uma intersecção com o eixo y em log α2 (Figura 17.9e).
A Equação (17.14) será linearizada invertendoa para obter 
y
x
y = 1e 1x
(a)
Li
ne
ar
iz
aç
ão
y
x
y = 2x 2
(b)
Li
ne
ar
iz
aç
ão
y
x
(c)
Li
ne
ar
iz
aç
ão
y = 3
x
3 + x
ln y
x
= 1= ln 1
(d)
log y
log x
(e)
1/y
1/x
( f )
= log 2
Intersecção
Intersecção
Intersecção
= 1/ 3
= 2 InclinaçãoInclinação
Inclinação
= 3/ 3
FIGURA 17.9
(a) A equação exponencial, (b) a equação de potência e (c) a equação da taxa de crescimento da saturação. As partes (d), (e) e (f) são 
versões linearizadas dessas equações que resultam de transformações simples.
Capitulo_17.indd 413 18/03/16 16:27
414 CapíTuLo 17 RegRessão poR MíniMos QuadRados
 
1
y
5
3
3
1
x
1
1
α3 (17.17)
Logo, um gráfico de 1/y em função de l/x será linear, com uma inclinação β3/α3 e uma
intersecção com o eixo y em 1/α3 (Figura 17.9f).
Nas suas formas transformadas, esses modelos podem usar a regressão linear para 
calcular os coeficientes constantes. Eles poderiam, então, ser transformados de volta 
para seu estado original e usados para propósitos de previsão. O Exemplo 17.4 ilustra 
esse procedimento para a Equação (17.13). Além disso, a Seção 20.1 fornecerá um 
exemplo em engenharia do mesmo tipo de cálculo. 
EXEMPLO 17.4 Linearização de uma equação de potência 
enunciado do problema. Ajuste a Equação (17.13) aos dados da Tabela 17.3 usando 
uma transformação logarítmica dos dados. 
solução. A Figura 17.10a é um gráfico dos dados originais no seu estado não transfor
mado. A Figura 17.10b mostra o gráfico dos dados transformados. Uma regressão li
near para os dados transformados pelo log fornece o resultado 
log y = 1,75 log x ] 0,300
TABELA 17.3 Dados a serem ajustados pela equação de potência. 
x y log x log y
1 0,5 0 −0,301
2 1,7 0,301 0,226
3 3,4 0,477 0,534
4 5,7 0,602 0,753
5 8,4 0,699 0,922
y
x50
0
5
(a)
log y
0,5
(b)
log x0,5
FIGURA 17.10
(a) Gráfico dos dados não transformados com a equação de potência que ajusta os dados. (b) 
Gráfico dos dados transformados usados para determinar os coeficientes da equação de potência.
Logo, a intersecção com o eixo y, log α2, é igual a −0,300 e, portanto, calculandose a
inversa do logaritmo, α2 = 10−0,3 = 0,5. A inclinação é β2 = 1,75. Consequentemente, a
equação de potência é 
y = 0,5x1,75
Essa curva, traçada na Figura 17.10a, indica um bom ajuste.
Capitulo_17.indd 414 18/03/16 16:27
17.2 RegRessão poLinoMiaL 415
17.1.6 Comentários gerais sobre regressão linear
Antes de prosseguir para regressão linear múltipla e regressão não linear, é necessário 
enfatizar a natureza introdutória do material anterior sobre regressão linear. Concen
tramonos em deduções simples e usos práticos de equações para ajustar os dados. 
Você deve estar ciente de que existem aspectos teóricos da regressão que são de impor
tância prática, mas que estão além do escopo deste livro. Por exemplo, algumas hipóte
ses estatísticas inerentes aos procedimentos por mínimos quadrados são: 
1. Cada x tem um valor fixo; ele não é aleatório e é conhecido sem erros.
2. Os valores de y são variáveis aleatórias independentes e têm todos a mesma
 va riância. 
3. Os valores de y para um dado x devem estar normalmente distribuídos.
Tais hipóteses são relevantes para a dedução e o uso adequados da regressão. Por
exemplo, a primeira hipótese significa que (1) os valores de x devem estar livres de
erros e (2) a regressão de y em função de x não é a mesma que a de x em função de y
(tente resolver o Problema 17.4 no final do capítulo). Recomendamos fortemente que 
você consulte outras referências, como Draper e Smith (1981), para aspectos e nuances 
da regressão que estão além do escopo deste livro. 
Capitulo_17.indd 415 18/03/16 16:27
Portfólio 
ATIVIDADE
Com o propósito de ampliar seus conhecimentos sobre o assunto estudado nesta aula, leia 
o artigo intitulado "Aplicação de regressão linear para correção de dados dietéticos".
Após a leitura do artigo, descreva quais as aplicações da regressão linear foram abordadas.
ACESSE - ARTIGO 1 - 406 - AULA 8
N
OBS: Para redigir sua resposta, use uma linguagem acadêmica. Faça um texto com no mínimo 
20 linhas e máximo 25 linhas. Lembre-se de não escrever em primeira pessoa do singular, não 
usar gírias, usar as normas da ABNT: texto com fonte tamanho 12, fonte Arial ou Times, 
espaçamento 1,5 entre linhas, texto justificado.
Pesquisa 
AUTOESTUDO
Acesse e assista ao vídeo "Regressão Linear Simples - Ajuste de Reta ", disponível em 
https://www.youtube.com/watch?v=e5dKAK4Df04 
Para aprofundar seu conhecimento, descreva este tipo de regressão após assistir ao vídeo.
N

Regressão Linear em Matemática

FAVENI

Ferramentas de estudo

Conteúdos escolhidos para você

AULA-06-MÉTODOS-ESTATÍSTICOS

ESTATÍSTICA - AULA 6

Regressão Linear

Thomas Nield - Essential Math for Data Science-O'R_241112_150431-200-300 (1)-17-84

estatistica unidade 4

Perguntas dessa disciplina

Em um conjunto de dados a medida de dispersão que calcula a diferença entre o maior e o menor valor denominamos de amplitude. Ela apresenta a dispersã

O modelo clássico linear tem algumas hipóteses para que ele produza os melhores resultados, ou os estimadores BLUE. Dentre essas hipóteses, que obs...

Na análise empírica vimos que há três tipos de dados disponíveis, as séries de tempo, os cortes transversais e os dados combinados (ou dados em pai...

Questão 3/10 - Bioestatística Ler em voz altaLeia a passagem de texto:“Há intensa discussão acadêmica sobre quais estratégias analíticas devem ser uti

No contexto da Administração, a tomada de decisão baseada em dados é uma competência essencial. A correlação linear mede o grau de associação entre...

Conteúdos escolhidos para você

AULA-06-MÉTODOS-ESTATÍSTICOS

ESTATÍSTICA - AULA 6

Regressão Linear

Thomas Nield - Essential Math for Data Science-O'R_241112_150431-200-300 (1)-17-84

estatistica unidade 4

Perguntas dessa disciplina

Em um conjunto de dados a medida de dispersão que calcula a diferença entre o maior e o menor valor denominamos de amplitude. Ela apresenta a dispersã

O modelo clássico linear tem algumas hipóteses para que ele produza os melhores resultados, ou os estimadores BLUE. Dentre essas hipóteses, que obs...

Na análise empírica vimos que há três tipos de dados disponíveis, as séries de tempo, os cortes transversais e os dados combinados (ou dados em pai...

Questão 3/10 - Bioestatística Ler em voz altaLeia a passagem de texto:“Há intensa discussão acadêmica sobre quais estratégias analíticas devem ser uti

No contexto da Administração, a tomada de decisão baseada em dados é uma competência essencial. A correlação linear mede o grau de associação entre...

Mais conteúdos dessa disciplina