notaR

Um sistema para notas automatizadas em cursos que utilizam a linguagem R


 


107b.1 Intervalo de confiança de regressão

Uma forma de avaliar a incerteza na previsão de um modelo de regressão é fazer um gráfico com o intervalo de confiança de 95% da previsão do modelo. Nesse exercício você irá criar um modelo linear simples e estimar esse intervalo da previsão na unha*, para depois plotar um gráfico com os dados, o modelo e as curvas do intervalo de confiança.

Para começar o exercício, carregue o arquivo babies.txt em um objeto chamado bebe, depois siga os passos a seguir:

  1. Nós vamos avaliar a incerteza do modelo para a relação peso do bebê (oz) ~ tempo de gestação (dias).
    • Crie um objeto chamado bebe.data, contendo apenas os dados que iremos utilizar. O objeto deve ter duas colunas, uma para a variável preditora e a outra para a variável dependente.
    • Crie o modelo linear e salve-o no objeto bebe.lm

  2. Para estimar o intervalo de confiança, começamos calculando o erro padrão. Este não é um valor único: para cada valor de §x§ o erro padrão da previsão de §y§ pode ser calculado com a seguinte fórmula:

    §§ se_{\bar{y}} = \sqrt{s^2[\frac{1}{n} + \frac{(x-\bar{x})^2}{SSX}]} §§

    • onde:
      • §SSX§: soma dos desvios quadráticos de todos os valores de §x§ observados;
      • §s^2§: variância de todos os valores de §y§ observados;
      • §n§: número total de observações;
      • §x§: valor da variável preditora para o qual se quer estimar o erro padrão;
      • §\bar{x}§: média de todos os valores de §x§ observados.

    • Crie o objeto ssx, contendo o valor de §SSX§.
    • Crie um vetor chamado new.gest para representar a variável preditora. O vetor deve conter uma sequência de 100 valores compreendidos entre os valores máximo e mínimo observados da variável preditora, em ordem crescente.
    • Utilizando a fórmula acima, calcule o erro padrão para cada valor no vetor new.gest e salve os resultados no objeto se.bwt.

  3. Agora podemos usar o erro padrão para calcular o intervalo de confiança.
    • Calcule o valor do quantil da distribuição t para uma probabilidade acumulada de 95%, com §n-2§ graus de liberdade, e salve o resultado em tvalor.
    • Para termos o tamanho do intervalo de confiança de 95%, multiplicamos os valores de erro padrão pelo tvalor.
      • Para cada valor de §x§ no objeto new.gest podemos calcular o valor predito em §y§ usando nosso modelo e adicionar o tamanho do intervalo de confiança, com isso temos o valor extremo que §y§ pode assumir, com um intervalo de confiança de 95%, para aquele valor de §x§.
      • Agora calcule os valores extremos do intervalo de confiança e salve o resultado para o intervalo superior em int.sup e para o inferior em int.inf.

  4. Por fim, plote** os dados em um gráfico de pontos e adicione as linhas do modelo e do intervalo de confiança. Para isso use os seguintes parâmetros:
    • Pontos de dados: < pch = 19, cex= 1.5, col = rgb(0,1,.6, 0.4) >
    • Linha de regressão: < lwd=2 >
    • Linhas do intervalo de confiança: < col='red', lwd=2 >

* como queremos fazer na unha, o notaR não aceitará o uso da função predict().

** seu código não deve conter nenhuma função de abertura ou fechamento de dispositivos, como x11(), png(), etc.

 

Submeter resposta ajuda?

 

Escolha o arquivo de resposta usando o botão acima