Prévia do material em texto
Profª Drª Marta Zanini Data 14/04/26 Aula Ensaio 11ª Arquivo pscmt_ensaio_aula_11 Matéria 959W Psicometria O modelo da Psicometria Moderna - Teoria Clássica dos Testes à Teoria de Resposta ao Item (TRI) Ensaio aula Psicometria A Essência da Fidedignidade -> 28/04 1. A Essência da Fidedignidade A fidedignidade, também conhecida como precisão ou confiabilidade, é a capacidade de um teste medir um fenômeno sem deixar que erros aleatórios distorçam o resultado. Na prática, isso significa que, se você aplicar o mesmo teste em momentos diferentes ou usar formas equivalentes do mesmo instrumento, os resultados devem ser praticamente os mesmos. 2. A Lógica da Teoria Clássica dos Testes (TCT) Para entender como chegamos ao coeficiente de fidedignidade (rtt), precisamos entender a composição da nota de um paciente: · Escore Empírico (T): É a nota observada no teste. · Escore Verdadeiro (V): É quanto o sujeito realmente sabe ou possui daquela característica. · Erro de Medida (E): São as interferências externas ou internas (barulho, cansaço, má formulação de itens). A fidedignidade é calculada como a proporção da variância verdadeira em relação à variância total do teste (rtt=SV2/ST2). Se o erro for zero, o coeficiente será 1; quanto maior o erro, mais o coeficiente se aproxima de 0. 3. Métodos para "Medir a Precisão" Como não conhecemos o escore verdadeiro "puro", os psicometristas criaram técnicas para estimar essa precisão: · · Teste-Reteste: Aplica-se o mesmo teste duas vezes ao mesmo grupo com um intervalo de tempo. Ele mede a estabilidade temporal, mas sofre com o "efeito de memória" (o sujeito lembra as respostas) ou mudanças pessoais do examinando no intervalo. · Formas Paralelas: Criam-se dois testes "irmãos" que medem a mesma coisa com itens diferentes. É o método ideal, mas é muito difícil construir dois testes perfeitamente idênticos em dificuldade. · Consistência Interna (Alfa de Cronbach e Duas Metades): Verifica se todos os itens do teste estão "falando a mesma língua". O Alfa de Cronbaché o mais usado, pois calcula a média de todas as correlações possíveis entre os itens em uma única aplicação. Para testes com respostas "sim ou não" (dicotômicas), usa-se a fórmula de Kuder-Richardson. 4. Por que o Psicólogo deve se preocupar com isso? Um coeficiente baixo (abaixo de 0,70) indica que o teste é inaceitável para uso profissional, pois o erro de medida é alto demais para garantir um diagnóstico. Para o psicólogo clínico, isso se traduz no Erro Padrão de Medida (EPM), que define a "margem de erro" da nota do paciente. Usar um teste pouco fidedigno pode levar a conclusões erradas sobre a saúde mental ou inteligência de alguém, o que fere o compromisso ético da profissão. -------------------------------------------------------------------------------- Palavras-Chave → Significado · Covariância → Mede como duas pontuações variam juntas; se ambas crescem juntas, a fidedignidade tende a ser maior. · Consistência Interna → O grau de correlação entre os itens de um único teste. · Fórmula de Spearman-Brown → Correção estatística necessária quando dividimos um teste ao meio (técnica das duas metades) para não subestimar a precisão. Perguntas-Chave → Significado · Qual o valor ideal para um teste ser considerado bom? → Valores em torno de 0,90 são excelentes, enquanto 0,80 é considerado razoável para a prática. · O que acontece se o intervalo do reteste for muito longo? → O coeficiente pode baixar porque o próprio sujeito pode ter mudado ou aprendido algo novo, e não por falha do teste. · Por que o KR21 costuma ser menor que outros índices? → Porque ele assume que todos os itens têm o mesmo nível de dificuldade, o que raramente acontece na realidade. Tratado Técnico sobre a Fidedignidade dos Testes Psicométricos: Da Teoria à Prática Analítica Na psicometria de alta precisão, a fidedignidade não é meramente um atributo desejável, mas o parâmetro fundamental que define o limite superior da validade de qualquer inferência. Como consultor sênior, observo frequentemente confusões terminológicas que obscurecem a prática analítica. A multiplicidade de termos — precisão, fidedignidade, confiabilidade, estabilidade — reflete, na verdade, as diferentes facetas da consistência de medida sob condições variadas. A "estabilidade" refere-se à invariância temporal (Teste-Reteste), a "equivalência" à simetria entre instrumentos (Formas Paralelas) e a "consistência interna" à harmonia molecular dos itens. Essa diversidade terminológica encontra um paralelo direto na calibração de instrumentos das ciências físicas. Assim como um micrômetro deve ser aferido para garantir que a variabilidade observada seja fruto da peça medida e não da instabilidade do aparelho, o psicometrista deve calibrar seu teste para isolar o erro. O ideal matemático de uma correlação de 1 representa a ausência total de erro. Na realidade empírica, a distância entre o coeficiente obtido e a unidade determina a utilidade profissional do teste: um instrumento com baixa fidedignidade é, essencialmente, um gerador de ruído aleatório. Para mitigar esse risco, devemos dominar a arquitetura estatística da Teoria Clássica dos Testes (TCT). 1. Arquitetura Estatística e a Decomposição da Variância A lógica da TCT postula que o escore observado (T) é a síntese do escore verdadeiro (V) e do erro aleatório (E). Consequentemente, a variância total (ST2) é decomposta como ST2=SV2+SE2. Sob essa ótica, o coeficiente de fidedignidade (rtt) é a proporção da variância total que é explicada pela variância verdadeira: rtt=ST2SV2 Estatisticamente, para formas paralelas, essa relação é expressa como a covariância entre as formas dividida pela variância total: rtt=varcov. Demonstração Analítica: O Exemplo dos Três Alunos Consideremos a aplicação de dois testes supostamente paralelos (A e B) em uma amostra reduzida (N=3), o que nos permite observar a mecânica do erro em nível granular: · Sujeito 1: Teste A = 80; Teste B = 82 · Sujeito 2: Teste A = 75; Teste B = 77 · Sujeito 3: Teste A = 90; Teste B = 88 O procedimento de cálculo, respeitando o divisor N−1=2 para estimativas amostrais, segue: 1. Médias e Desvios: Médias Aˉ=81,67 e Bˉ=82,33. 2. Cálculo da Covariância (COV): Somamos o produto dos desvios: [(−1,67×−0,33)+(−6,67×−5,33)+(8,33×5,67)]=0,55+35,52+47,31=83,38. · COV=83,38/2=41,69. 3. Cálculo da Variância Total (VAR): Somamos os quadrados de todos os desvios de ambos os testes em relação às suas respectivas médias: (2,78+0,11+44,44+28,42+69,56+32,17)=177,48. · VAR=177,48/2=88,74. 4. Estimação do Coeficiente: rtt=41,69/88,74≈0,47. O Veredito do Consultor: Um coeficiente de 0,47 é estatisticamente inaceitável. Isso implica que 53% da variabilidade observada é ruído. Em termos práticos, se utilizarmos esse teste para tomada de decisão clínica ou organizacional, a margem de erro (EPM) será tão vasta que o escore do indivíduo perderia qualquer valor preditivo. 2. Metodologias de Estimação e Delineamentos Experimentais A técnica de coleta determina qual tipo de erro o analista está isolando. A escolha deve ser rigorosa: No método das Duas Metades, a correção de Spearman-Brown é obrigatória porque a fidedignidade é uma função direta do comprimento do teste. A correlação simples entre metades subestima o coeficiente real, pois refere-se a um teste com apenas metade da extensão original. 3. Consistência Interna e a Hegemonia do Coeficiente Alfa O Alfa de Cronbach (α) tornou-se o padrão-ouro por ser a solução matemática para o problema das metades arbitrárias: ele representa a média de todas as combinações possíveis de divisões em duas metades de um teste. Sua fórmula reflete a congruência molecular dos itens: α=n−1n(1−sT2∑si2) Onde n é o número de itens, ∑si2 a soma das variâncias individuais e sT2 a variância total. Casos Particulares e Interpretação Técnica · KR20 e KR21: Em itens dicotômicos, o KR21 é uma simplificação que assume dificuldades iguais entre itens. Na prática profissional, o KR21 deve ser visto como umlimite inferior (subestimativa); se houver disparidade na dificuldade dos itens, o KR20 é tecnicamente superior. · Rulon e Guttman-Flanagan: Alternativas robustas para o delineamento de metades, baseadas na premissa de que a variância da diferença entre as partes é puramente erro. Níveis de Aceitabilidade: Como regra de balizamento técnico, coeficientes α