Vista previa del material en texto
Facultad de Ciencias
Veterinarias
U.B.A.
Área Bioestadística
2017– 2do. Cuatrimestre
Estadística Analítica
Guía de Trabajos PrácticosGuía de Trabajos PrácticosGuía de Trabajos PrácticosGuía de Trabajos Prácticos
1era1era1era1era parte parte parte parte
II
Cronograma 2017 – 2do. Cuatrimestre
Sem lunes Contenidos
1 07-Ago
Revisión de conceptos relativos a inferencia. Intervalos de confianza y prue-
bas de hipótesis para la diferencia de medias de dos poblaciones. (hasta test
t con varianzas desconocidas y distintas inclusive).
2 14-Ago
Continuación: valores centrales (medias/medianas) de dos poblaciones. Inter-
valo de confianza y pruebas de hipótesis para el valor central (me-
dia/mediana) de diferencias apareadas.
3 21-Ago
Intervalo de confianza y pruebas de hipótesis para la diferencia de proporcio-
nes de dos poblaciones. Distribución F. Intervalo de confianza y pruebas de
hipótesis para el cociente de varianzas de dos poblaciones.
4 28-Ago Ejercitación de unidad 1.
5 04-Sep
Introducción al Diseño de experimentos. Diseño Completamente Aleatorizado
(DCA)
6 11-Sep Continuación de DCA paramétrico y no paramétrico. Ejercitación.
7 18-Sep Revisión e integración (Sábado 23 de setiembre 1er. Parcial)
8 25-Sep
Estadístico de Chi cuadrado para pruebas de bondad de ajuste. Pruebas de
Independencia
9 02-Oct
Estadístico de Chi cuadrado para Pruebas de Homogeneidad. Ejercitación de
la unidad.
09-Oct
Feriado 10
Lunes
Introducción a la regresión. Regresión lineal simple. Dócima e intervalos de
confianza para los parámetros de la recta utilizando la t de Student.
11 16-Oct
Continuación de Regresión Lineal Simple: Intervalos de predicción y de con-
fianza.
12 23-Oct
Coeficiente de determinación. ANOVA en la regresión. Regresión lineal múlti-
ple.
13 30-Oct Correlación Simple paramétrica y no paramétrica.
14 06-Nov Integración. Revisión y consulta. (Sábado 11-11-17 2do. Parcial)
15 13-Nov --------
20-Nov
Feriado 16
Lunes
Recuperatorio: Jueves 23 de Noviembre, a las 18 hs
III
NOTA IMPORTANTE:
La cátedra publica solamente la
GUIA DE TRABAJOS PRACTICOS
y la GUIA DE FORMULAS Y TABLAS
para la cursada de esta materia.
Cualquier otra publicación NO CUENTA
CON LA APROBACION DE LA CATEDRA.
Bibliografía
� Cantatore de Frank, Norma M.: Manual de Estadística Aplicada. Ed. Hemis-
ferio Sur. 1ra. Edición. Buenos Aires. Capítulos: 4, 5, 6, 7, 8, 12 y 13.
� Cappelletti, Carlos A.: Elementos de estadística. Cesarini Hnos. Editores.
2da. Edición. Bs. As. Capítulos 8, 9, 10, 11, 13 y 14.
� Daniel, Wayne W.: Bioestadística. Base para el análisis de las ciencias de la
salud. 3ra. Edición. Uteha, Noriega Editores. México. Capítulos: 5, 6, 8, y 10.
IV
Sistema de Evaluación de Estadística Analítica
Se tomarán dos parciales, que serán calificados en una escala de 0 a 10, en for-
ma global.
Las condiciones de LIBRE, ASISTENCIA CUMPLIDA, REGULAR Y PROMO-
CIÓN se obtienen si se cumplen las situaciones con respecto a calificación y
asistencia que abajo se detallan.
ASISTENCIA: Concurrencia a las clases teórico-prácticas en un porcentaje:
LIBRE: inferior al 75%
ASISTENCIA CUMPLIDA y REGULAR: mayor o igual al 75%
PROMOCIÓN: mayor o igual al 80%
CALIFICACIÓN:
SEGUNDO PARCIAL
1 2 3 4 5 6 7 8 9 10
1 LIBRE LIBRE LIBRE AC AC
REC
1P
REC
1P
REC
1P
REC
1P
REC
1P
2 LIBRE LIBRE LIBRE AC AC
REC
1P
REC
1P
REC
1P
REC
1P
REC
1P
3 LIBRE LIBRE LIBRE AC AC
REC
1P
REC
1P
REC
1P
REC
1P
REC
1P
4 AC AC AC AC AC
REC
1P
REC
1P
REC
1P
REC
1P
COL
5 AC AC AC AC AC
REC
1P
REC
1P
REC
1P
COL COL
6
REC
2P
REC
2P
REC
2P
REC
2P
REC
2P
REG REG PROM PROM PROM
7
REC
2P
REC
2P
REC
2P
REC
2P
REC
2P
REG PROM PROM PROM PROM
8
REC
2P
REC
2P
REC
2P
REC
2P
REC
2P
PROM PROM PROM PROM PROM
9
REC
2P
REC
2P
REC
2P
REC
2P
COL PROM PROM PROM PROM PROM
P
R
IM
E
R
P
A
R
C
IA
L
10
REC
2P
REC
2P
REC
2P
COL COL PROM PROM PROM PROM PROM
Siendo:
AC: asistencia cumplida
COL: coloquio
PROM: promoción
REC 2P: recupera 2do. Parcial
REC 1P: recupera 1er. Parcial
REG: regular
NOTA
1. Los alumnos que estén ausentes a un parcial y presenten certificado oportu-
namente en la cátedra lo rendirán en la fecha de recuperatorio y si posteriormen-
te quedan en situación de recuperar un parcial se les asignará una fecha.
2. Los alumnos que recuperan algún parcial consiguen como máximo la condición
de REGULAR.
3. Los coloquios se tomarán en forma oral sobre los contenidos que involucra el
parcial de menor puntaje y definen la condición del alumno.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
1
Unidad 1: INFERENCIA para DOS POBLACIONES
Objetivos específicos:
• Comprender la importancia de diseñar experimentos.
• Analizar la adecuación de cada diseño en función del contexto de la investigación.
• Aplicar los conceptos de inferencia estadística a la comparación de dos poblaciones, utilizando como
procedimientos la estimación y la prueba de hipótesis.
• Seleccionar el procedimiento de inferencia adecuado en función del objetivo y del cumplimiento de los
supuestos.
• Resolver problemas e interpretar conclusiones aplicando los métodos de análisis sobre dos
poblaciones.
Contenidos temáticos:
� Diseño de experimentos: necesidad, ventajas, propósitos, definiciones previas. Tipos de diseños y
alcances.
� Revisión de conceptos relativos a la estimación puntual y por intervalos. Intervalos de confianza
para la diferencia de medias y para la media de las diferencias. Estimaciones para la diferencia de dos
proporciones, para el cociente de varianzas, y para el cociente de desvíos estándar.
� Revisión de conceptos relacionados con las pruebas de hipótesis. Prueba de hipótesis para:
diferencia de medias en base a dos muestras independientes: diferencia de medias, cociente de
varianzas, diferencias de proporciones. Muestras apareadas: media de las diferencias.
� Relación entre intervalo de confianza y prueba de hipótesis bilateral. Aplicaciones.
Glosario:
Diseño de experimentos : experimento, unidad experimental, tratamiento, factor, niveles de un factor,
observación, efecto. Repetición, aleatorización, control local. Estudios observacionales, pre-
experimentales, cuasiexperimentales y experimentales.
Inferencia para dos poblaciones : Población, muestra. Parámetro. Estimador. Estimación. Estimador
puntual. Intervalo. Intervalo de confianza. Nivel de confianza. Hipótesis de trabajo. Hipótesis estadística.
Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región crítica. Regla de decisión.
Distribución F de Snedecor. Diferencia de medias y de proporciones, cociente de varianzas para muestras
independientes. Muestras apareadas: media de las diferencias.
El diseño de experimentos
La ciencia, tiene entre sus objetivos la explicación y comprensión de los acontecimientos. Un requisito
fundamental en toda ciencia fáctica es el contraste de las hipótesis planteadas, poniendo a prueba las
mismas mediante una confrontación con la experiencia.
El diseño experimental crea las condiciones para el contraste de la hipótesis y brinda la metodología esta-
dística correspondiente para el análisis de los datos.
Es el proceso de planear un experimento para obtener datos apropiados que puedan ser analizados
mediante métodos estadísticos, con objeto de producir conclusiones válidas y objetivas. La metodolo-
gía estadística es el único enfoque objetivo para analizar un problema que involucre datos sujetos a
errores experimentales. Así es que hay dos aspectos en cualquier problema experimental: el diseño del
experimento y el análisis estadísticode los datos.
El propósito del diseño experimental es controlar la máxima cantidad de información pertinente al pro-
blema bajo investigación. Sin embargo también es importante que el diseño o plan sea tan simple co-
mo sea posible, a fin de ahorrar tiempo, dinero, personal y material experimental.
Para que la metodología de diseño de experimentos sea eficaz es fundamental que el diseño sea el ade-
cuado. Un experimento puede realizarse por alguno de los siguientes motivos:
� Determinar los factores principales que influyen sobre la variable respuesta.
� Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable
de interés o respuesta.
� Comparar las respuestas en diferentes niveles de observación de variables controladas.
� Obtener un modelo estadístico-matemático que permita hacer predicciones de respuestas futuras.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
2
Para poder realizar un buen diseño experimental, es necesario previamente comprender el problema
que se desea estudiar, planteándose un conjunto de preguntas clásicas:
1- ¿Cuáles son las características de interés?
2- ¿Qué variables afectan a las características que se van a analizar?
3- ¿Cuántas veces debería repetirse el experimento?
4- ¿A partir de qué valor se considerará que el efecto es significativo?
Lo cual conduce a elegir las variables más apropiadas y sus niveles de medición, elegir la o las res-
puestas a evaluar y el modelo de diseño.
Para responder estas preguntas es necesario definir claramente algunos términos fundamentales:
� Experimento : es un ensayo o una observación, realizado bajo condiciones establecidas y contro-
ladas por el experimentador, susceptible de repetirse bajo las mismas condiciones.
� Variable de interés o respuesta : es la variable que se desea estudiar.
� Unidad experimental : es la parte más pequeña de material experimental, entidad física o sujeto,
en la que se aplica un tratamiento una sola vez. También puede entenderse como cada una de las
reproducciones del experimento.
� Tamaño del Experimento : es el número total de observaciones recogidas en la ejecución del ex-
perimento. Ejemplo: si se asignan 10 gallinas a cada una de tres dietas el tamaño del experimento es
30.
� Factor : es una variable que se sospecha que puede ejercer influencia sobre la variable respuesta
de interés.
� Factor controlado : se denomina así a una variable manipulada por el investigador o variable in-
dependiente, a fin de estudiar su influencia sobre la variable de interés o dependiente. Algunos autores
la denominan variable de entrada al proceso. Ejemplo: si pensamos que la temperatura o la humedad
pueden afectar a la conservación de cierta propiedad de un alimento o medicamento, se puede contro-
lar manteniendo dicho producto con tres valores distintos de temperatura.
� Niveles del factor : son cada una de las categorías, o valores, o formas específicas que adopta la
variable independiente o controlada. Ejemplo: en el caso de las tres dietas, el factor dieta tiene tres
niveles; en el caso del rodeo, el factor tiene dos niveles.
� Tipos de factores : existen factores cuantitativos, cuyos niveles son cantidades numéricas, y cuali-
tativas, cuyos niveles son procedimientos o cualidades. Ejemplo de factor cuantitativo puede ser la
cantidad de fertilizante adicionado a las parcelas de cultivo por hectárea con niveles: 10kg/ha – 20
kg/ha -30 kg/ha de fertilizante. Ejemplo de factor cualitativo puede ser el tipo de nutriente adicionado a
una dieta con niveles: potasio, magnesio y calcio.
� Tratamiento : conjunto de condiciones experimentales o procedimientos creados para el experi-
mento en función de la hipótesis de investigación a las que se someterá a las unidades experimentales
en un diseño elegido. Con varios factores es una de las combinaciones específicas de los niveles de
los factores de estudio, y en un diseño unifactorial es uno de los distintos niveles del factor en el caso.
Por ejemplo: si se asignan tres dietas distintas a las gallinas de un criadero, cada una de las dietas es
un tratamiento. Si en un tambo se combinan tres raciones de alimentación dos rodeos con vacas en
ordeñe (uno con vacas de alta producción y el otro con las de baja producción). Cada combinación de
rodeo y ración constituye un tratamiento (6 tratamientos).
� Observación : valor que asume una variable, también denominada variable respuesta, en una de-
terminada realización del experimento, es decir cada registro realizado en el contexto del experimento
de la variable respuesta.
� Efecto : diferencia entre los valores medios poblacionales de la variable respuesta en presencia y
ausencia de un nivel del factor. Si la variable respuesta de interés es el engorde semanal medido en
gramos de una gallina con cierta dieta enriquecida, el efecto es la diferencia entre el engorde medio
poblacional con la dieta enriquecida y el engorde medio poblacional con la dieta tradicional, ambos
medidos en gramos.
� Diseño equilibrado o balanceado : es el diseño en el que todos los tratamientos son asignados a
un número igual de unidades experimentales, en el cual se obtiene la misma cantidad de repeticiones
por tratamiento. Por ejemplo hay cuatro vacas en cada combinación de rodeo y nutriente para el agua.
Principios Básicos del diseño experimental
Los tres principios básicos que caracterizan a un diseño experimental:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
3
♦ Repetición: cuando un tratamiento es aplicado a más de una unidad experimental. Las observacio-
nes repetidas con las mismas condiciones experimentales en el contexto de un experimento no coinci-
den necesariamente, y por lo tanto una de las cuestiones fundamentales a la hora de diseñar un expe-
rimento es la selección del tamaño de muestra o número de repeticiones adecuado en cada contexto.
Las razones por las cuales es deseable realizar repeticiones del experimento son:
a- Proporcionar una estimación del error experimental (error generado por causas no controladas por
el experimentador), que actúa como unidad básica de medida para indicar el significado de las di-
ferencias.
b- Obtener mayor precisión en la estimación.
c- Permitirnos extender el alcance de la inferencia relativa al experimento.
El error experimental según el contexto puede reflejar:
• errores de experimentación
• errores de observación
• errores de medición
• variación del material experimental
El error experimental puede reducirse generalmente adoptando una o más de las técnicas siguientes:
• usando material experimental tan homogéneo como sea posible.
• utilizando información proporcionada por otras variables aleatorias
• teniendo cuidado al dirigir el experimento
• usando un diseño experimental más eficiente.
♦ Aleatorización: Todo procedimiento de prueba se basa en un conjunto de supuestos que deben
satisfacerse para que la prueba resulte válida. Una de las suposiciones más frecuentes es que las ob-
servaciones, o los errores en ellas, son independientes. Dicho en otras palabras la aleatorización
hace válida la prueba.
♦ Control local: Se denomina de esta manera al conjunto de acciones que implementa el investiga-
dor con el fin de reducir al máximo posible el error experimental manteniéndolo en un rango de varia-
ción manejable.
Por ejemplo: selección de unidades experimentales homogéneas, división en bloques, calibración de
instrumentos, etc.
Tipos de estudios de investigación
Los estudios observacionales son un conjunto de estudios en los que no hay intervención por parte
del investigador y este se limita a medir las variables que define en el estudio. Por ejemplo, los estu-
dios epidemiológicos.
Ventajas de los estudios observacionales
1. Son más prácticos y factibles de realizar ya que la cooperación de los sujetos es menos necesaria
2. Sus resultados son más generalizables a poblaciones, geográfica o demográficamentedefinidas.
Inconvenientes de los estudios observacionales
1. Escaso control de las influencias de los factores de confusión sobre los resultados del estudio.
(Los factores de confusión son factores no tenidos en cuenta que pueden llegar a modificar los re-
sultados de un análisis).
2. Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser úni-
co, siendo muy difícil reproducir los resultados por otro investigador.
Los estudios pre-experimentales se caracterizan por analizar una única variable y prácticamente no
existe ningún tipo de control. No existe manipulación de la variable independiente ni se utiliza el grupo
de control; por consiguiente son escasas las posibilidades de que este grupo sea representativo de los
demás. Este tipo de diseño consiste en administrar un tratamiento o estímulo en la modalidad de solo
pre-prueba / posprueba.
Un estudio de intervención , también llamado estudio experimental , es un estudio caracterizado por
la manipulación artificial del factor de estudio por el investigador y por la aleatorización de los casos o
sujetos en dos grupos, llamados control y tratado.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
4
Cuando la característica de la aleatorización en el estudio no se cumple, se dice que el estudio es
cuasiexperimental . La falta de aleatorización de los estudios cuasiexperimentales indica que no existe
manera de asegurar la equivalencia inicial de los grupos denominados experimental y de control.
También es usual que, en un experimento, se utilicen controles históricos. El problema que presenta
este tipo de diseño es que el grupo actualmente en tratamiento puede presentar importantes diferen-
cias relativas al tratamiento respecto al grupo de control histórico. Los trabajos con controles históricos
están generalmente sesgados a favor del tratamiento, mientras que los experimentos aleatorios evitan
este tipo de sesgo.
PROBLEMAS RESUELTOS
1) Mediante los estudios ecográficos, los bebés pueden actualmente ser observados mientras están en
el seno materno. Sin embargo, gran cantidad de experimentos desarrollados en animales de laborato-
rio dieron como resultado que la aplicación de ultrasonidos podía ser la causa de que el peso al nacer
fuese inferior al normal.
Ante el temor de que esta conclusión fuese aplicable a los humanos, un grupo de especialistas del
Hospital John Hopkins de Baltimore puso en marcha un estudio para investigar el tema. En el mismo
se observó el peso al nacimiento de los bebés que estuvieron expuestos a controles ecográficos (ultra-
sonido) y de los que no estuvieron expuestos.
También en este caso los bebés expuestos al ultrasonido durante el embarazo pesaban en su mayo-
ría al nacer menos que aquellos que no lo habían estado, pero un dato a tener en cuenta es que los
obstetras recomendaban el ultrasonido cuando sospechaban que el embarazo no se desarrollaba con
normalidad.
a) ¿Se trata de un estudio observacional o experimental? ¿Por qué?
b) ¿Puede concluirse que el ultrasonido influye sobre el peso del nacimiento?
Solución:
a) Se trata de un estudio observacional, porque no hay intervención del investigador.
b) Los bebés expuestos al ultrasonido y los no expuestos presentaban diferencias que no tenían nada
que ver con el hecho de ser tratados o no. De modo tal que los investigadores tuvieron un conjunto de
factores de confusión con el cual enfrentarse. La conclusión del estudio fue, por lo tanto, que las eco-
grafías y el menor peso de los bebés tenían una causa común: problemas durante el embarazo.
2) Mediante la siguiente experiencia se quiere determinar si una droga reduce el nivel promedio de gluco-
sa en sangre (glucemia) en una línea de ratas diabéticas.
Se tomaron al azar 40 ratas de esta línea y se les suministró la droga (grupo tratado). Al mismo
tiempo se tomaron otras 30 ratas de la misma línea y se les suministró un placebo (grupo control).
Los niveles sanguíneos de glucosa (mg/ml) en las ratas fueron:
Tratadas con droga Tratadas con placebo
1,82 1,89 1,39 1,79 1,27 1,73 2,01 1,74 1,91 1,52 1,41
1,88 1,88 1,66 1,93 1,56 1,93 1,70 1,74 2,16 1,60 1,70
1,69 1,94 1,62 1,44 1,68 1,99 1,82 1,40 1,68 1,57 1,91
1,83 1,60 1,58 2,12 1,61 1,91 1,70
2,15 1,91 1,93 2,22 2,18 1,75 1,93 2,03
2,37 1,65 2,09 1,75 2,00 2,23 2,10 1,95 2,18
1,95 1,92 2,01 2,48 1,67 2,23 1,96 1,87 2,06
2,00 2,26 1,94 1,89
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
Droga 40 1,73 0,20 0,97 0,7640
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
5
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
Placebo 30 2,02 0,20 0,97 0,7499
a) ¿Es la droga efectiva para reducir el nivel promedio de glucosa en sangre, al 5%? Asuma que la
droga no modifica la varianza poblacional del nivel de glucosa en sangre, y que ésta es conocida, sim-
bólicamente σ2droga=σ
2
placebo =0,04 mg
2/ml2
b) Construya un intervalo de confianza del 95% para la diferencia entre la media poblacional de la
glucemia de las ratas tratadas con droga y la media poblacional de la glucemia de las ratas tratadas con
placebo.
Datos del problema:
• Variables en estudio
X: nivel de glucosa de una rata de una línea diabética, tratada con droga , en mg/ml
Y: nivel de glucosa de una rata de una línea diabética, tratada con placebo , en mg/ml
• Tamaños de las muestras: n1= 40 y n2= 30
• Varianzas poblacionales: Conocidas e iguales. (σ21 = σ
2
2 = 0,04 mg
2/ml2)
• Nivel de significación: α = 0,05
• Nivel de confianza: 1 - α = 0,95
Solución:
a)
• La hipótesis de trabajo que se desea poner a prueba es:
“El empleo de la droga disminuye el nivel medio de glucosa en sangre de ratas de la línea diabética”
• Verificación de condiciones para la elección de la mejor variable pivotal: Para poder plantear las
hipótesis estadísticas y llevar a cabo la prueba, hay que verificar las condiciones teóricas necesarias.
En este caso, dichas condiciones son:
-Que ambas variables (X y Y) sean independientes
-Que se extraigan dos muestras aleatorias X1, X2, …,Xn1 e Y1, Y2, …, Yn2
-Que cada Xi y cada Yi se distribuya normalmente.
-σ1
2 y σ2
2 deben ser conocidas
El supuesto de independencia se cumple por la forma en que se realizó el experimento: a un grupo de
ratas, tomadas al azar, se le suministró la droga y a otro grupo, también tomado al azar, se lo trató con
placebo.
Por otro lado, las muestras fueron seleccionadas al azar, según el enunciado, y también éste nos apor-
ta el dato de las varianzas poblacionales. Por ende, la única condición que aún debemos verificar me-
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
6
diante la prueba de hipótesis correspondiente es que cada Xi y cada Yi de las muestras aleatorias se
distribuyan normalmente.
Empezaremos realizando unos gráficos denominados gráfico de cuantil-cuantil (qqplot) como un primer
acercamiento al tratamiento de la condición en estudio. En este gráfico se comparan dos distribucio-
nes, la de los datos muestrales y la de una normal. Cuando los puntos están perfectamente alineados,
se infiere que la distribución es exactamente normal, si los puntos están muy cercanos a la línea, la
distribución es aproximadamente normal, grandes apartamientos de esta estructura indican falta de
normalidad. Esto sin embargo no tiene la fuerza de un test estadístico es una técnica exploratoria.
Para X:
Observando el gráfico se puede ver
que los puntos no se alejan mucho
de la recta, sin embargo, por ser un
gráfico, no se puede hacer
inferencia sobre el comportamiento
distribucional de la variable a nivel
poblacional.
Para poder concluir a nivel poblacional es necesario un test de normalidad. En Elementos de
Estadísticase estudió la prueba Shapiro-Wilks, para verificar normalidad, cuyas hipótesis son:
( )
( )
2
0 1 1
2
1 1 1
: ~N ;
: no se distribuye normalmente N ;
H X
H X
µ σ
µ σ
En todos los casos para esta prueba utilizaremos un nivel de significación del 10%
Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados:
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
X1 40 1.73 0.20 0.97 0,7640
La regla de decisión tiene el siguiente formato:
No se rechaza la hipótesis nula si el p-valor>0,10
Se rechaza la hipótesis nula si el p-valor ≤0,10
Como el p-valor= 0,7640 y es mayor que α=0,10 no se rechaza H0 y se puede concluir que:
Con un nivel de significación del 10% no tengo evidencias suficientes para rechazar mi hipótesis nula
( ( )21 1~N ;X µ σ ) entonces el nivel de glucosa en sangre de las ratas tratadas con droga, en mg/ml, se
distribuye normalmente en esta población de ratas de línea diabética en estudio.
Análogamente se estudia la normalidad de la variable Y:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
7
( )
( )
2
0 2 2
2
1 2 2
: ~N ;
: no se distribuye normalmente N ;
H Y
H Y
µ σ
µ σ
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Y 30 2.02 0.20 0.97 0,7499
Como ya fur visto, la regla de decisión es:
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como el p-valor= 0,7499 y es mayor que α=0,10 no se rechaza H0 y se puede concluir que:
Con un nivel de significación del 10% no tengo evidencias suficientes para rechazar mi hipótesis nula
( ( )21 1Y~N ;µ σ ) entonces el nivel de glucosa en sangre de las ratas tratadas con placebo, en mg/ml,
se distribuye normalmente en esta población de ratas de línea diabética en estudio.
Nota : este test no será necesario si la información asegura distribución normal de la variable.
Una vez verificada la condición teórica faltante se puede seguir adelante con la prueba.
• Hipótesis estadísticas.
El interés del investigador es probar si la droga disminuye el nivel medio de glucosa en sangre,
por lo tanto quiere saber si la media del nivel de glucosa en sangre de ratas tratadas con droga es me-
nor que la media del nivel de glucosa en sangre de las ratas tratadas con placebo.
Simbólicamente: 1 2µ µ< . Esta expresión no lleva el signo igual, por lo tanto debe corresponder a
la hipótesis alternativa. Es decir que las hipótesis estadísticas son:
0 1 2
1 1 2
:
:
H
H
µ µ
µ µ
≥
<
Equivalentemente podría escribirse
0 1 2
1 1 2
: 0
: 0
H
H
µ µ
µ µ
− ≥
− <
o también
0 2 1
1 2 1
: 0
: 0
H
H
µ µ
µ µ
− ≤
− >
Cualquiera de estas formas expresan las mismas hipó tesis estadísticas . Sin embargo hay que
elegir una expresión para poder continuar con la prueba manteniendo la elección a lo largo de todo el
análisis y concluir para las hipótesis elegidas. Si esto no se mantiene se podría estar concluyendo
erróneamente. En este caso se va a trabajar
con:
0 1 2
1 1 2
:
:
H
H
µ µ
µ µ
≥
<
• Nivel de significación: α=0,05
• Estadístico de prueba (o variable pivotal)
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
8
Se está realizando un test de hipótesis para la diferencia de medias poblacionales, por lo cual se
cuenta con dos opciones al elegir la variable pivotal: Z o t de Student, dependiendo del conocimiento o
no las varianzas poblacionales. En este caso las varianzas poblacionales son conocidas, por lo tanto
se utiliza Z, la expresión de la variable pivotal es:
( ) ( ) ( )1 2
2 2
1 2
1 2
~ 0;1
X Y
Z N
n n
µ µ
σ σ
− − −
=
+
• Región crítica:
Observando la hipótesis alternativa (del par de hipótesis elegidas), se ve que la región crítica es unila-
teral izquierda. Se llega a esta conclusión analizando que si se rechazaría la H0 entonces 1 2µ µ< , lo
que provoca que en la mayoría de los casos X Y< . De esta forma, el numerador da por resultado un
número negativo y el denominador siempre es positivo (desvío estándar poblacional) así, en la mayo-
ría de los casos en que se cumpla la hipótesis alternativa, el cálculo de la variable pivotal será negati-
vo, esto me indica que la región crítica es unilateral izquierda.
Por lo tanto el valor crítico es: 0,05 1,64z = − y la región crítica es: 1,64Z ≤ −
• Regla de decisión:
Rechazo H0 si 1,64
oH
Z ≤ −
No rechazo H0 si 1,64
oH
Z > −
• Cálculo de ZHo:
Hasta este momento no utilizamos los valores muestrales, excepto en la verificación de las condi-
ciones para la elección de la variable pivotal, sin embargo se podría haber hecho con muestras piloto y
recién en esta instancia extraer las muestras para el análisis. Antes de calcular el valor del estadístico
de prueba hay que calcular las medias muestrales utilizando las fórmulas dadas en la unidad de esta-
dística descriptiva de Elementos de Estadística: 1,73; y 2,02x = = . Hay que tener en cuenta que la
prueba se está realizando bajo la hipótesis nula que contiene el caso en que las medias poblacionales
son iguales, por lo tanto la diferencia de las medias poblacionales es cero, es decir que 1 2 0µ µ− = .
Se utiliza esta igualdad en la prueba debido a que 1 2 0µ µ− = es el valor extremo entre la hipótesis
alternativa y la hipótesis nula, la decisión que se tome se cumplirá para cualquier otro resultado que
valide la hipótesis nula ( 1 2µ µ≥ ). Reemplazando estos valores y el resto de la información en la fór-
mula nos queda:
( ) ( ) ( )1 2
2 2
1 2
1 2
1,73 2,02 0 0, 29 0,29
6,017
0,04820,04 0,04 0,001 0,00133
40 30
X Y
Z
n n
µ µ
σ σ
− − − − − − −= = = = = −
+++
• Decisión: Se rechaza la hipótesis nula porque 6,017
oH
z = − , es menor que –1,64, o sea que
ZCALCULADO < ZCRITICO.
• Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula ( 0 1 2:H µ µ≥ ), por lo tanto la media poblacional del nivel de glucosa en sangre de ratas dia-
béticas tratadas con droga es menor que la media poblacional del nivel de glucosa en sangre de ratas
diabéticas tratadas con placebo, en estas poblaciones de ratas diabéticas en estudio. Por lo tanto pue-
do decir que la droga es efectiva.
b) La fórmula del intervalo del 95% que se está pidiendo se despeja de la variable pivotal y es:
( ) ( )
2 2 2 2
1 2 1 2
1 1
2 2
1 2 1 2
;x y z x y z
n n n n
α α
σ σ σ σ
− −
− − + − + +
reemplazando se obtiene que
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
9
( ) ( )
[ ] [ ]
0,04 0,04 0,04 0,04
1,73 2,02 1,96 ; 1,73 2,02 1,96
40 30 40 30
0,29 1,96 0,0023; 0,29 1,96 0,0023
0, 29 0,0939; 0, 29 0,0939 0,3839; 0,1961
− − + − + + =
= − − − + =
= − − − + = − −
Por lo tanto el intervalo de confianza para la diferencia de medias poblacionales 1 2µ µ− es:
[-0,3839 mg/ml; -0,1961 mg/ml]
Conclusión : Con un nivel de confianza del 95%, se espera que el intervalo [-0,3839 mg/ml; -0,1961
mg/ml] cubra o abarque a la diferencia entre la media poblacional del nivel de glucosa de las ratas tra-
tadas con droga y la media poblacional del nivel de glucosa de las ratas tratadas con placebo, en estas
poblaciones de ratas diabéticas.
NOTA: Observemos que el 0 (cero) no está incluido en el intervalo de confianza, y que ambos límites
son negativos, lo cual es indicador de que la diferencia es negativa. Sin embargo, hay que tener en
cuenta que el IC no es equivalente a la prueba de hipótesis realizada en el punto anterior porque la
prueba es unilateral.
3) Se tomó una muestra aleatoria de 21 cerdos Yorkshire del norte de la provincia de Buenos Aires. Los
mismos tenían 3 meses de edad y pesos homogéneos, y se los separó, aleatoriamente, en dos lotes. Al
lote 1 se le asignó una ración estándar (A) y al lote 2 otra con distinta formulación (B). La siguiente tablacontiene las ganancias de peso de cada animal, luego de 30 días de experiencia, expresadas en kg.
Lote 1(A) 24 26 25 23 28 27 28 24 29 29
Lote 2(B) 26 32 28 25 29 27 28 27 27 28 30
Por estudios anteriores se sabe que ambas variables se distribuyen normalmente con varianzas igua-
les, pero desconocidas.
a) ¿Se puede suponer, al 5%, que la ganancia media de peso de los animales alimentados con la
ración B supera significativamente la ganancia media de peso de los animales alimentados con ración
A?
b) Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir?
Datos del problema:
• Variables en estudio:
XA: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As.
alimentado con la ración estándar A
XB: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As.
alimentado con la formulación distinta B
• Tamaños de las muestras: nA=10 y nB=11
• Varianzas Poblacionales: σA
2 = σB
2 = σ2 (desconocidas)
• Nivel de significación: α=0,05
• Nivel de confianza: 1 - α = 0,95
Solución
a)
• Hipótesis de trabajo: “La ganancia media de peso de los animales alimentados con la ración B supera
la ganancia media de peso de los animales alimentados con ración A”
• Verificación de las condiciones para elegir la mejor variable pivotal:
- XA y XB son variables aleatorias independientes.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
10
- Se extrajeron dos muestras aleatorias XA1, XA2, …,XAn1 e XB1, XB2, …,XBn2
-Ambas variables tiene la misma varianza poblacional aunque ésta tiene un valor desconocido.
-XA ∼ N (µA, σ
2) y XB ∼ N (µB, σ
2)
En este caso, a diferencia del ejercicio anterior, en el enunciado se asegura la normalidad de ambas
variables, por estudios anteriores. Por lo tanto no es necesaria la prueba de Shapiro–Wilks para verifi-
carla. Por otro lado la condición de independencia también se cumple por la forma en que se realizó el
experimento: a un grupo de cerdos, tomado al azar, se lo alimenta con la ración A y al otro grupo, tam-
bién tomado al azar, se lo alimentó con la ración B.
• Hipótesis estadísticas: La hipótesis de trabajo simbólicamente nos lleva a la expresión: B Aµ µ> , por
lo tanto esta corresponde a la hipótesis del investigador que ubicamos en la hipótesis alternativa.
0
1
:
:
B A
B A
H
H
µ µ
µ µ
≤
>
nuevamente, existen diversas formas de plantear la misma hipótesis, como por ejemplo:
0
1
: 0
: 0
B A
B A
H
H
µ µ
µ µ
− ≤
− >
y otras más. En este caso, se trabajará con la segunda expresión y se concluirá para esta expresión:
0
1
: 0
: 0
B A
B A
H
H
µ µ
µ µ
− ≤
− >
• Nivel de significación: α=0,05
• Variable pivotal: En este caso, como en el ejercicio anterior, se está realizando un test para la
diferencia de medias poblacionales, por lo tanto hay dos opciones para la variable pivotal (Z o t-Student).
Como las varianzas poblacionales son desconocidas no se puede utilizar la variable Z, por lo tanto se
utilizará la variable pivotal t de Student.
En Estadística Analítica, al comparar dos medias poblacionales en poblaciones independientes,
trabajaremos con dos tipos de variables pivotales con distribución t de Student dependiendo del
conocimiento de la igualdad de las varianzas poblacionales (será un valor desconocido pero igual a ambas
varianzas poblacionales). Si se conoce que σA
2=σB
2 entonces la fórmula a utilizar es:
( ) ( )
( )2~
1 1 A B
B A B A
n n
a
A B
x x
t t
s
n n
µ µ
+ −
− − −
=
+
Donde sa es la raíz cuadrada de la estimación de la varianza amalgamada, es decir que la varianza
muestral amalgamada es un promedio ponderado entre la varianza muestral de la variable XA y la varianza
muestral de la variable XB, y estima a la única varianza poblacional que se desconoce, σ 2.
• Región crítica: Observando la hipótesis alternativa planteada se deduce que la región crítica es
unilateral derecha (es decir que se rechaza la hipótesis nula a valores grandes de la variable pivotal). Se
llega a esta conclusión analizando que si 0B Aµ µ− > , entonces, en la mayoría de los casos debería ser
0B Ax x− > , lo que hará que el numerador de por resultado un número positivo y el denominador
siempre es positivo (desvío estándar poblacional) así que el cálculo de la VP será positivo en la mayoría
de los casos en que se cumpla la hipótesis alternativa, esto me indica que la región crítica es unilateral
derecha. El valor crítico que se utiliza es 2;1 10 11 2;0,95 19;0,95 1,729A Bn nt t tα+ − − + −= = = , por lo tanto la región
crítica es: 1,729t ≥ . Gráficamente:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
11
• Regla de decisión: Rechazo H0 si 1,729
oH
t ≥ y no rechazo H0 si 1,729
oH
t <
• Cálculo: Para obtener el valor calculado del estadístico de prueba, hay que realizar ciertos cálcu-
los auxiliares (
2
A B aX ; X y S ) utilizando las fórmulas habituales para las medias y las varianzas muestra-
les, y la siguiente fórmula para la varianza amalgamada:
2 2
2 ( 1) ( 1)
2
A A B B
a
A B
n s n s
s
n n
− + −=
+ −
Se obtuvo: 2 226,3 ; 27,91 ; 4,90 ; 3,69A B A Bx x s s= = = = y
2 (9)4,90 (10)3,69 44,1 36,9 4,26
10 11- 2
as
+ += =
+
=
19
por lo tanto 2,06as =
Reemplazando estos valores en la fórmula de la variable pivotal queda:
( ) ( ) ( )
0
27,91 26,3 0 1,61 1,61 1,61
1,78
2,06*0, 44 0,9061 1 1 1 21
2,06 2,06
10 11 110
B A B A
H
a
A B
x x
t
s
n n
µ µ− − − − −
= = = = = =
+ +
Como
0
1,78Ht = y utilizando la regla de decisión se rechaza la hipótesis nula ya que 1,78 es mayor
que 1,729.
• Conclusión: Con un nivel de significación del 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula (Ho: µB - µA ≤ 0), por lo tanto, la diferencia entre la media poblacional de la ganancia de peso
de los cerdos alimentados con la ración B y la media poblacional de la ganancia de peso de los cerdos
alimentados con la ración A es mayor a cero, en estas poblaciones de cerdos de 3 meses de raza
Yorkshire del norte de la provincia de Buenos Aires.
• Respuesta: Se puede suponer, al 5%, que la ganancia media poblacional del peso de los cerdos
alimentados con la ración B supera significativamente a la ganancia media poblacional del peso de los
cerdos alimentados con la ración A en esta población de cerdos Yorkshire de 3 meses de edad del nor-
te de la provincia de Bs. As.
Para este problema, la salida de InfoStat correspondiente es:
Prueba T para muestras Independientes
Gr(1) Gr(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p prueba
{A} {B} 10 11 26,30 27,91 0,6623 -1,78 0,0452 Unilat
Nota: InfoStat compara grupos en orden alfabético, por lo cual la prueba es unilateral izquierda, o sea
que utiliza H1: µA-µB<0. Para la comparación es indistinta la forma en que se plantea la diferencia,
siempre que se respete el sentido de la misma. El valor de t observado es el mismo que obtuvimos al
aplicar la fórmula, pero de signo opuesto, por haber invertido el orden de la diferencia.
Si se presenta la salida de computadora, existe la opción de la regla de decisión y decisión con el valor
de T dado en la tabla así como también con el p-valor de la prueba (0,0452) comparándolo con el α
utilizado. Por ser un curso de introducción a la materia, la cátedra recomienda la regla de decisión y
decisión con el estadístico de contraste bajo la hipótesis nula, T.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
12
Como puede verse, al realizar la Prueba T para muestras independientes, también se realiza una
prueba para evaluar la Homogeneidad de Varianzas (luego se analizará en detalle en el resuelto 6), el
p-valor es 0,6623, por lo que se cumple este supuesto.
En este caso, en que la región crítica es unilateral
izquierda, el cálculo del p valor es:
p valor= P(t ≤ V.Calc.) = P (t19≤ -1,78)
Ahora, si consideramos la región crítica derecha que
planteamos al principio, el p valor se grafica y se calcula de la
siguiente forma, dado que la región crítica es unilateral
derecha:
p valor= P (t ≥ V.Calc) = P (t19≥ 1,78)
b) La fórmula del intervalo de 95% de confianza para la diferencia de medias se deduce de la distribución
de la variable pivotal:
2;1 /2 2;1 /2
1 1 1 1
( ) ;( )
A B A BB A n n a B A n n a
A B A B
x x t s x x t s
n n n n
α α+ − − + − −
− − + − + +
Reemplazando con los valores correspondientes queda:
( ) ( )
[ ] [ ] [ ]
10 11 2;0,975 10 11 2;0,975
1 1 1 1
27,91 26,3 *2,06 ; 27,91 26,3 *2,06
10 11 10 11
1,61 2,093*2,06*0,44; 1,61 2,093*2,06*0,44 1,61 1,90; 1,61 1,90 0,29; 3,51
t t+ − + −
− − + − + + =
= − + = − + = −
Por lo tanto el intervalo pedido es: [-0,29 Kg; 3,51 Kg]
Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,29 Kg; 3,51 Kg] cubra o con-
tenga a la diferencia entre la media poblacional de la ganancia de peso de los cerdos alimentados con la
ración B y la media poblacional de la ganancia de peso de los cerdos alimentados con la ración A, en es-
tas poblaciones de cerdos Yorkshire de 3 meses del norte de la provincia de Buenos Aires.
NOTA: Tener en cuenta que en este caso el IC no es equivalente a la prueba de hipótesis porque la
prueba es unilateral.
4) En un experimento referido al uso de la vitamina B12 en casos de anemia perniciosa durante el período
de remisión, se administró, por vía intramuscular, 30 µg de B12 a un total de 10 pacientes tomado al azar.
En ellos se midió la concentración de hemoglobina en sangre (mg%) en dos momentos, al inicio del
tratamiento y luego de tres meses. Los valores observados se muestran en la siguiente tabla:
Paciente 1 2 3 4 5 6 7 8 9 10
Inicial (I) 12,2 11,3 14,7 11,4 11,5 12,7 12,3 13,0 12,7 13,0
Hemoglobina
(mg%) Después de 3
meses (F, o final) 13,0 13,4 16,0 13,6 14,0 13,0 14,2 15,1 15,9 14,5
¿Hay aumento significativo de hemoglobina después del tratamiento al nivel del 5%?
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
13
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
D 10 -1,79 0,84 0,97 0,9425
Datos del problema:
• Variable en estudio:
D: diferencia entre la concentración de hemoglobina en sangre (en mg%) al inicio del tratamiento
con vitamina B12 y la concentración de hemoglobina en sangre (en mg%) después de tres meses del
tratamiento con vitamina B12, de un paciente con anemia perniciosa.
En símbolos: di = ii - fi
En la siguiente tabla están calculados los valores correspondientes a la diferencia planteada:
d i -0,8 -2,1 -1,3 -2,2 -2,5 -0,3 -1,9 -2,1 -3,2 -1,5
Nota: En este caso se utilizará: di = ii - fi, pero también se podría haber definido la variable como di =
fi - ii. La definición de esta variable debe quedar clara al comienzo de la resolución del ejercicio y debe
mantenerse a lo largo del mismo.
• Nivel de significación: α=0,05
Solución:
• Hipótesis de trabajo: “Hay aumento significativo del nivel de hemoglobina después del tratamiento”
Antes de plantear las hipótesis estadísticas hay que analizar las condiciones para elegir la mejor va-
riable pivotal para la situación planteada, ya que no es igual a las anteriores, dado que no hay indepen-
dencia entre las mediciones realizadas, ya que se realizaron dos veces sobre cada individuo, al inicio y al
finalizar los 3 meses de aplicado el tratamiento con vitamina B12. Por esta razón no se van a comparar las
medias en los diferentes tiempos, sino que se va a estudiar la media de la variable diferencia.
• Verificación de las condiciones: En este caso tenemos:
-I y F variables aleatorias no independientes.
- (I1,F1), (I2, F2), …, (In1, Fn2) muestra aleatoria de pares
-normalidad de la variable D definida como D1= I1-F1, D2= I2-F2,…, Dn= In-Fn .
La muestra aleatoria de pares se confecciona teniendo en cuenta a la independencia entre las diferentes
unidades experimentales que se cumple por el tipo de muestreo realizado. No confundir con “I y F no son
independientes” en la misma unidad experimental. Por lo tanto, la única condición que debemos verificar
es la normalidad de la variable D.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
14
( )
( )
2
0
2
1
: ;
: ;
D D
D D
H D se distribuye normal
H D no se distribuye normal
µ σ
µ σ
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
D 10 -1,79 0,84 0,97 0,9425
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como 0,9425 es mayor que 0,10, no se rechaza la hipótesis nula. Entonces, con un nivel de significación
del 10% no tengo evidencias suficientes para rechazar H0 ( ( )2 ;D DD se distribuye normal µ σ ), enton-
ces la diferencia entre la concentración de hemoglobina en sangre (mg%) al inicio del tratamiento con
vitamina B12 y la concentración de hemoglobina en sangre (mg%) luego de 3 meses de tratamiento con
vitamina B12 en pacientes con anemia perniciosa se distribuye normalmente en esta población de pacien-
tes con anemia perniciosa en estudio.
Simbólicamente ( )2~ ;D DD N µ σ
• Hipótesis estadísticas: si el tratamiento produce un aumento en el nivel de hemoglobina en
sangre, los niveles de hemoglobina medidos a los 3 meses deberían ser mayores que los medidos al
inicio del tratamiento, es decir que la variable D = I – F, tendría una media negativa. Simbólicamente
0Dµ < .
La definición de la hipótesis alternativa depende exclusivamente de la definición de la variable en
estudio, por esta razón debe quedar clara la forma en que se realiza la diferencia entre Ii y Fi.
Luego, las hipótesis estadísticas son:
0
1
: 0
: 0
D
D
H
H
µ
µ
≥
<
• Variable pivotal: Por ser una prueba de medias apareadas la opción más usual para la variable
pivotal es una t de Student (difícilmente se conocerá la varianza de la variable diferencia) con la
siguiente fórmula: ( )1~
D
n
D
d
t t
s
n
µ
−
−= . Observar que esta expresión es la misma que la utilizada en
Elementos de Estadística para estudiar una población, la variable estudiada es D, su media muestral
es d y su varianza muestral es 2Ds .
• Región crítica: Observando la hipótesis alternativa planteada, se ve que la región crítica es
unilateral izquierda, con valor crítico: 1;0,05 10 1;0,05 9;0,95 1,83nt t t− −= = − = − (los grados de libertad son 10
- 1, porque hay 10 diferencias). Se llega a esta conclusión analizando que si 0Dµ < , entonces, en la
mayoría de los casos debería ser 0d < , lo que hará que el numerador de por resultado un número
negativo y el denominador siempre es positivo (desvío estándar poblacional) así que el cálculo de la
VP será negativo en la mayoría de los casos en que se cumpla la hipótesis alternativa, esto me indica
que la región crítica es unilateral izquierda. Por lo tanto, la región crítica queda definida como
1,83t ≤ − . Gráficamente:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
15
• Regla de decisión: Rechazo H0 si 1,83
oH
t ≤ − y no rechazo H0 si 1,83
oH
t > −
• Cálculo: Para obtener el valor calculado del estadístico de prueba hay que realizar ciertos cálculos
auxiliares (
2
Dd y s ), utilizando las fórmulas habituales para la media muestral y la varianza muestral,
sobre las 10 diferencias.
Utilizando los valores calculados para di (ver la tabla correspondiente al plantear la forma de realizar la
misma), se obtuvo 1,79d = − y 2 0,71Ds = , reemplazando en la fórmula de la variable pivotal:
1,79 1,79
6,7
0,84 0, 26
10
oH
t
− −= = = − .
Como el valor observado –6,7 es menor que –1,83, vale decir pertenece a la región crítica, se rechaza
la hipótesis nula.
• Conclusión: Con un nivel de significacióndel 5% tengo evidencia suficiente para rechazar la
hipótesis nula ( 0Dµ ≥ ), por lo tanto la media poblacional de las diferencias entre la concentración de
hemoglobina en sangre (mg%) de pacientes con anemia perniciosa al inicio del tratamiento y la
concentración de hemoglobina en sangre (mg%) de pacientes con anemia perniciosa después de tres
meses de iniciado el tratamiento con vitamina B12 es menor que cero, en la población de pacientes con
anemia perniciosa. Por lo cual la hemoglobina aumenta significativamente luego del tratamiento con
vitamina B12.
• A continuación se da la salida del programa InfoStat para este problema
Prueba T para un parámetro Valor del parámetro pr obado: 0
Variable n Media DE T p(Unilateral I)
D 10 -1,79 0,84 -6,72 <0,0001
Nota: con un p-valor tan pequeño puede decirse que ésta es una decisión “fuerte“.
Para el caso de que la región crítica sea unilateral
izquierda, el cálculo del p valor es:
P-valor= P (t ≤ V.Calc.)
Nota: Al comienzo del ejercicio se definió la variable diferencia como: di = ii - fi, Se recomienda realizar
de nuevo la prueba, pero definiendo de la otra forma a la variable y observar qué se modifica y qué
permanece igual.
5) Se desea estudiar si una nueva dieta logra un incremento significativo en el peso con respecto a una
dieta normal en conejos de raza Nueva Zelandia. Se seleccionan 10 pariciones, de cada una de ellas
se extraen dos conejos machos de 120 días de vida, asignando de manera aleatoria, la forma de ali-
mentación. Los resultados fueron los siguientes:
Par 1 2 3 4 5 6 7 8 9 10
Peso dieta normal (kg) (X1) 3,9 3,8 4,2 4,8 4 3,5 3,5 4,3 4,1 4,2
Peso dieta nueva (kg) (X2) 3,7 4,5 3,8 4,1 4,2 4,3 3,4 4 6,8 4,6
Utilizando un nivel de significación del 5% pruebe la hipótesis planteada por los investigadores.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
16
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Dieta norm 10 4,03 0,39 0,94 0,7055
Dieta nueva 10 4,34 0,94 0,78 0,0072
D(nueva-norm) 10 -0,31 0,97 0,84 0,0738
Datos del problema:
• Variables en estudio:
Para poder decidir cual es la variable necesitamos analizar si hay independencia o no entre el peso
de un conejo con la nueva dieta y el peso de un conejo con la dieta normal. Como los animales
que se pesaron son de la misma camada entonces comparten las mismas características
genéticas, por lo tanto hay dependencia entre dichas variables. En consecuencia, elegimos la
variable diferencia porque tenemos una muestra apareada.
D (X2-X1)= diferencia entre el peso de un conejo alimentado con una dieta nueva y el peso de su
gemelo alimentado con una dieta normal.
• Tamaño de muestras: 10=n1= n2
• Nivel de significación: α=0,05
Solución:
Se pide una prueba que compare las medias poblacionales y para empezar deberíamos testear si
cumple el supuesto teórico de normalidad de la variable en estudio. Para lo cual se aplica la prueba de
Shapiro Wilks:
( )
( )
2
0
2
1
: ;
: ;
D D
D D
H D se distribuye normal
H D no se distribuye normal
µ σ
µ σ
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como p-valor=0,0738≤0,10 se rechaza H0. Por lo tanto, con un nivel de significación del 10%, tengo
evidencias suficientes para rechazar H0 ( ( )2 ;D DD se distribuye normal µ σ ), entonces la diferencia
entre el peso de los conejos alimentados con una dieta nueva y el peso de los conejos alimentados con
una dieta normal, no se distribuye normalmente en esta población de conejos machos Nueva Zelandia
de 120 días en estudio.
Como la distribución de la variable no es normal no podemos utilizar las dos variables pivotales que se
basan fuertemente en esta condición que son la Z y la t. Por otro lado, el tamaño de muestra es menor a
30, lo que retira la posibilidad de utilizar el teorema central del límite, por lo que no podemos usar como
variable pivotal a la Z correspondiente. Lo que sí se puede decir, es que la variable con la que estamos
trabajando es por lo menos ordinal al tratarse de una variable numérica, suponemos que posee una
distribución simétrica (no realizaremos un test para este supuesto aunque sí podría verse una idea
intuitiva en un box-plot), y cada par es independiente de los demás, por esta razón podemos utilizar el
test no paramétrico de Wilcoxon para muestras apareadas, ya que cumple con las condiciones
pertinentes. En resumen:
- X1 y X2 variables aleatorias no independientes.
- X e Y son de escala al menos ordinal.
- (X11,X21), (X12, X22), …, (X1n, X2n) muestra aleatoria de pares.
- Se define la variable D como D1= X21-X11, D2= X22-X12, …, Dn= X2n- X1n con distribución desconocida pero
forma simétrica y de única mediana.
- n<30.
Desarrollemos el test pedido:
Hipótesis de trabajo: Los conejos sometidos a una dieta nueva muestran un incremento significativo en
el peso con respecto a una dieta normal
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
17
Hipótesis estadísticas:
0
1
: 0
: 0
D
D
H
H
θ
θ
≤
>
Primero, debemos calcular los valores correspondientes a la “diferencia entre el peso de un conejo
alimentado con una dieta nueva y el peso de su gemelo alimentado con una dieta normal”, en la
muestra analizada.
A cada valor de estas diferencias se deberá restarle el correspondiente ΘD bajo H0 (en nuestro caso
es de 0).
Luego, debemos obtener el valor absoluto de esta diferencia (AbsD), y asignar un rango a estos
valores, diferenciando los rangos provenientes de diferencias negativas y diferencias positivas.
Recordemos que, en caso de que dos valores de D - θ posean valores absolutos iguales, los rangos
correspondientes a cada una se promedian y se coloca el promedio de los rangos empatados a cada
valor.
Dieta nueva Dieta norm D=Nuev-Norm D - θ Abs( D) Rango (-) Rango (+)
3,7 3,9 -0,2 -0,2 0,2 2,5
4,5 3,8 0,7 0,7 0,7 7,5
3,8 4,2 -0,4 -0,4 0,4 5,5
4,1 4,8 -0,7 -0,7 0,7 7,5
4,2 4 0,2 0,2 0,2 2,5
4,3 3,5 0,8 0,8 0,8 9
3,4 3,5 -0,1 -0,1 0,1 1
4 4,3 -0,3 -0,3 0,3 4
6,8 4,1 2,7 2,7 2,7 10
4,6 4,2 0,4 0,4 0,4 5,5
Luego debemos calcular el valor de la variable pivotal bajo H0.
Llamemos T+ a la suma de rangos provenientes de valores de la variable (D – θ) positivos. En este
caso: T+ = 7,5 + 2,5 + 9 + 10 + 5,5 = 34,5
T+ tendrá una distribución exacta Tn cuyos valores críticos se encuentra en la tabla de “Prueba de
rangos con signos de Wilcoxon”. En nuestro ejemplo: VP: T+ ~ T10
Valores Críticos: la tabla sólo ofrece los valores críticos inferiores para cuando se trabaja a una cola o
a dos colas con ciertos niveles de significación. Si se necesita algún valor crítico superior, se deberá
hallar mediante la fórmula:
( )
;1 ;
1
2
n n
n n
T Tα α−
+
= − .
En nuestro caso, la región crítica es unilateral derecha, por lo que tendremos que usar la fórmula
anterior para calcular el valor crítico superior. Buscamos en la tabla el valor crítico inferior, T10; 0,05 = 11,
y aplicamos la fórmula
( ) ( )
10;0.95 10;0.05
1 10 10 1
11 44
2 2
n n
T T
+ +
= − = − =
La región crítica, es: T+ ≥ 44
Regla de decisión: Rechazo H0 si 44
0
≥+HT
No rechazo H0 si 44
0
<+HT
Decisión: como 5,34
0
=+HT y 34,5 < 44, entonces no rechazo H0.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
18
Conclusión : Con un nivel de significación del 5%, no tengo evidencias suficientes para rechazar H0
( 0Dθ ≤ ). Por lo tanto, se puede decir que la mediana poblacional de la diferencia entre el peso de los
conejos alimentados con una dieta nueva y el peso de sus pares alimentados con una dieta normal es
menor o igual a cero en esta población de conejos machos de raza Nueva Zelandia en estudio.
Al mismo nivel se puede suponer que la nueva dieta no logra un incremento de peso significativo en losconejos de la raza Nueva Zelanda en estudio.
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según
la siguiente tabla:
H0 H1 Región crítica
00 : θθ =H 01 : θθ ≠H ( )
2/;2/;
2
1
αα nn T
nn
TóTT −+≥≤ ++
00 : θθ ≥H 01 : θθ <H α;nTT ≤
+
00 : θθ ≤H 01 : θθ >H ( )
α;
2
1
nT
nn
T −+≥+
6) En las poblaciones de adultos y adolescentes que veían un programa de televisión los sábados a la
noche se tomaron sendas muestras al azar de 400 y 600 individuos, respectivamente. A la pregunta “si
realmente les gustaba el programa”, 100 adultos y 300 adolescentes, de estas muestras, contestaron
que sí.
a) Estimar puntualmente y con una confianza del 95% la diferencia entre las proporciones de adultos y
adolescentes que ven el programa y les gusta.
b) Probar, al 5%, si ambas proporciones son iguales.
Datos del problema
• Variable en estudio:
X1: Cantidad de adultos que ven el programa los sábados a la noche y les gusta, en una muestra de 400.
X2: Cantidad de adolescentes que ven el programa los sábados a la noche y les gusta, en una muestra de
600.
• Tamaños de muestras: n1 = 400; n2 = 600
• Nivel de confianza: 1 – α = 0,95.
Solución :
a) Antes de comenzar a construir el intervalo hay que verificar las condiciones para arribar a la variable
pivotal mas indicada.
• Condiciones: En este caso, a diferencia de los ejercicios anteriores, la condición que se le debe
pedir a las distribuciones de las variables es que ambas tengan distribución binomial. La verificación de
esta condición es más sencilla que la verificación de la normalidad, ya que solamente hay que observar
que las variables cumplan con las condiciones de una variable binomial, es decir:
� Que cada repetición del experimento tenga dos resultados posibles (éxito y fracaso). Si lo aplica-
mos al ejemplo veremos que las dos posibles respuestas que podemos obtener, al encuestar a una
persona, son: “que le guste el programa del sábado a la noche” y “que no le guste el programa del sá-
bado a la noche”.
� Que los resultados (éxito y fracaso) sean mutuamente excluyentes en una misma repetición. Con-
textualizando, que sean mutuamente excluyentes quiere decir que tanto un adulto como un adolescen-
te pueden elegir sólo una de las dos respuestas posibles: “que le guste el programa del sábado a la
noche” o “que no le guste el programa del sábado a la noche”
� Que los resultados (éxito y fracaso) sean independientes de repetición en repetición. En el contex-
to del problema, quiere decir que la respuesta de un adulto o de un joven no modifica la probabilidad
de una posible respuesta de otro adulto o joven respectivamente, en otra repetición del experimento al
azar.
� Que el número de repeticiones esté prefijado de antemano, en este caso 400 adultos y 600 ado-
lescentes encuestados, y que la probabilidad de éxito sea constante a lo largo de todas las repeticio-
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
19
nes del experimento aleatorio, ¼ en el caso de los adultos y ½ en el caso de los adolescentes (estima-
ciones puntuales especificadas en el siguiente inciso).
En este caso ambas variables cumplen con estas condiciones.
• Estimación puntual: Lo que se quiere estimar es:”la diferencia entre las proporciones
poblacionales de adultos y adolescentes que ven el programa y les gusta”, simbólicamente: p1-p2. Por
lo tanto la estimación puntual de esta diferencia es la diferencia entre las proporciones estimadas,
1 2
ˆ ˆp p− .
1
100
ˆ 0,25
400
cantidad de adultos que ven el programa los sábados a la noche y les gusta
p
cantidad total de adultos
= = =
1
300
ˆ 0,5
600
cantidad de adolescentes que ven el programa los sábados a la noche y les gusta
p
cantidad total de adolescentes
= = =
Por lo tanto la estimación puntual es: 1 2ˆ ˆ 0,25 0,5 0,25p p− = − = −
• Intervalo de confianza: La fórmula del intervalo de confianza para la diferencia de proporciones se
deduce de la única variable pivotal posible, cuya fórmula es:
( ) ( )
( ) ( )
( )1 2 1 2 1 21 2
1 21 1 2 2
1 2
ˆ ˆ
ˆ ˆ0;1
ˆ ˆ ˆ ˆ1 1
d
p p p p x x
Z N donde p y p
n np p p p
n n
− − −
= → = =
− −
+
Por lo tanto la fórmula del intervalo es:
( ) ( ) ( ) ( ) ( ) ( )1 1 2 2 1 1 2 21 2 1 21 1
2 2
1 2 1 2
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ1 1 1 1
ˆ ˆ ˆ ˆ;
p p p p p p p p
p p z p p z
n n n n
α α− −
− − − −
− − + − + +
Reemplazando:
( ) ( ) ( ) ( ) ( ) ( )
[ ]
0, 25 1 0, 25 0,5 1 0,5 0, 25 1 0,25 0,5 1 0,5
0, 25 0,5 1,96 ; 0,25 0,5 1,96
400 600 400 600
0,1875 0, 25 0,1875 0, 25
0, 25 1,96 ; 0,25 1,96
400 600 400 600
0,25 1,96*0,03; 0,25 1,96*0,03 0, 25 0,0588; 0, 25
− − − −
− − + − + + =
= − − + − + + =
= − − − + = − − −[ ] [ ]0,0588 0,31; 0,19+ = − −
• Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,31;-0,19] cubra o
contenga a la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a
la noche y les gusta, y la proporción poblacional de adolescentes que ven el programa los sábados a la
noche y les gusta, en estas poblaciones de adultos y adolescentes que ven el programa los sábados a
la noche.
b) Las hipótesis estadísticas son: H0: p1-p2=0 versus H1: p1-p2≠0
El nivel de significación es 5%, siendo el estadístico de contraste:
( ) ( )
( )
( )1 2 1 2 1 2 1 21 2
1 2 1 2
1 2
ˆ ˆ
ˆ ˆ ˆ0;1 ;
1 1
ˆ ˆ1
d
p p p p x x x x
Z N donde p p y p
n n n n
p p
n n
− − − += → = = =
+
− +
Nota: como p1-p2=0 ⇒ p1=p2 bajo el supuesto de la hipótesis nula, entonces se calcula p̂ como un
promedio ponderado entre 1p̂ y 2p̂ .
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
20
Como p1-p2≠0 por la hipótesis alternativa, se puede suponer que debería ser 1p̂ - 2p̂ ≠0, lo que no ase-
gura el signo del numerador de la variable pivotal pudiendo ser este tanto positivo como negativo y el
denominador es siempre positivo por ser la estimación de un desvío estándar poblacional, por lo tanto,
el resultado del cálculo de la variable pivotal para una cierta muestra podrá ser tanto negativo como
positivo. Por ello, la región crítica es bilateral, y está formada por los valores de Z mayores o iguales a
1,96, y los menores o iguales a -1,96.
La regla de decisión es: RECHAZO H0 si Zobs ≥ 1,96 o Zobs ≤ -1,96
NO RECHAZO H0 si -1,96 < Zobs < 1,96
1 2
1 2
100 300
ˆ 0, 4
400 600
x x
p
n n
+ += = =
+ +
( )
( )
0,25 0,5 0 0,25 0,25
7,81
0,03211 1
0,24*0,4 1 0,4
240400 600
Obsz
− − − −= = = = −
− +
Como zobs = -7,81 la decisión es rechazar H0
En esta situación (región crítica bilateral) el p valor se grafica y se calcula de la siguiente forma:
p valor= 2*(min { P(Z ≤ -7,81) P(Z ≥ -7,81) } ) = 2* P(Z ≤ -7,81)
• Con un nivel de significación del 5%, hay evidencias suficientes para rechazar H0 (p1-p2=0), por lo
tanto la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a la no-
che y les gusta, y la proporción poblacional de adolescentes que ven el programa los sábados a la noche y
les gusta, es distinta de cero en estas poblaciones de adultos y adolescentes que ven el programa los
sábados a la noche.
7) Basándose en el mismo texto y los mismos datos del problema 3 con excepción de la igualdad de las
varianzas poblaciones, responda los siguientes ítems:
a.- Estimar el cociente entre las varianzas, puntualmente y con un nivel de confianza del 95%.
b.- Los nutricionistas que desarrollaron la nueva ración (B) sostienen que además esta genera mayor
uniformidad en el crecimiento. Probar la hipótesis sugerida con un nivel de significación del 5%.
(Nota : “Mayor uniformidad” hace referencia a la obtención de ganancias de peso parecidas dentro del
lote, con baja dispersión, siendo ésta una característica deseada por los productores. También podría
habersedicho que el crecimiento generado por la ración B es más homogéneo que el crecimiento
generado por la ración A)
Solución: Los datos son los mismos que los del problema 3 y el análisis de las condiciones para la
elección de la variable pivotal nos indica que:
- XA y XB son variables aleatorias independientes.
- Se extrajeron dos muestras aleatorias XA1, XA2, …,XAn1 e XB1, XB2, …,XBn2
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
21
-XA ∼ N (µA, σ
2) y XB ∼ N (µB, σ
2)
Entonces:
a)
• Estimación puntual: se pide estimar puntualmente el cociente entre las varianzas, por ejemplo, sim-
bólicamente
2
2
A
B
σ
σ , cuyo estimador puntual es el cociente de las varianzas muestrales, es decir
2
2
A
B
s
s
Utilizando la fórmula de la varianza muestral se obtiene:
( ) ( ) [ ]
2 2
12 2
1
1 1
2631 1 1 44,1
6961 6961 6916,9 4,9
1 9 10 9 9
i
A i
x
s x
n n
= − = − = − = =
−
∑
∑
( ) ( ) [ ]
2 2
22 2
2
2 2
3071 1 1 36,91
8605 8605 8568,09 3,69
1 10 11 10 10
i
B i
x
s x
n n
= − = − = − = =
−
∑
∑
Por lo tanto el estimador puntual del cociente entre σA
2 y σB
2 es:
2
2
4,9
1,3279
3,69
A
B
s
s
= =
(Nota : En este caso se estima el cociente entre la varianza poblacional de A y la varianza poblacional
de B, pero también podríamos resolver este ejercicio haciendo el cociente inverso, dado que en el
enunciado no hay ninguna orientación en especial para realizarlo.)
• Intervalo de confianza: La fórmula del intervalo de confianza para el cociente de varianzas se de-
duce de la variable pivotal que se utiliza para estudiar el cociente de varianzas, cuya fórmula es:
2 2
2 2
( 1), ( 1) ( 1), ( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
s s
s
F F F F
s
σ
σ
σ σ
− − − −= =
La distribución se grafica de la siguiente manera:
Donde:
( ) ( )1 1 , 1 ;
2
A Bn n
F F α− −
= y
( ) ( )2 1 , 1 ;1
2
A Bn n
F F α− − −
=
Como en la tabla de F de Snedecor que se usa en el presente curso el valor de F1 no está tabulado,
para conocerlo es necesario hacer uso de la siguiente igualdad:
( ) ( )
( ) ( )
1 , 1 ;
2
1 , 1 ;1
2
1
A B
B A
n n
n n
F
F
α
α
− −
− − −
=
Por ejemplo, en el problema que estamos resolviendo:
9,10;0,975 9,10;0,025
10,9;0,975
1 1
3,78; 0, 25
3,96
F F
F
= = = =
El intervalo se construye basándose en las siguientes igualdades:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
22
2
2
2
( 1),( 1); ( 1),( 1);1
2 2
2
1
A B A B
A
B
n n n n
A
B
s
s
P F Fα α ασ
σ
− − − − −
≤ ≤ = −
2
2
2
( 1),( 1); ( 1),( 1);1
22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
sF F
s
α α
σ
σ α
− − − − −
≥ ≥ = −
2
2
2
( 1),( 1);1 ( 1),( 1);
22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
sF F
s
α α
σ
σ α
− − − − −
≤ ≤ = −
2 2
2 2 2
2
( 1),( 1);1 ( 1),( 1);
2 2
1
A B A B
A A
B A B
B
n n n n
s s
s s
P
F Fα α
σ α
σ
− − − − −
≤ ≤ = −
Entonces, en nuestro problema:
2
2
1,3279 1,3279
3,78 0, 25
A
B
σ
σ
≤ ≤
2
2
0,3513 5,3116A
B
σ
σ
≤ ≤
• Conclusión: Con una confianza del 95% se espera que el intervalo [0,35136; 5,3116] cubra al
cociente entre la varianza poblacional de la ganancia de peso de los cerdos alimentados con la ración A
durante 30 días, y la varianza poblacional de la ganancia de peso de los cerdos alimentados con la ración
B durante 30 días, en estas poblaciones de cerdos Yorkshire de 3 meses de edad del norte de la provincia
de Buenos Aires en estudio.
b)
• Hipótesis de trabajo: “la nueva ración genera mayor uniformidad en el crecimiento”.
• Condiciones para la elección de la variable pivotal: Ya fueron verificados en el ejercicio 3 las con-
diciones de independencia y normalidad de las variables “ganancia de peso de los cerdos ali-
mentados con la ración A durante 30 días” y “ganancia de peso de los cerdos alimentados con la
ración B durante 30 días”.
• Hipótesis estadísticas: Si se quiere probar que la nueva formulación es más uniforme, se quiere
probar que la nueva formulación es menos variable que la ración A, simbólicamente:
2 2
A Bσ σ> , esta
expresión no contiene el signo igual por lo que corresponde a la hipótesis alternativa. Entonces las
hipótesis quedan:
2 2
0
2 2
1
:
:
A B
A B
H
H
σ σ
σ σ
≤
>
o equivalentemente
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H
σ
σ
σ
σ
≤
>
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
23
al igual que en las demás pruebas se debe plantear solo un par de hipótesis y mantenerlas a lo largo de
toda la prueba, en esta caso vamos a trabajar con
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H
σ
σ
σ
σ
≤
>
• Nivel de significación: α=0,05
• Variable pivotal: Existe una única opción al elegir la variable pivotal en esta prueba, la F de Snedecor,
cuya fórmula es:
2 2
2 2
( 1),( 1) ( 1),( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
s s
s
F F F F
s
σ
σ
σ σ
− − − −= =
• Región crítica: Observando la hipótesis alternativa, se ve que la región crítica es unilateral derecha.
Se llega a esta conclusión analizando que si
2
2
1A
B
σ
σ
> , entonces, en la mayoría de los casos debería ser
2
2
1A
B
s
s
> , en consecuencia se rechaza cuando la varianza de la variable A es mayor que la varianza de
la variable B, o sea, cuando el cociente sea grande lo que implica una región critica unilateral derecha.
El valor crítico que la determina debe buscarse en la tabla de la distribución de F de Snedecor. Éste es:
( ) ( ) ( ) ( ) ( )1 , 1 ;1 10 1 , 11 1 ;1 0,05 9,10 ;0,95 3,02A Bn nF F Fα− − − − − −= = = . Por lo cual, la región crítica es 3,02F ≥
• Regla de decisión: Rechazo H0 si 0 3,02HF ≥ y no rechazo H0 si 0 3,02HF <
• Cálculo del estadístico de prueba: Todos los valores necesarios ya fueron calculados, por lo tanto,
reemplazando en la fórmula, se obtiene:
Observar que el cociente de las varianzas poblacionales fue
reemplazado por 1, porque el cálculo se hace bajo la hipótesis nula que
plantea la igualdad de las varianzas. Como 1,3279 es menor que 3,02,
No se rechaza la hipótesis nula.
• Conclusión: Con un nivel de significación del 5% no hay evidencia suficiente para rechazar H0
(
2
0 2
: 1A
B
H
σ
σ
≤ ). Esto significa que el cociente entre la varianza poblacional de la ganancia de peso de los
cerdos Yorkshire del norte de la provincia de Buenos Aires de 3 meses de edad alimentados con la
ración A y la varianza poblacional de la ganancia de peso de los cerdos Yorkshire del norte de la
provincia de Buenos Aires de 3 meses de edad alimentados con la ración B, es menor o igual a 1, en
estas poblaciones de cerdos Yorkshire de 3 meses de edad del norte de la provincia de Buenos Aires en
estudio. Por lo tanto, al mismo nivel, no es cierta la hipótesis de los nutricionistas.
Nota: a continuación se da la salida del programa InfoStat para este problema. Observar que los
resultados son los mismos que se obtuvieron anteriormente.
Prueba F para igualdad de varianzas
Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba
1 2 10 11 4.900 3.691 1.328 0.3312 Unilat D
8) En un criadero el dueño quiere estudiar si el alimento N produce un menor engorde en los cerdos
que el alimento T. Para ello a un grupo de cerdos seleccionados aleatoriamente se les administró el
alimento N y a otro grupo el alimento T y al cabo de un tiempo se registraron los aumentos de peso
(kg).
0
2
2
2
2
4,9
3,69
1,3279
1
A
B
H
A
B
s
s
F
σ
σ
= = =
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
24
Alimento T 70 62 85 85 70 65 82 89 88
Alimento N 81 90 90 86 88 83 89 85 94 95 100
Probar la sospecha del dueño del criadero a un nivel del5%.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
T 9 77,33 10,51 0,84 0,0801
N 11 89,18 5,56 0,96 0,8858
Datos del problema:
• Variables:
T: “Aumento de peso, en kg, de un cerdo que recibió el alimento T”
N: “Aumento de peso, en kg, de un cerdo que recibió el alimento N”
• Tamaño de las muestras: nT= 9 y nN= 11
• Nivel de significación: α=0,05
Solución:
Como primer paso debemos verificar si las muestras en estudio son independientes o contienen datos
apareados. En este caso, como los cerdos provienen de grupos diferentes y al no contar con informa-
ción adicional que indique que comparten características genéticas consideraremos que las muestras
son independientes.
Para verificar la condición de normalidad, realizamos el test de Shapiro-Wilks:
( )
( )
2
0 T
2
1 T
: ~N ;
: no se distribuye normalmente ;
T T
T T
H X
H X
µ σ
µ σ
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como el p-valor es de 0,0801<0,10 se rechaza la hipótesis nula y concluye: Con un nivel de significa-
ción del 10%, tengo evidencias suficientes para rechazar la hipótesis nula (XT∼N(µT;σT
2)) por lo tanto el
aumento de peso, en kg, de los cerdos que recibieron el alimento T no se distribuye normalmente en
esta población de cerdos de cierto criadero en estudio.
( )
( )
2
0 N
2
1 N
: ~N ;
: no se distribuye normalmente ;
N N
N N
H X
H X
µ σ
µ σ
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como el p-valor es de 0,8858>0,10 no se rechaza la hipótesis nula y concluye: con un nivel de signifi-
cación del 10%, no tengo evidencias suficientes para rechazar la hipótesis nula (XN∼N(µN;σN
2)) por lo
tanto el aumento de peso, en kg, de los cerdos que recibieron el alimento N se distribuye normalmente
en esta población de cerdos de cierto criadero en estudio.
No se cumple la condición de normalidad de alguna de las variables en estudio por lo que no podemos
realizar una prueba t para muestras independientes, debemos realizar un análisis no paramétrico, la
prueba de Mann-Whitney . Recordemos cuáles son las condiciones para aplicar dicho test:
- XT y XN deben ser variables aleatorias independientes.
- XT1, XT2, …,XT nT e XN1, XN2, …,XN nN deben ser muestras aleatorias.
- nT<30 y/o nN<30.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
25
- las variables en estudio XT y XN deben ser de escala por lo menos ordinal.
- XT y XN deben poseer una única mediana y distribuciones similares
Como estas condiciones se cumplen, desarrollaremos el correspondiente test de Mann-Whitney
Para plantear las hipótesis estadísticas correspondientes, notemos que las muestras no poseen el
mismo tamaño (nT= 9 y nN= 11). Denominaremos como muestra 1 a aquella que posee la menor
cantidad de observaciones. En caso de empate, se elige indistintamente. Para este ejemplo, el
subíndice 1 corresponde a los cerdos que recibieron el alimento T y consecuentemente, el subíndice 2
corresponde a los cerdos que recibieron el alimento N.
Como se desea probar que el alimento N produce menor aumento de peso que el T, esto se ve
reflejado en sus medianas poblacionales de la siguiente forma:
θ2 < θ1 o equivalentemente θ1 > θ2
Como en las hipótesis se debe respetar el orden θ1 − θ2 entonces, las mismas quedan planteadas de
la siguiente forma:
H0: θ1 − θ2 ≤ 0
H1: θ1 − θ2 > 0
Se combinan ambas muestras en una única muestra ordenada y luego asignamos a cada dato su ran-
go (posición) según su valor, sin tener en cuenta de cuál de las muestras proviene.
Luego se registra T1 = Suma de rangos de la muestra designada como
muestra 1.
T1 = 3,5+1+9+9+3,5+2+6+14,5+12,5 = 61
Si los tamaños de muestra no superan a 30, entonces se debe usar la tabla
de valores críticos del estadístico U de Mann Whitney. Este estadístico es
( )1 1
1
1
2
n n
U T
+
= −
Variable pivotal:
( )
( )1 2
1 1
1 ;
1
- ~
2
n n
n n
U T U
+
=
Valores críticos:
La tabla sólo trae los valores críticos inferiores trabajando a una o dos colas con ciertos niveles de signifi-
cación. En este caso, la región crítica es unilateral derecha ya que la hipótesis alternativa plantea que
θ1 > θ2 . En consecuencia, buscamos el valor crítico considerando que 1 9n = y 2 11n = , y el nivel de
significación es 5% (a una cola). Observando en la tabla correspondiente U9;11, al 5% de significación y a la
prueba de una cola obtenemos U9,11; 0.05=27
Para hallar el valor crítico superior, se utiliza la fórmula:
1 2 1 2n ,n ; /2 n ,n ; 1- /2 1 2
U U n nα α+ = ⋅
9,11;0.95
9,11;0.95
27 9 11
9 11 27 99 27 72
U
U
+ = ⋅
= ⋅ − = − =
Luego la región crítica resulta U 72≥
Regla de decisión: Rechazo H0 si 72
0
≥HU
No rechazo H0 si 72
0
<HU
T R(T) N R(N)
70 3,5 81 5
62 1 90 16,5
85 9 90 16,5
85 9 86 11
70 3,5 88 12,5
65 2 83 7
82 6 89 14,5
89 14,5 85 9
88 12,5 94 18
95 19
100 20
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
26
( )
0
1 1
1
1 9 10
61 61 45 16
2 2
H
n n
U T
+ ⋅= − = − = − =
Como 7216
0
<=HU , entonces no rechazo H0
Conclusión: Al nivel de significación del 5%, no existen evidencias suficientes para rechazar H0 (H0: θ1 − θ2
≤ 0), por lo que la diferencia entre la mediana poblacional del aumento de peso, en kg, de los cerdos que
recibieron el alimento T y la mediana poblacional del aumento de peso, en kg, de los cerdos que recibieron
el alimento N es menor o igual a cero en estas poblaciones de cerdos de cierto criadero en estudio.
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según
la siguiente tabla:
H0 H1 Región crítica
0 1 2H :θ =θ 1 1 2H :θ θ≠ 1 2 1 2n ,n ;α/2 1 2 n ,n ;α/2ó n n -U U U U≤ ≥ ⋅
0 1 2H :θ θ≥ 1 1 2H :θ <θ 1 2n ,n ;αU U≤
0 1 2H :θ θ≤ 1 1 2H :θ >θ 1 21 2 n ,n ;αn nU U≥ ⋅ −
9) Con el fin de comparar el rendimiento académico (en una escala de 0 a 100 puntos) entre estable-
cimientos privados y estatales, se seleccionan aleatoriamente 15 personas que han realizado estudios
secundarios en establecimientos privados, y 15 personas que han realizado estudios secundarios en
establecimientos estatales. Los datos obtenidos son los siguientes:
PRIVADO 41 65 41 64 51 55 47 92 91 80 45 53 56 71 52
ESTATAL 90 65 59 65 54 42 48 46 44 43 65 36 35 57 49
¿Podemos suponer que los rendimientos académicos difieren significativamente? (α=0,05)
Shapiro-Wilks (modificado)
Tipo Variable n Media D.E. W* p(una cola)
Estatal Rendimiento 15 53,20 14,29 0,91 0,2897
Privado Rendimiento 15 60,27 16,68 0,87 0,0555
X1: “rendimiento académico (en una escala de 0 a 100 puntos) de un alumno de escuela estatal”
X2: “rendimiento académico (en una escala de 0 a 100 puntos) de un alumno de escuela privado”
Como primer paso debemos verificar la condición de normalidad, por lo que realizamos el test de Sha-
piro-Wilks:
( )
( )
2
0 1 1 1
2
1 1 1 1
: ~N ;
: no se distribuye normalmente ;
H X
H X
µ σ
µ σ
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como el p-valor es de 0,2897>0,10 no se rechaza la hipótesis nula y concluye: Con un nivel de signifi-
cación del 10%, no tengo evidencias suficientes para rechazar la hipótesis nula (X1∼N(µ1;σ1
2)) por lo
tanto el rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de escuela estatal
se distribuye normalmente en esta población de alumnos de escuela estatal.
( )
( )
2
0 2 2 2
2
1 2 2 2
: ~N ;
: no se distribuye normalmente ;
H X
H X
µ σ
µ σ
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
27
Como el p-valor es de 0,0555≤0,10 se rechaza la hipótesisnula y concluye: con un nivel de significa-
ción del 10%, tengo evidencias suficientes para rechazar la hipótesis nula (X2∼N(µ2;σ2
2)) por lo tanto el
rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de escuela privada no se
distribuye normalmente en esta población de alumnos de escuela privada.
No se cumple la condición de normalidad para el rendimiento académico de las personas que provie-
nen de establecimientos secundarios privados, por lo que no podemos realizar una prueba t para
muestras independientes, debemos realizar un análisis no paramétrico, la prueba de Mann-Whitney
aunque todavía debemos verificar las siguientes condiciones:
- X1 y X2 deben ser variables aleatorias independientes.
- X11, X12, …,X1 n1 e X21, X22, …,X2 n2 deben ser muestras aleatorias.
- n1<30 y/o n2<30.
- las variables en estudio X1 y X2 deben ser de escala por lo menos ordinal.
- X1 y X2 deben poseer una única mediana y distribuciones similares
Como podemos ver en el boxplot, las distribu-
ciones de rendimiento académico de los indivi-
duos que provienen de establecimientos estata-
les y privados, son similares.
Ambas son asimétricas positivas, ya que C2
está más cerca de C1 que de C3.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
28
Las hipótesis a testear para este test, en este caso, son:
H0: θ1 − θ2 = 0
H1: θ1 − θ2 ≠ 0
Denominaremos como muestra 1 a aquella que posee la me-
nor cantidad de observaciones. En caso de empate, se elige
indistintamente. Para este ejemplo, 1=E y 2=P. Siempre se
respetará el orden de la diferencia (θ1 − θ2) en las hipóte-
sis.
Siendo θ1: mediana poblacional del rendimiento académico
(en una escala de 0 a 100 puntos) de los alumnos de escuela
estatal.
θ2= mediana poblacional del rendimiento académico (en una
escala de 0 a 100 puntos) de los alumnos de escuela privada.
Se combinan ambas muestras en una única muestra orde-
nada y luego asignamos a cada dato su rango (posición)
según su valor, sin tener en cuenta de cuál de las muestras
proviene.
Luego se registra T1.
T1 = 1+2+5+6+7+9+11+12+16+19+20+23,5 • 3+28 = 206,5
Si los tamaños de muestra no superan a 30, entonces se de-
be usar la tabla de valores críticos del estadístico U de Mann
Whitney. Este estadístico es
( )1 1
1
1
2
n n
U T
+
= −
Variable pivotal:
( )
( )1 2
1 1
1 ;
1
- ~
2
n n
n n
U T U
+
=
Valores críticos:
La tabla sólo trae los valores críticos inferiores trabajando a una o dos colas con ciertos niveles de signifi-
cación.
Para buscarlo debemos considerar que 1 2 15n n= = , la prueba es a “dos colas”, y el nivel de significación
es 5%. Observando en la tabla correspondiente U15;15, que corresponde al 5% de significación y a la prue-
ba de dos colas obtenemos
U15,15; 0.025 = 64
Para hallar el valor crítico superior en caso de necesitarlo, se utiliza la fórmula:
1 2 1 2n ,n ; 1- /2 1 2 n ,n ; /2
U n n Uα α= ⋅ −
15,15;0.975 15 15 64 225 64 161U = ⋅ − = − =
Región crítica: (U 64) (U 161)≤ ∪ ≥
Regla de decisión: Rechazo H0 si 64
0
≤HU ó si 1610 ≥HU
No rechazo H0 si 16164
0
<< HU
( )
0
1 1
1
1 15 16
206,5 206,5 120 86,5
2 2
H
n n
U T
+ ⋅= − = − = − =
Datos Secundario Orden Rango
35 Estatal 1 1
36 Estatal 2 2
41 Privado 3 3,5
41 Privado 4 3,5
42 Estatal 5 5
43 Estatal 6 6
44 Estatal 7 7
45 Privado 8 8
46 Estatal 9 9
47 Privado 10 10
48 Estatal 11 11
49 Estatal 12 12
51 Privado 13 13
52 Privado 14 14
53 Privado 15 15
54 Estatal 16 16
55 Privado 17 17
56 Privado 18 18
57 Estatal 19 19
59 Estatal 20 20
64 Privado 21 21
65 Privado 22 23,5
65 Estatal 23 23,5
65 Estatal 24 23,5
65 Estatal 25 23,5
71 Privado 26 26
80 Privado 27 27
90 Estatal 28 28
91 Privado 29 29
92 Privado 30 30
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
29
Como 1615,8664
0
<=< HU , entonces no rechazo H0
Conclusión: Al nivel de significación del 5%, no existen evidencias suficientes para rechazar H0 (H0: θ1 − θ2
= 0), por lo que la diferencia entre la mediana poblacional del rendimiento académico de los individuos que
han realizado estudios secundarios en establecimientos estatales y la mediana poblacional de los que han
realizado sus estudios secundarios en establecimientos privados en estas poblaciones de individuos que
realizaron sus estudios en escuelas estatales o privadas es igual a cero.
Como respuesta a la pregunta, podemos decir, que, al 5%, los rendimientos académicos no difieren signi-
ficativamente entre los individuos que han realizado sus estudios secundarios, al comparar establecimien-
tos estatales y privados.
Otra opción es utilizar la salida que nos brinda Infostat. Aplicamos el test de Wilcoxon para muestras inde-
pendientes, y obtenemos la siguiente salida, en la que pueden figurar las medidas resumen, el estadístico
correspondiente, y el p-valor de la prueba (Nótese que el p-valor corresponde a la prueba bilateral)
Prueba de Wilcoxon para muestras independientes
Variable Grupo 1 Grupo 2 n(1) n(2) W p(2 colas)
Rendimiento Estatal Privado 15 15 206,50 0,2802
10) Los datos que se presentan a continuación provienen de los pesos, en g, de 22 ratas hembras, de
entre 28 y 84 días de vida. Doce de ellas fueron alimentadas con una dieta alta en proteínas, y 10 con una
dieta baja en proteínas.
Alta en proteína 120,2 120,57 119,78 120,29 118,62 120,69 120,27 119,13 118,04 120,29 117,46 119,7
Baja en proteína 102,13 105,3 103,39 104,73 98,00 95,89 98,65 98,73 95,2 102,47
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Alta en proteína 12 119.58 1.049 0.8715 0.1683
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Baja en proteína 10 100.45 3.62 0.9282 0.4305
a) ¿Se puede suponer, al 5%, que el peso medio de las ratas alimentadas con la dieta alta en proteí-
nas es mayor que el peso medio las ratas alimentadas con la dieta baja en proteínas?
b) Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir?
Datos del problema:
• Variables en estudio
X1: peso de una rata de entre 28 y 84 días de vida alimentada con una dieta alta en proteínas, medido
en g.
X2: peso de una rata de entre 28 y 84 días de vida alimentada con una dieta baja en proteínas,
medido en g.
• Tamaños de las muestras: n1= 12 y n2= 10
• Varianzas poblacionales: Desconocidas
• Nivel de significación: α=0,05
• Nivel de confianza: 1-α=0,95
Solución:
a)
• La hipótesis de trabajo que se desea poner a prueba es:
“La dieta alta en proteínas produce un peso medio mayor que la dieta baja en proteínas”
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
30
• Verificación de las condiciones para elegir la mejor variable pivotal: Para poder plantear las hipó-
tesis estadísticas y poder llevar a cabo la prueba, hay que verificar ciertas condiciones necesarias. En
este caso, son:
-que ambas variables (X1 y X2) sean independientes
-que se extraigan dos muestras aleatorias X11, X12, …,X1 n1 e X21, X22, …, X2 n2
-que cada X1i y cada X2i se distribuya normalmente.
-σ1
2 y σ2
2 son desconocidas, pero ¿iguales?
El supuesto de independencia se cumple por la forma en que se realizó el experimento: a un grupo de
ratas seleccionado aleatoriamente se le suministró la dieta alta en proteínas y a otro grupo, también
tomado al azar, se le suministro una dieta baja en proteínas.
Para testear la normalidad, haremos un test de Shapiro Wilks para cada variable.
Para X1: se realizó un test de Shapiro Wilks cuyas hipótesis son:
( )
( )
2
0 1 1 1
2
1 1 1 1
: ~N ;
: no se distribuye normalmente ;
H X
H X
µ σ
µ σ
Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados:
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)X1 12 119.58 1.049 0.8715 0.1683
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como p-valor= 0,1683 y es mayor que α=0,10, no se rechaza la hipótesis nula. Por lo tanto, con un nivel
de significación del 10% no tengo evidencias suficientes para rechazar H0 ( ( )21 1 1~N ;X µ σ ), por lo tanto
el peso de las ratas de entre 28 y 84 días de vida alimentada con una dieta alta en proteínas medido en g,
se distribuye normalmente en esta población de ratas de entre 28 y 84 días de vida.
Análogamente se estudia la normalidad de la variable X2:
( )
( )
2
0 2 2 2
2
1 2 2 2
: ~N ;
: no se distribuye normalmente ;
H X
H X
µ σ
µ σ
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
X2 10 100.45 3.62 0.9282 0.4305
No se rechaza H0 si el p-valor>0,10
Se rechaza H0 si el p-valor ≤0,10
Como p-valor= 0,4305 y es mayor que α=0,10, no se rechaza la hipótesis nula. Por lo tanto, con un nivel
de significación del 10%, no tengo evidencias suficientes para rechazar H0 ( ( )22 2 2~N ;X µ σ ), por lo tanto
el peso de las ratas de entre 28 y 84 días de vida alimentada con una dieta baja en proteínas medida en g,
se distribuye normalmente en esta población de ratas de entre 28 y 84 días de vida.
Al analizar las varianzas poblacionales, en este caso, no hay información de su valor, por lo tanto son
desconocidas, y hay que probar si pueden considerarse iguales mediante una prueba de hipótesis
utilizando la variable pivotal vista en el ejercicio 7. Dicho test se llama “de homogeneidad de varianzas”,
cuyas hipótesis son:
22
1
22
0
:
:
BA
BA
σσH
σ=σH
≠
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
31
Prueba F para igualdad de varianzas
Variable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba
Peso {Alta} {Baja} 12 10 1,10 13,10 0,08 0,0009 Bilateral
El resultado del estadístico es F= 0,08 y un p-valor de 0,0009.
El valor de F se compara con los valores críticos correspondientes planteando la región crítica, en
cambio, el p-valor se compara con α. A continuación, decidiremos utilizando los dos caminos:
• Con el estadístico F:
Variable Pivotal y su distribución:
2
2
( 1),( 1)2
2
~
A B
A
B
n n
A
B
s
s
F F
σ
σ
− −=
Dónde: 1
( 1),( 1);
2
A Bn n
F F α− −
= y 2
( 1),( 1);1
2
A Bn n
F F α− − −
= .
( ) ( )2 12 1 , 10 1 ;0,975 3,91F F − −= =
1 (12 1),(10 1);0,25
(10 1),(12 1);0,975
1 1
0, 28
3,59
F F
F
− −
− −
= = = =
Región crítica: F≤0,28 y 3,91≤ F
Regla de decisión: Rechazo H0 si Fobs≤0,28 o 3,91≤ Fobs
No rechazo H0 si 0,28< Fobs<3,91
0
0,08HF = Decisión: como Fobs=0,08 ≤ 0,28 Rechazo H0, por lo tanto se rechaza la hipótesis de
homogeneidad de varianzas.
• Usando el p-valor:
Como p-valor es 0,0009 ≤ 0,05=α se rechaza H0, por lo tanto se rechaza la hipótesis de homoge-
neidad de varianzas
Conclusión: Con un nivel de significación del 5%, se tienen evidencias suficientes para rechazar H0
(σA2=σB2) por lo tanto, la varianza poblacional del peso de las ratas alimentadas con una dieta alta en
proteínas medida en g, es distinta de la varianza poblacional del peso de las ratas alimentadas con una
dieta baja en proteínas medida en g, en estas poblaciones de ratas de entre 28 y 84 días de vida ali-
mentadas con las dietas nombradas.
Es decir que ambas variables se distribuyen normalmente con varianzas desconocidas y diferentes.
Volviendo al test pedido en el punto a):
• Hipótesis estadísticas.
Como el interés del investigador es probar si al alimentar a las ratas con una dieta con alta con-
centración de proteínas produce un peso medio superior, simbólicamente: 21 µµ > . Por lo que las hipó-
tesis estadísticas son:
0 1 2
1 1 2
:
:
H µ µ
H µ > µ
≤
• Nivel de significación: α=0,05
• Estadístico de prueba (o variable pivotal)
Se está realizando un test de hipótesis para la diferencia de medias poblacionales de variables
con distribución normal, por lo cual se cuenta con dos opciones al elegir la variable pivotal: Z o t de
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
32
Student, dependiendo del hecho de conocer o no las varianzas poblacionales. En este caso, las va-
rianzas poblacionales son desconocidas y desiguales, por lo tanto se utiliza una t, con la siguiente ex-
presión: ( ) ( )1 2 1 2
2 2
1 2
1 2
x x
t t
s s
n n
ω
µ µ− − −
= ≈
+
, siendo ω, los grados de libertad que se calculan siguiendo la
parte entera de la expresión:
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 21 1
s s
n n
s s
n n
n n
ω
+
=
+
− −
• Región crítica:
Es unilateral derecha, dado que H1: µ1-µ2>0 , por lo tanto el valor crítico es: 95,0,w
t
, siendo ω
( )
( ) ( )
( )
2
22 2
1 2
2
1 2
2 2 2 2 2 2
2 2
1 2
1 2
1 2
2
1,10 13,1
0,091 1,3112 10
0,091 1,311,10 13,1
12 10 11 9
12 1 10 11 1
1, 401 1,9628 1,9628
10, 2
0,008281 1,7161 0,00075 0,19 0,19075
11 9
s s
n n
s s
n n
n n
ω
+ + + = = = =
+ ++ − −− −
= = = =
++
8
Como puede verse, el resultado es un número decimal, y los grados de libertad están representados
por números enteros positivos. ¿Cómo resuelvo este dilema? Fácilmente: tomando la parte entera del
resultado, o sea, 10.
El valor crítico es 10;0,95 1,812t = y la región crítica queda determinada por: 1,812t ≥
• Regla de decisión: Rechazo H0 si 1,812
oH
t ≥
No rechazo H0 si 1,812
oH
t <
• Cálculo de tHo:
Hasta este momento no fueron necesarias las muestras, excepto en la verificación de las condi-
ciones para la elección de la variable pivotal, sin embargo se podría haber hecho con muestras piloto y
recién en esta instancia extraer las muestras para el análisis. Antes de calcular el valor del estadístico
de prueba hay que calcular las medias muestrales utilizando las fórmulas dadas en la unidad de esta-
dística descriptiva de Elementos de Estadística: 1 2119 58 ; 100 45x = , x = , . Hay que tener en cuenta
que la prueba se está realizando bajo la hipótesis nula que contiene el caso en que las medias pobla-
cionales son iguales, por lo tanto la diferencia de las medias poblacionales es cero, es decir que
1 2 0µ µ− = . Reemplazando estos valores y el resto de la información en la fórmula nos queda:
0
1 2
H
2 2
1 2
1 2
( ) 0 (119,58 100, 45) 19,13 19,13 19,13
t 16,162
1,18361,1 13,1 0,091 1,31 1, 401
12 10
x x
s s
n n
− − −= = = = = =
+++
• Decisión: Se Rechaza la hipótesis nula porque
0
16,162Ht = , es mayor que 1,812
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
33
• Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula ( 0 1 2:H µ µ≤ ), por lo tanto la media poblacional del peso de las ratas de entre 28 y 84 días
de vida que reciben la dieta alta en proteínas es mayor que la media poblacional de las ratas de entre
28 y 84 días de vida que reciben la dieta baja en proteínas, en estas poblaciones de ratas de entre 28
y 84 días de vida en estudio.
b) La fórmula del intervalo del 95% que se está solicitando se despeja de la variable pivotal y es:
2 2 2 2
1 2 1 2
1 2 ,1 2 1 2 ,1 2
1 2 1 2
α α
s s s s
(x x ) t + ;(x x )+t +
n n n n
ϖ ϖ− −
− − −
reemplazando se obtiene que
( ) ( )10,0,975 10,0,975
1,1 13,1 1,1 13,1
119,58 100,45 119,58 100, 45
12 10 12 10
19,13 2, 228 0,091 1,31;19,13 2, 228 0,091 1,31
19,13 2, 228 1, 401;19,13 2, 228 1, 401 19,13 2, 228*1,1836;19,13 2, 228*1,1
t + ; t +
− − − + =
= − + + + =
= − + = − + [ ]
[ ] [ ]
836
19,13 2,637;19,13 2,637 16,493 ;21,767g g
=
= − + =
Conclusión : Con un nivel de confianza del 95%, se espera que el intervalo (16,493 g; 21,767 g) cubra
a la diferencia entre la media poblacionaldel peso de la ratas de entre 28 y 84 días de vida alimenta-
das con la dieta alta en proteínas y la media poblacional de las ratas de entre 28 y 84 días de vida ali-
mentadas con la dieta baja en proteínas, en estas poblaciones de ratas estudiadas.
La correspondiente salida de Infostat es:
Prueba T para muestras Independientes
Variable:peso - Clasific:Variab - prueba:Unilateral
n Media Varianza pHomVar T p-valor
Grupo 1 12 119,59 1,1 0,0003 16,16 <0,0001
Grupo 2 10 100,45 1,1
Se puede observar en la salida que se realiza la prueba de homogeneidad y se rechaza la hipótesis de
igualdad de varianzas; luego se realiza la prueba de diferencia de medias unilateral izquierda
suponiendo falta de homogeneidad.
PROBLEMAS PROPUESTOS
1) Para estudiar el efecto de un nuevo fertilizante sobre el rendimiento de un cultivo de oleaginosas, se
sembraron 12 ha del cultivo con fertilizante y 10 ha sin fertilizante elegidas aleatoriamente. Suponiendo
que σ1 = σ2 = 105 kg/ha se presentan la siguiente tabla:
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola )
Fertilizante 12 1089 87,42 0,94 0,6129
Sin fertilizante 10 877 97,31 0,98 0,9832
a) ¿Es la diferencia entre los rendimientos medios con y sin fertilizante, significativa al 5%?
b) ¿Considera conveniente construir un intervalo de confianza para la diferencia entre las medias?
Justifique.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
34
2) Las personas que tienen el síndrome de Raynaud sufren un súbito deterioro en la circulación sanguínea
de los dedos de las manos y de los pies. Para estudiar esta enfermedad, en un experimento se midió la
generación de calor, mediante calorimetría, en cal/cm2/min, de un dedo índice luego de haberlo sumergido
en agua a 19°C. En este estudio, se contó con una m uestra tomada al azar de 10 individuos con el
síndrome y una muestra de 10 individuos sanos.
Sanos (S) 2,43 1,83 2,43 2,70 1,88 1,96 1,53 2,08 1,85 2,44
Síndrome de Raynaud (E) 0,81 0,70 0,74 0,36 0,75 0,56 0,65 0,87 0,40 0,31
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Sanos 10 2,11 0,37 0,92 0,5118
Síndrome 10 0,62 0,20 0,89 0,2498
Prueba F para igualdad de varianzas
Variable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F
Sanos {1,00} {2,00} 10 10 0,14 0,04 3,46
Asuma que σE
2 = σS
2.
a) Definir las variables y poblaciones en estudio
b) Interpretar los parámetros en estudio en términos del problema
c) Estimar puntualmente y por intervalo de confianza la diferencia entre la generación de calor
media de los individuos enfermos (µE) y la generación de calor media de los individuos sanos
(µS) (1-α = 0,95).
d) Una nueva investigación afirma que la generación de calor por parte de los afectados por este
síndrome es más homogénea. Probarlo con un nivel de significación del 5%.
3) De una población de individuos afectados por una enfermedad, se tomaron dos muestras aleatorias e
independientes de 100 individuos cada una. A una de las mismas (que llamaremos grupo A), se le
administró un suero, al otro grupo (B, control) se le administró un placebo; en todo lo demás, los dos
grupos fueron tratados idénticamente. Se encontró que en los grupos A y B, 75 y 55 individuos,
respectivamente, se habían recuperado luego de un mes de observación.
a) Exprese la hipótesis de trabajo
b) Defina en forma analítica la región crítica
c) Calcule el valor del estadístico de prueba
d) Probar la hipótesis de que el suero ayuda a curar la enfermedad con un nivel de significación del 5%.
4) Un estudio llevado a cabo para probar si la aspirina afecta el tiempo de coagulación, se tomó una
muestra de 12 adultos varones. El tiempo de protrombina, que mide el tiempo en segundos entre el
inicio de la reacción de coagulación y la formación del coágulo, fue medido en cada uno de los
individuos antes y después de 3 hs de haber ingerido dos tabletas de aspirina (500mg cada una).
Antes 12,3 12,0 12,0 13,0 13,0 12,5 11,3 11,8 11,5 11,0 11,0 11,3
Después 12,0 12,3 12,5 12,0 13,0 12,5 10,3 11,3 11,5 11,5 11,0 11,5
a) Probar si existe alguna diferencia en el tiempo de protrombina con un nivel de significación del
5%, tener en cuenta la verificación de las condiciones para la elección de la variable pivotal, sin
hacer cálculos y utilizando la información que le proporciona alguna de las salidas de InfoStat que
abajo se detallan. Comente brevemente por qué eligió esa salida y a qué decisión llega a partir de
la información.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
35
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
antes 12 11.89 0.71 0.89 0.2210
después 12 11.79 0.75 0.97 0.9213
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Dif_AD 12 0,11 0,51 0,86 0,1172
Prueba T para muestras Independientes
Grupo1 Grupo2 n1 n2 med1 med2 LI(95%) LS(95%) T p prueba
Antes Después 12 12 11,89 11,78 -0,51 0,72 0,37 0,7186 Bilat
Prueba T para un parámetro
Valor del parámetro probado: 0
Variable n Media DE LI(95) LS(95) T p(Bilateral)
Dif_AD 12 0,11 0,51 -0,21 0,43 0,74 0,4748
b) Calcule el intervalo de confianza correspondiente al parámetro en estudio.
5) Las empresas que comercializan agua para beber, realizan controles de calidad diariamente. Una de
las variables de interés es el pH, que mide el grado de acidez del agua contenida en los envases lista
para su distribución. Un pH menor a 7 es considerado ácido, un pH mayor a 7 es considerado alcalino
y un pH igual a 7 es considerado neutro. Un investigador sospecha que el material de los nuevos en-
vases modifica el pH del agua. Para estimar la diferencia entre los pH medios, extraen aleatoriamente
20 muestras de agua con el envase viejo y 15 muestras de agua con el envase nuevo. Algunos datos
obtenidos son:
Media Desvío Shapiro-Wilks (p-valor)
Envase viejo 8,366 0,54 0,6413
Envase nuevo 6,318 3,73 0,9609
Al hacer la prueba de homogeneidad de varianzas, resultó: F = 0,0209, p-value = 0
Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir?
6) Alle y Bowen (1932) estudiaron el tiempo de supervivencia de la carpa dorada, en minutos, cuando se
coloca en suspensiones de plata. Los investigadores realizaron varios experimentos, entre ellos el siguien-
te: se asignan aleatoriamente 10 carpas a cada grupo. En uno de ellos se exponen a las carpas a una
concentración baja de nitrato de plata disuelto en el agua (Conc1, 50 g/l), y el otro grupo, a una concentra-
ción mayor (Conc2, 80g/l). Al nivel del 5%, ¿difieren los tiempos de supervivencia?
Conc1 210 180 240 60 55 75 78 82 125 83
Conc2 81 75 156 180 102 200 135 85 78 87
Shapiro-Wilks (modificado)
Concentración Variable n Media D.E. W* p (una cola)
1 Sobrevida 10 118,80 67,11 0,81 0,0247
2 Sobrevida 10 117,90 46,46 0,82 0,0307
Prueba de Wilcoxon para muestras independientes (Mann Whitney)
Variable Gr1 Gr2 n1 n2 Me1 Me2 R-media1 R-media 2 W p(2 colas)
Sobrevida 1 2 10 10 82,50 94,50 9,75 11,25 97,50 0,5703
CUESTIONARIO
1.- ¿Cuál es el objeto de un diseño experimental? ¿Qué beneficios trae?
2.- ¿De qué manera puede controlarse la confusión de factores en el estudio experimental?
3.- En un estudio observacional:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
36
a) ¿se aleatorizaron las asignaciones a tratamiento y control? SÍ NO
b) ¿Se Prefija qué característica determinó la separación entre los grupos? SÍ NO
c) ¿Existen factores que pueden confundirse con los tratamientos? SÍ NO
d) ¿Si existe posibilidadde confusión, puede controlarse? SÍ NO
4.- En los estudios observacionales pueden establecerse asociaciones, es decir poner de manifiesto
que una cosa está relacionada con otra. ¿Pueden estos estudios establecer causalidad?
5.- ¿Cómo diseñaría un experimento para estudiar si la hipertensión durante el embarazo provoca be-
bés nacidos con menor peso? ¿Qué factor podría confundirse y cómo lo controlaría?
6.- Según un estudio observacional realizado en el Kaiser Permanente de Walmut Creek, California, se
daba un índice más elevado de cáncer de cuello de matriz entre mujeres que usaban anticonceptivos ora-
les que entre las que no usaban, independientemente de su edad, educación, estado civil, religión y hábito
de fumar. Los investigadores llegaron a la conclusión de que la píldora causaba el cáncer del cuello de
matriz. ¿Es correcta esta afirmación? ¿Por qué?
7.- Identifique en el ejemplo anterior los términos: unidad experimental, tratamiento, factor, niveles del
factor.
8.- En qué casos debe aplicarse el test de Welch?
9.- ¿Qué entiende por confianza en la estimación de un intervalo?
10.- ¿Qué ocurre con la amplitud de un intervalo de confianza para la diferencia de medias
poblacionales normales independientes con varianzas desconocidas pero iguales si:
a.- aumenta el tamaño de las muestras (manteniéndose la varianza muestral constante)
b.- disminuye el nivel de confianza.
c.- disminuye la variabilidad de las muestras.
11.- ¿Puede resultar negativo algún límite de un intervalo de confianza para la diferencia de dos
proporciones? Justifique su respuesta.
12- ¿En qué casos es recomendable aplicar un test de Mann Whitney? Explicite las condiciones que
deben cumplirse, las hipótesis, variable pivotal y su distribución.
13.- ¿Cuándo le parece conveniente utilizar una prueba para la media de las diferencias apareadas?
¿Cuántas son las variables en estudio?
14.- Se tiene la sospecha de que la proporción de individuos que no tienen enfermedades cardiovascu-
lares en la población A es mayor que en la población B. Para poner a prueba esta hipótesis se tomó
una muestra aleatoria de individuos de la población A y otra de la población B y se observó el número
de individuos sin esta afección en cada grupo.
a) La hipótesis de trabajo es: ..........................................................................................................
.......................................................................................................................................................
b) Interpretación biológica de parámetro/s en estudio: ......................................................................
.......................................................................................................................................................
.......................................................................................................................................................
c) Las hipótesis estadísticas son: .....................................................................................................
d) Las condiciones necesarias para la validez de la prueba estadística son: ..................................
.......................................................................................................................................................
15.- En dos población tales que µ1 > µ2 se realizó la dócima H0: µ1 = µ2 contra H1: µ1 ≠ µ2 y resultó
significativa al 1%, es decir se rechazó H0. ¿En qué situación de las cuatro posibles ubica este
ejemplo? ¿Cuál es la probabilidad asociada a esta situación?
16.- ¿Qué test de nivel asintótico ha utilizado en ésta unidad y en qué situaciones?
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
37
UNIDAD 4: Diseño Completamente Aleatorizado (DCA)
Análisis de la Varianza (ADEVA)
Objetivos específicos
• Comprender la importancia de las aplicaciones del análisis de la varianza.
• Adquirir vocabulario específico y manejar algunos métodos del Diseño Experimental.
• Aplicar análisis de la varianza paramétrico y no paramétrico, según corresponda, en casos relativos
al campo profesional del veterinario.
Contenidos temáticos
Concepto de Modelo. Supuestos. Método de mínimos cuadrados. ADEVA para DCA. Prueba de hipótesis
para comparar valores medios de más de dos tratamientos. Análisis de varianza de una clasificación por
rangos de Kruskal-Wallis. Aplicaciones. Interpretación de análisis realizados mediante programas de
computación.
Glosario
Diseño completamente aleatorizado (DCA). Modelo estadístico. Análisis de la varianza (ADEVA) para un
DCA, Modelo I. Pruebas de Hipótesis. Suma de cuadrados. Cuadrado medio. Varianza. Análisis de
varianza Kruskal-Wallis. Rango. Variables al menos ordinales. Mediana.
PROBLEMAS RESUELTOS
1) Para comparar cuatro suplementos “de engorde” en bovinos para carne, se seleccionaron, al azar,
cuarenta animales Hereford de iguales edad y sexo, y de pesos homogéneos para ser usados en un
experimento. Los suplementos a comparar se definieron sobre la base de las características del grano de
maíz empleado (“entero” o “partido”) y la fuente comercial de vitaminas y minerales (“A” y “B”). Entonces
el suplemento 1 (S1) estuvo constituido por grano partido y fuente A, mientras que el suplemento 2 (S2)
por grano partido y fuente B, el suplemento 3 (S3) por grano entero y fuente A, y el suplemento 4 (S4)
por grano entero y fuente B. Se asignaron aleatoriamente 10 animales por suplemento, los que fueron
alimentados individualmente con una dieta estándar más el correspondiente suplemento durante 80 días.
Se registra la eficiencia de conversión (EfCon) individual (kg Materia Seca/ kg Ganancia de Peso) cuyos
resultados se presentan en la siguiente tabla:
S1 3,3 4,4 4,9 4,9 3,9 4,2 4,7 5,1 4,6 4,5
S2 4,6 4,5 5 4 4,5 5,2 4,9 5,5 4,8 5,3
S3 6,7 5,8 5 4,8 5,3 6,2 5 6,4 5,9 5,4
S4 6,3 6 6,7 5,5 6,6 6,1 5,3 6,5 6,3 6,8
a) ¿Cuál es el objetivo del experimento?
b) ¿Cuál fue la unidad experimental? ¿En qué condiciones se desarrolla el experimento? ¿Qué se
registra?
c) ¿Qué diseño se empleó? ¿Por qué? ¿qué se asumió?
d) ¿Cuál será el modelo teórico a emplear?
e) ¿Qué puede decir con respecto a la validez del DCA paramétrico?
f) Escriba las hipótesis de interés, y teniendo en cuenta la salida de computadora concluya al 5%.
Solución
a) ¿Cuál es el objetivo del experimento?
Objetivo: comparar la efectividad de cuatro suplementos diferentes para “engorde”.
Los suplementos se definieron sobre la base de las características del grano de maíz empleado (“entero”
o “partido”) y la fuente comercial de vitaminas y minerales (“A” y “B”) quedando constituidos por:
Suplemento 1 (S1): grano partido y fuente A
Suplemento 2 (S2): grano partido y fuente B
Suplemento 3 (S3): grano entero y fuente A
Suplemento 4 (S4): grano entero y fuente B.
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
38
b) ¿Cuál fue la unidad experimental? ¿En qué condiciones se desarrolla el experimento? ¿Qué se re-
gistra?
Unidad experimental: un bovino raza Hereford.
Condiciones en que se desarrolla el experimento: 40 bovinos de raza Hereford de iguales edad y sexo, y
de pesos homogéneos , alimentados individualmente con una dieta estándar más el correspondiente
suplemento durante 80 días. Se asigna al azar igual cantidad de bovinos a cada dieta.
Variable respuesta:
Eficiencia de conversión de un bovino (kg Materia Seca/ kg Ganancia de Peso)
La variable respuesta se mide en bovinos que son sometidos a cuatro tratamientos que son:
Dieta a base de suplemento 1
Dieta a base de suplemento 2
Dieta a base de suplemento 3
Dieta a base de suplemento 4
Es decir, una variable registrada en cuatro poblaciones. En éste caso la Dieta es el factor que tiene cua-
tro niveles (S1, S2, S3 y S4).
c) ¿Qué diseño se empleó? ¿Por qué? ¿Qué se asumió?Se aplicó un diseño completamente aleatorizado debido a que los animales se asignaron sin restricciones a
los tratamientos. Se asumió que:
1. los factores raza, peso y sexo podían influir en los resultados por lo cual fueron controlados por el experi-
mentador. Además se seleccionó como factor de interés a la dieta.
2. No hay otros factores que influyan en los resultados del experimento.
d) El modelo teórico de DCA modelo fijo es:
Yij = µµµµi + εεεεij para i=1, 2, 3, 4; j=1, 2, …, 10
Donde:
Yij: Eficiencia de conversión registrada en el j-ésimo bovinos de raza Hereford que recibió la i-ésima di-
eta. (variable aleat)
µµµµi: Eficiencia de conversión media poblacional de la i-ésima dieta en bovinos de raza Hereford (parám)
εεεεij : variable aleatoria no observable correspondiente a la respuesta propia del j-ésimo bovino de raza
Hereford que recibió la dieta i-ésima.(ε ~ N(0, σ2)). (variable aleatoria)
En cuanto a los parámetros del diseño, son µµµµi (i=1, 2, 3, 4) que está presente en la ecuación del modelo y
σ2 que es la varianza de los errores del modelo (ε).
e)¿qué puede decir con respecto a la validez del DCA paramétrico?
Condiciones para la elección de la variable pivotal:
Antes de realizar el estudio, deberíamos verificar si:
i) Las observaciones de eficiencia de conversión son independientes porque los animales inicialmente
eran homogéneos en cuanto a las otras características (peso, raza y sexo), fueron aleatorizados
irrestrictamente y por lo tanto la eficiencia de conversión de un bovino es independiente y la eficiencia de
conversión de cualquier otro tanto que haya recibido el mismo suplemento como otro.
ii) Para cada suplemento existe una subpoblación de valores de Eficiencia de conversión de los bovinos
Hereford de sexo, edad y peso inicial semejantes con distribución normal
iii) Para cada suplemento existe una subpoblación de valores de Eficiencia de conversión de los bovinos
Hereford de sexo, edad y peso inicial semejantes con igual varianza.
ii) Para la segunda condición se puede probar y/o observar a partir de la variable respuesta o de los errores
del modelo:
1) A partir de la variable respuesta:
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
39
Para analizar la normalidad de la variable respuesta, debemos hacerlo dentro de cada tratamiento. Por
ello, distinguiremos en la variable respuesta a 4 variables que serían la misma pero observada en cada
población. Éstas son:
- Eficiencia de conversión (S1) de un bovino (kg Materia Seca/ kg Ganancia de Peso) alimentado
con el suplemento 1.
- Eficiencia de conversión (S2) de un bovino (kg Materia Seca/ kg Ganancia de Peso) alimentado
con el suplemento 2.
- Eficiencia de conversión (S3) de un bovino (kg Materia Seca/ kg Ganancia de Peso) alimentado
con el suplemento 3.
- Eficiencia de conversión (S4) de un bovino (kg Materia Seca/ kg Ganancia de Peso) alimentado
con el suplemento 4.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
S1 10 4,45 0,54 0,92 0,5174
S2 10 4,83 0,45 0,97 0,9167
S3 10 5,65 0,65 0,92 0,4806
S4 10 6,21 0,50 0,90 0,3451
H0: S1 se distribuye N(µ1 , σ1
2)
H1: S1 no se distribuye N(µ2 ,σ1
2)
No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Como el p-valor es 0,5174>0,10 no se rechaza H0
H0: S2 se distribuye N(µ2 , σ2
2)
H1: S2 no se distribuye N(µ2 ,σ2
2)
No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Como el p-valor es 0,9167>0,10 no se rechaza H0
H0: S3 se distribuye N(µ3 , σ3
2)
H1: S3 no se distribuye N(µ3 ,σ3
2)
No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Como el p-valor es 0,4806>0,10 no se rechaza H0
H0: S4 se distribuye N(µ4 , σ4
2)
H1: S4 no se distribuye N(µ4 ,σ4
2)
No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Como el p-valor es 0,3451>0,10 no se rechaza H0
En el gráfico de puntos se observa que las
varianzas de las cuatro poblaciones, en
cuanto a la variable eficiencia de
conversión, son similares.
Observando los p-valores se puede decir que en las cuatro poblaciones ocurre que, al 10%, no se rechaza la
hipótesis de normalidad de Eficiencia de conversión. Igualmente hay que realizar una conclusión para cada
una de ellas:
Con un nivel de significación del 10%, no tengo evidencias suficientes para rechazar mi hipótesis nula
(H0: S1 se distribuye N(µ1 , σ1
2)) por lo tanto, puedo decir que la Eficiencia de conversión por los bovinos
que consumieron el Suplemento 1 (S1): grano partido y fuente A, se distribuye normalmente en estas
poblaciones de bovinos Hereford de iguales edad y sexo en estudio.
Con un nivel de significación del 10%, no tengo evidencias suficientes para rechazar mi hipótesis nula
(H0: S2 se distribuye N(µ2 , σ2
2)) por lo tanto, puedo decir que la Eficiencia de conversión por los bovinos
que consumieron el Suplemento 2 (S2): grano partido y fuente B, se distribuye normalmente en estas
poblaciones de bovinos Hereford de iguales edad y sexo en estudio.
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
40
Con un nivel de significación del 10%, no tengo evidencias suficientes para rechazar mi hipótesis nula
(H0: S3 se distribuye N(µ3 , σ3
2)) por lo tanto, puedo decir que la Eficiencia de conversión por los bovinos
que consumieron el Suplemento 3 (S3): grano entero y fuente A, se distribuye normalmente en estas
poblaciones de bovinos Hereford de iguales edad y sexo en estudio.
Con un nivel de significación del 10%, no tengo evidencias suficientes para rechazar mi hipótesis nula
(H0: S4 se distribuye N(µ4 , σ4
2)) por lo tanto, puedo decir que la Eficiencia de conversión por los bovinos
que consumieron el Suplemento 4 (S4): grano entero y fuente B, se distribuye normalmente en estas
poblaciones de bovinos Hereford de iguales edad y sexo en estudio.
2) A partir de los errores.
Es útil cuando se tienen pocas observaciones por tratamiento
Dado que el modelo es: Yij = µµµµi + εεεεij para i=1, 2, 3, 4; j=1, 2, …, 10
El error correspondiente a una observación es la diferencia entre el valor observado y valor medio esperado
es decir εεεεij = Yij - µµµµi
Y, dado que los parámetros son información fija (µµµµi, i=1, 2, 3, 4) suponer que la variable respuesta se
distribuye normalmente con cierta media poblacional y única varianza poblacional es equivalente a
suponer normalidad para los errores con media poblacional cero y la misma varianza poblacional.
Dado que los errores son no observables el supuesto se verifica utilizando sus equivalentes a nivel
muestral llamados residuos. ε̂ −ij ij ij i=e = Y Y
Hipótesis estadísticas:
H0: ε se distribuye N(0, σ
2)
H1: ε no se distribuye N(0,σ
2)
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
RE_EfCon 40 0,00 1,01 0,96 0,4386
No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Como el p-valor es de 0,4386>0,10 no se rechaza H0
Con un nivel de significación del 10% no tengo eviden-
cia suficiente para rechazar H0, es decir que los errores
provenientes del modelo propuesto (DCA Modelo fijo:
variable respuesta: Eficiencia de conversión de un bovi-
no; factor: suplemento dietario; niveles: Suplemento 1
(S1): grano partido y fuente A, Suplemento 2 (S2):
grano partido y fuente B, Suplemento 3 (S3): grano
entero y fuente A, Suplemento 4 (S4): grano entero y
fuente B) se distribuyen normalmente en estas pobla-
ciones de bovinos Hereford de iguales edad y sexo en
estudio.
En el gráfico no se observan puntos
(residuos) con gran alejamiento de los
valores normales teóricos, por lo que se
puede suponer que la distribución que
siguen los errores es normal.
iii) Paraobservar si se puede suponer homogeneidad de varianzas
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
41
En el diagrama de dispersión de residuos vs valores
predichos no se observan diferencias notorias entre
las varianzas de la Eficiencia de conversión en
bovinos Hereford de iguales edad y sexo para
cada suplemento “de engorde” en bovinos para
carne.
En este gráfico se observa asimetría en algunos
casos y alguna varianza sensiblemente menor que
las otras. Se debe recordar que este gráfico puede
ser engañoso cuando las muestras son muy
pequeñas.
Para verificar la tercera condición mediante un test estadístico se puede aplicar la prueba de Levene
H0 :
2 2 2 2 2
1 2 3 4σ σ σ σ σ= = = =
H1 : algún
2 2
iσ σ≠ i=1, 2, 3, 4
Se calcula para cada observación (repetición j-ésima del i-ésimo tratamiento) la diferencia en valor
absoluta entre su puntuación (Yij) y la mediana del grupo o nivel del factor al que pertenece (Mnai)
obteniendo así una nueva variable.
ij ij idif y Mna= − i=1, 2, 3, 4 j=1, 2, …, 10
Con ésta variable (dif) se realiza un ANOVA.
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
dif_abs(efcon-mna) 40 0,07 0,00 75,24
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 0,25 3 0,08 0,86 0,4716
Tratam 0,25 3 0,08 0,86 0,4716
Error 3,51 36 0,10
Total 3,76 39
VP: F= CMtrat / CMerror ~ F(gl trat; gl error)
Rechazo H0 si F≥2,87
No rechazo H0 si F<2,87
Como el F es 0,86 no se rechaza la hipótesis nula
Con un nivel de significación del 5%, no tengo evidencias suficientes para rechazar Ho
( 2 2 2 2 21 2 3 4σ σ σ σ σ= = = = ) por lo tanto se puede considerar que las varianzas poblacionales de la
Eficiencia de conversión de bovinos que consumieron el Suplemento 1 (S1): grano partido y fuente A, el
Suplemento 2 (S2): grano partido y fuente B, el Suplemento 3 (S3): grano entero y fuente A, y el
Suplemento 4 (S4): grano entero y fuente B; son iguales en estas poblaciones de bovinos Hereford de
iguales edad y sexo en estudio.
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
42
f) Escriba las hipótesis de interés, y teniendo en cuenta la salida de computadora concluya al 5%.
Debido a los pruebas de verificación de condiciones realizadas en los puntos anteriores, seleccionamos
el DCA paramétrico por lo que miramos la tabla ANOVA (o ADEVA).
i)
Análisis de la varianza
Variable N R² R² Aj CV
EfCon 40 0,65 0,62 10,32
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 19,87 3 6,62 22,18 <0,0001
Tratam 19,87 3 6,62 22,18 <0,0001 ���� Significativo
Error 10,76 36 0,30
Total 30,63 39
Las hipótesis estadísticas son:
H0: µµµµi = µµµµ para i=1, 2, 3, 4
H1: algún µµµµi ≠ µµµµ
Variable Pivotal : F= CMtrat / CMerror ~ F(gl trat; gl error) ~ F(3; 36)
Rechazo H0 si Fobs ≥ F(3 ; 35) ; 0,95 = 2,87 F(3 ; 36) ; 0,95 no se encuentra en tabla y se usa el n anterior
No rechazo H0 si Fobs < F(3 ; 35) ; 0,95 = 2,87
Como F=22,18 >2,87 rechazamos H0.
Si observamos el pvalor se tiene que p-valor<0,0001<0,05 se llega a la misma decisión.
Se concluye:
Con un nivel de significaron del 5% existe evidencia suficiente para rechazar H0 (µµµµi = µµµµ
para i=1, 2, 3, 4), por lo tanto al menos un valor medio poblacional de Eficiencia de conversión en bovinos
alimentados con Suplemento 1 (grano partido y fuente A), Suplemento 2 (grano partido y fuente B),
Suplemento 3 (grano entero y fuente A), o Suplemento 4 (grano entero y fuente B) difiere de los restantes
en estas poblaciones de bovinos Hereford de iguales edad y sexo en estudio.
Nota: Cuando se rechaza la hipótesis nula, es decir todos los valores medios no son iguales, es intere-
sante comparar los valores medios poblacionales para ver cuál o cuales son diferentes. Existen diferentes
métodos de comparaciones múltiples pero esta parte del estudio escapa de los alcances de esta materia.
2) El esculeno es un hidrocarburo insaturado que se encuentra en aceites vegetales. En una experiencia
se desea comparar cuantitativamente el contenido de esta sustancia entre 4 aceites vegetales: maní,
maíz, soja y girasol. Para ello se tomaron aleatoriamente 8 muestras para cada tipo de aceite determi-
nándose el contenido de esculeno en mg/100 g de aceite.
a) ¿Cuál es el objetivo del experimento?
b) ¿Cuál fue la unidad experimental? ¿Qué se registra?
c) ¿Qué puede decir con respecto a la validez del DCA paramétrico?
d) Escribir las hipótesis de interés, y teniendo en cuenta la salida de computadora concluir al 5%.
Contenido de esculeno (mg/100 g de aceite)
Maní 21 22 38 13 23 25 14 16
Maíz 33 18 14 27 21 17 15 23
Soja 8 12 21 9 16 7 6 11
Aceite
Girasol 5 12 10 13 9 10 15 6
Solución
a) ¿Cuál es el objetivo del experimento?
Objetivo: comparar el contenido medio de esculeno en aceites vegetales provenientes de maíz, maní,
girasol y soja.
b) ¿Cuál fue la unidad experimental? ¿Qué se registra?
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
43
La unidad experimental es una muestra de aceite, a la que se le observa la concentración de esculeno,
medida en mg/100 g de aceite.
c) ¿qué puede decir con respecto a la validez del DCA paramétrico?
Se propone en ese caso el modelo: ij i ijY µ ε= + para i=1, 2, 3, 4 j= 1, 2, ....., 8
Donde los εij son independientes y se distribuyen normalmente, εij ~N(0; σ²)
i) Los errores son independientes dado que en cada población (Vegetal) las muestras de aceite fueron
seleccionadas al azar y el contenido de esculeno de una planta es independiente del contenido de
esculeno de otra planta.
ii)
Hipótesis estadísticas:
H0: ε ~N(0, σ
2)
H1: ε no tiene distribución N(0, σ
2)
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(unacola)
RE_Esculeno 32 -0,02 0,95 0,90 0,0180
No rechazo H0 si el p-valor>0,10
Rechazo H0 si el p-valor≤0,10
Con un nivel de significación del 10% tengo
evidencia suficiente para rechazar H0, es decir que
los errores provenientes del modelo propuesto
(DCA Modelo fijo: variable respuesta:
concentración de esculeno, medida en mg/100 g
de aceite; fator: tipo de aceite; niveles: maíz, maní,
girasol y soja) no se distribuyen normalmente en
estas poblaciones de aceites en estudio.
Se observan varios residuos que son de gran
magnitud y se alejan de los valores normales
teóricos lo que pone en duda el supuesto de que la
distribución que siguen los errores, según el modelo
propuesto, sea normal.
iii) Para observar si se puede suponer homogeneidad de varianzas, se realiza el Test de Levene
H0 :
2 2 2 2 2
1 2 3 4σ σ σ σ σ= = = =
H1 : algún
2 2
iσ σ≠ i=1, 2, 3, 4
Análisis de la varianza – Test de Levene
Variable N R² R² Aj
abs dif 32 0,09 0,00
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 43,38 3 14,46 0,95 0,4292
Aceite 43,38 3 14,46 0,95 0,4292
Error 425,50 28 15,20
Total 468,88 31
No rechazo H0 si el p-valor>0,05
Rechazo H0 si el p-valor≤0,05
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
44
Como p-valor=0,4292>0,05, no rechazo H0,
Con un nivel de significación del 5%, no tengo evidencias suficientes para rechazar Ho
( 2 2 2 2 21 2 3 4σ σ σ σ σ= = = = ) por lo tanto se puede considerar que las varianzas poblacionales de la
concentración de esculeno, medida en mg/100 g de aceite en aceite de maíz, de aceite en aceite de
maní, deaceite en aceite de girasol, y de aceite en aceite de soja; son iguales en estas poblaciones de
aceites.
d) Escribir las hipótesis de interés, y teniendo en cuenta la salida de computadora concluir al 5%.
Por lo anterior no es válido utilizar un DCA Modelo 1 o fijo Paramétrico.
Por otro lado, hay que verificar que se cumplan las condiciones necesarias para realizar una prueba no
paramétrica de Kruskal Wallis:
a) las observaciones de concentración de esculeno en aceite son independientes, debido a que los cuatro
tipos de vegetales lo son y la muestra fue tomada aleatoriamente para cada uno de ellos
b) la variable concentración de esculeno en aceite es cuantitativa continua, por lo que es de una escala
superior a la ordinal.
c) La variable concentración de esculeno en aceite, medida en mg/100 g de aceite; posee distribuciones
similares para el factor tipo de aceite con niveles: maíz, maní, girasol y soja. Esta condición no la proba-
remos pero podríamos darnos una idea intuitiva a través de un box plot.
Prueba de Kruskal Wallis
Variable Aceite N Medias D.E. Medianas H p
Esculeno Girasol 8 10,00 3,38 10,00 17,79 0,0005
Esculeno Maíz 8 21,00 6,48 19,50
Esculeno Maní 8 21,50 7,98 21,50
Esculeno Soja 8 11,25 5,06 10,00
Si simbolizamos con θ a la mediana poblacional para la concentración de esculeno en aceite.
Estamos suponiendo en este caso el modelo: ij i ijY θ ξ= + para i=1, 2, 3, 4 j= 1, 2, ....., 8
Donde: i es el nivel del factor y en éste caso es el i-ésimo tipo de vegetal;
j es el número de observación dentro del tipo de vegetal;
θi es la mediana poblacional de la la concentración de esculeno en aceite del i-ésimo tipo de vegetal y la
distribución de ξij no se conoce.
Los parámetros de este modelo son los θi para i=1, 2, 3, 4
Hipótesis estadísticas
H0 : θ1= θ2= θ3= θ4= θ
H1 : algún θi≠ θ i=1, 2, 3, 4
Es decir que se quiere probar si la variable concentración de esculeno en aceite tiene la misma posición
central para los cuatro vegetales: maíz, maní, girasol y soja.
El estadístico de contraste es H que distribuye aproximadamente como una Chi cuadrado con I-1 grados
de libertad siendo I la cantidad de tratamientos.
2
2.
11
12
3( 1)
( 1)
I i
Ii
i
R
H N X
N N n
−=
= − + ≈
+ ∑
Por eso:
Rechazo H0 si H ≥7,815
No rechazo H0 si H <7,815
N= 32;
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
45
Rij Ri. Ri2 Ri2/8
Maní 24 26 32 13,5 27,5 29 15,5 19,5 187,0 34969,00 4371,12500
Maíz 31 22 15,5 30 24 21 17,5 27,5 188,5 35532,25 4441,53125
Soja 5 11,5 24 6,5 19,5 4 2,5 10 57,0 3249,00 406,12500
Girasol 1 11,5 8,5 13,5 6,5 8,5 17,5 2,5 69,5 4830,25 603,78125
total= 9822,56250
2
.
1
12 12
3( 1) *9822,5625 3*33
( 1) 32*33
0,011*116,79 99 17,7905
I i
i
i
R
H N
N N n=
= − + = − =
+
= − =
∑
Dado que H = 17,79 > 7,815 se rechaza la hipótesis nula
Conclusión: A un nivel de significación del 5%, hay evidencias suficientes para rechazar H0 (θ1= θ2= θ3= θ4=
θ) por lo que se puede suponer que al menos alguna de las medianas poblacionales de la concentración de
esculeno en aceites vegetales difiere de las restantes en las poblaciones de aceites vegetales de maíz,
maní, girasol y soja.
Nota: La potencia-eficiencia de la prueba de Kruskal Wallis comparada con el ANOVA de un factor
modelo 1 es de 3/π = 95,5%, Algunos experimentadores para trabajar con el ANOVA paramétrico ante
ésta situación aplican alguna transformación a la variable respuesta (por ejemplo: ytranf = ln(y), ytranf =
y0,5, ytranf = 1/y, etc,) para lograr que se cumplan las condiciones con respecto a la variable
transformada.
Nosotros no veremos transformaciones pues escapa de los alcances de esta materia.
PROBLEMAS PROPUESTOS
1) Para comparar cinco dietas para porcinos se seleccionaron veinticinco animales al azar para ser usa-
dos en el experimento. Aleatoriamente se les asignó una dieta a cada grupo, midiéndose sobre cada
animal el peso inicial y el peso al cabo de 30 días.
Responder:
a) La unidad experimental es ...........................................................................................................
b) Los tratamientos son...................................................................................................................
c) La observación es.......................................................................................................................
d) El objetivo del trabajo es............................................................................................................
2) Se realizó un ensayo para estudiar el efecto de 5 raciones sobre la ganancia de peso de novillos. Para ello
se emplearon 5 lotes de 6 animales cada uno seleccionados aleatoriamente, de la misma raza y edad. El
diseño experimental fue un DCA. Los datos corresponden a la ganancia de peso por animal expresada en
kg, para el período total del ensayo.
Tratamientos
1 2 3 4 5
43 54 62 61 85
49 54 55 66 83
39 50 59 62 89
41 48 57 64 91
43 51 60 68 89
46 55 56 62 82
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
46
Estadística descriptiva
Tratamientos Variable n Media D.E. Mín Máx Mediana
1 Ganancia 6 43.50 3.56 39.00 49.00 43.00
2 Ganancia 6 52.00 2.76 48.00 55.00 52.50
3 Ganancia 6 58.17 2.64 55.00 62.00 58.00
4 Ganancia 6 63.83 2,71 61.00 68.00 63.00
5 Ganancia 6 86.50 3.67 82.00 91.00 87.00
Total 30 60,80 15,04 39,00 91,00 58,00
Estadística descriptiva
Variable n Media D.E. Mín Máx
C1 30 60,80 15,04 39,00 91,00
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar en forma completa si se cumplen las condiciones para un DCA modelo fijo paramétrico
b) Teniendo en cuenta lo decidido en el punto anterior y que el nivel de significación es del 5%, realice la
prueba en forma completa
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
REGanancia 30 0.00 2,88 0.92 0.1103
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R²
abs dif 30 0,06
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 4,03 4 1,01 0,41 0,8031
Tratamientos 4,03 4 1,01 0,41 0,8031
Error 62,21 25 2,49
Total 66,24 29
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
Ganancia 30 0,96 0,96 5,10
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
47
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F
Modelo 6320,13 4 1580,03 164,13
Tratamientos 6320,13 4 1580,03 164,13
Error 240,67 25 9,63
Total 6560,80 29
Tabla 4
Prueba de Kruskal Wallis
Variable Tratamientos N Medianas H p
Ganancia 1 6 43,00 27,35 <0,0001
Ganancia 2 6 52,50
Ganancia 3 6 58,00
Ganancia 4 6 63,00
Ganancia 5 6 87,00
4) Un fisiólogo estudió la función pituitaria de las gallinas ponedoras asociada a cada etapa del régimen es-
tándar para muda forzada de plumas que usan los productores de huevos con el fin de mantener a las aves
en producción. Las etapas de la dieta son cinco: (A) premuda, previa al inicio del régimen; (B) ayuno de 8
días; (C) 60 gr de salvado durante 10 días; (D) 80 gr de salvado durante 10 días; y (E) mezcla de malta du-
rante 42 días. En el estudio se utilizaron 25 gallinas elegidas aleatoriamente de la población. Todas fueron
puestas bajo la misma dietaen jaulas. Después de cada etapa, se seleccionaban aleatoriamente grupos de
cinco y se las sacrificaba. Entre los compuestos medidos, el fisiólogo estaba interesado en saber si las distin-
tas etapas afectaban la concentración de T3 en suero (medida en ng/dl). Se obtuvo como resultado el si-
guiente conjunto de observaciones:
Etapas de Dieta Concentración de T3 (ng/dl) en suer o
Premuda (A) 94.09 90.45 99.38 91 98.00
Ayuno (B) 117.9 115 115.23 129.06 117.61
60 g de Salvado (C) 197.18 207.31 194 192.50 202.25
80 g de Salvado (D) 112.47 117.51 119.92 112.01 110
Mezcla de malta (E) 83.14 89.59 87.76 82.94 79.21
Estadística descriptiva
Etapas Variable n Media D.E. Mín Máx Mediana Q1 Q3
a T3 5 94,58 4,03 90,45 99,38 94,09 91,00 98,00
b T3 5 118,96 5,80 115,00 129,06 117,61 115,23 117,90
c T3 5 198,65 6,11 192,50 207,31 197,18 194,00 202,25
d T3 5 114,38 4,15 110,00 119,92 112,47 112,01 117,51
e T3 5 84,53 4,15 79,21 89,59 83,14 82,94 87,76
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar si se cumplen las condiciones para un DCA modelo fijo paramétrico.
b) Teniendo en cuenta lo decidido en el punto anterior y que el nivel es del 5%, realice la prueba
correspondiente en forma completa.
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RE_T3 25 -4,5E-03 1,03 0,90 0,0469
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
abs dif 25 0,04 0,00 97,95
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
48
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 8,66 4 2,17 0,19 0,9412
Etapas 8,66 4 2,17 0,19 0,9412
Error 228,87 20 11,44
Total 237,53 24
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
T3 25 0,99 0,99 4,04
Cuadro de Análisis de la Varianza (SC tipo III)
F,V, SC gl CM F p-valor
Modelo 40488,68 4 10122,17 415,95 <0,0001
Etapas 40488,68 4 10122,17 415,95 <0,0001
Error 486,70 20 24,33
Total 40975,38 24
Tabla 4
Prueba de Kruskal Wallis
Variable Etapas N Medias D,E, Medianas H
T3 a 5 94,58 4,03 94,09 22,24
T3 b 5 118,96 5,80 117,61
T3 c 5 198,65 6,11 197,18
T3 d 5 114,38 4,15 112,47
T3 e 5 84,53 4,15 83,14
5) (Un experimento ilegal). Es un hecho muy conocido que casi todos los caballos que corren carreras
“cuadreras” o extraoficiales, reciben tratamientos medicamentosos que en las carreras oficiales no están
permitidos. Todos los cuidadores afirman que de otro modo no es posible competir, pero la efectividad de
esos tratamientos suele ser objeto de polémicas. A tal efecto se diseñó un experimento para comparar a
tres de tales tratamientos, con 5 caballos elegidos al azar cada uno y un grupo testigo, sin medicar. Se
utilizaron, en consecuencia, 20 caballos de características lo más similares posibles (en velocidad, edad,
sanidad). Se registraron en cada caso los tiempos (en segundos) empleados en una corrida a fondo so-
bre la distancia clásica cuadrera de 300 metros en pista normal, con los siguientes resultados:
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
49
Trat 1 Trat 2 Trat 3 Trat 4 (control)
17,96 17,80 18,30 18,60
17,62 17,90 18,50 18,80
17,90 17,68 18,40 18,60
17,70 17,72 18,22 18,90
17,70 18,00 18,30 18,80
Estadística descriptiva
Tratamiento Variable n Media D.E. Mín Máx Mediana
1 Tiempo 5 17.78 0.15 17.62 17.96 17.70
2 Tiempo 5 17.82 0.13 17.68 18.00 17.80
3 Tiempo 5 18.34 0.11 18.22 18.50 18.30
4 Tiempo 5 18.74 0.13 18.60 18.90 18.80
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar si se cumplen las condiciones para un DCA modelo fijo paramétrico
b) Realice la prueba correspondiente en forma completa y al 10%
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RE_Tiempo 20 0.01 1.06 0.87 0.0201
Tabla 2
Análisis de la varianza
Variable N R² R² Aj CV
abs dif 20 0,02 0,00 98,82
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 2,9E-03 3 9,6E-04 0,11 0,9550
Trat 2,9E-03 3 9,6E-04 0,11 0,9550
Error 0,14 16 0,01
Total 0,15 19
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
Tiempo 20 0,92 0,91 0,72
Cuadro de Análisis de la Varianza (SC tipo III)
F,V, SC gl CM F p-valor
Modelo 3,16 3 1,05 61,90 <0,0001
Tratamiento 3,16 3 1,05 61,90 <0,0001
Error 0,27 16 0,02
Total 3,44 19
Tabla 4
Prueba de Kruskal Wallis
Variable Tratamiento N Medianas H p
Tiempo 1 5 17,70 16,17 0,0010
Tiempo 2 5 17,80
Tiempo 3 5 18,30
Tiempo 4 5 18,80
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
50
6) Interesa determinar si existen diferencias significativas entre las concentraciones medias de glucosa regis-
tradas después de aplicar diferentes drogas a conejos de cierta raza. Para ello se empleó un conjunto de 18
conejos de esa raza y se lo dividió aleatoriamente en tres grupos. Cada grupo recibió una droga diferente. Al
cabo de cierto tiempo se midió la concentración de glucosa en plasma, en mg/100 ml, y se obtuvieron los
siguientes datos:
Droga A: 94 97 84 92 95 107
Droga B: 82 73 77 81 84 73
Droga C: 91 106 102 104 107 92
Estadística descriptiva
Droga Variable n Media D.E. Mín Máx Mediana
A Concentración 6 94.83 7.47 84.00 107.00 94.50
B Concentración 6 78.33 4.72 73.00 84.00 79.00
C Concentración 6 100.33 7.06 91.00 107.00 103.00
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar si se cumplen las condiciones para un DCA modelo fijo paramétrico.
b) Realice el test correspondiente en forma completa.
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RE_Concentración 18 0,00 1,03 0,96 0,7830
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
abs dif 18 0,02 0,00 91,27
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 5,44 2 2,72 0,15 0,8649
Droga 5,44 2 2,72 0,15 0,8649
Error 278,67 15 18,58
Total 284,11 17
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
Concentración 18 0,71 0,67 7,16
Cuadro de Análisis de la Varianza (SC tipo III)
Estadística Analítica 2017 Fac. Cs. Veterinarias(U.B.A)
51
F,V, SC gl CM F p-valor
Modelo 1573,00 2 786,50 18,45 0,0001
Droga 1573,00 2 786,50 18,45 0,0001
Error 639,50 15 42,63
Total 2212,50 17
Tabla 4
Prueba de Kruskal Wallis
Variable Droga N Medianas H p
Concentración A 6 94,5011,38 0,0033
Concentración B 6 79,00
Concentración C 6 103,00
CUESTIONARIO
1.- ¿Cuáles son las condiciones necesarias para un D.C.A. paramétrico? ¿Cómo puede verificarlas y/o
garantizarlas?
2.- ¿Cuáles son las condiciones necesarias para un D.C.A. no paramétrico? ¿Cómo puede verificarlas y/o
garantizarlas?
3.- En los problemas propuestos 3) y 4) indique:
Para el problema propuesto 3:
a) Factor en estudio: ..........................................................................................................................
b) Tratamientos: ................................................................................................................................
c) Unidad experimental: .....................................................................................................................
d) Observación: .................................................................................................................................
Para el problema propuesto 4:
a) Factor en estudio: ..........................................................................................................................
b) Tratamientos: ................................................................................................................................
c) Unidad experimental: .....................................................................................................................
d) Observación: .................................................................................................................................
4.- En los problemas propuestos 5) y 6) indique los supuestos que tuvo en cuenta para elegir el tipo de
análisis adecuado.
5.- En un Análisis de la Varianza paramétrico, ¿por qué la región crítica es unilateral derecha?
6.- Indique los modelos teóricos que se utilizan para el análisis de la varianza paramétrico. Señale los
parámetros del modelo y sus estimadores.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
52
PROBLEMAS COMPLEMENTARIOS
UNIDADES TEMÁTICAS 1 y 4
01.- Dos analistas, X e Y, midieron la dureza del agua en una ciudad. Se desea comparar si los resultados
de X e Y son similares, por lo cual se toma una muestra, de tamaño 10, de agua de distintas regiones de
la Ciudad de Buenos Aires. Cada analista midió las 10 muestras.
a) Verifique las condiciones necesarias para analizar la media de las diferencias entre estos dos analistas.
b) Estime mediante un intervalo de confianza del 95% para la media de las diferencias entre estos dos
analistas.
i
x 0,46 0,62 0,37 0,40 0,44 0,58 0,48 0,53 0,59 0,68
i
y 0,72 0,61 0,73 0,51 0,33 0,48 0,43 0,35 0,67 0,78
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
X 10 0,52 0,10 0,94 0,7249
Y 10 0,56 0,16 0,89 0,2978
D(X-Y) 10 -0,05 0,17 0,94 0,6373
02.- En un estudio sobre llamadas de apareamiento, realizado en el sapo arbóreo (Hyla ewingi), se estimó
en Tasmania, en una muestra aleatoria de 29 observaciones, que la duración de las llamadas tenía una
media de 189 ms (milisegundos) y un desvío estándar de 32 ms; y en Bristbane, en una muestra de 31
observaciones, una media de 216 ms y un desvío estándar de 28 ms. Suponiendo que ambas variables
en estudio se distribuyen normalmente:
a) Estime un intervalo de confianza del 95% para el cociente de varianzas
b) Utilizando la información otorgada por el intervalo del inciso anterior decida acerca de las condiciones
necesarias para realizar una prueba con la hipótesis de trabajo: “el tiempo medio de llamada del sapo
arbóreo es mayor en Britsbane que en Tasmania” y efectúe la prueba en forma completa.
03.- Para realizar un experimento sobre engorde intensivo de novillos una estación experimental somete a
24 novillos cruza de la misma edad al siguiente experimento: los individuos son asignados aleatoriamente
a 3 grupos (1, 2 y 3) y antes de llevarlos a la pastura son inoculados con tres dosis de un novedoso anabó-
lico no esteroide. Luego de 45 días se pesan los animales obteniendo para cada uno de ellos el aumento
promedio diario de peso (en kg). Los resultados son los siguientes:
Grupo 1 Grupo 2 Grupo 3
0,4 0,7 0,7
0,5 0,7 0,8
0,4 0,8 0,8
0,2 0,6 0,9
0,4 0,5 0,6
0,6 0,7 0,8
0,5 0,7 0,6
0,5 0,7 0,7
Estadística descriptiva
Dosis Variable n Media D.E. Mín Máx Mediana
1 AumPeso 8 0,44 0,12 0,20 0,60 0,45
2 AumPeso 8 0,68 0,09 0,50 0,80 0,70
3 AumPeso 8 0,74 0,11 0,60 0,90 0,75
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
53
a) Verificar las condiciones para elegir la variable pivotal de un DCA paramétrico
b) Realice la prueba correspondiente en forma completa
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RDUO_AumPeso 24 0,00 0,10 0,93 0,2558
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
abs dif 24 0,07 0,00 90,85
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 0,01 2 3,8E-03 0,81 0,4593
Dosis 0,01 2 3,8E-03 0,81 0,4593
Error 0,10 21 4,6E-03
Total 0,11 23
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
AumPeso 24 0,63 0,60 17,06
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 0,40 2 0,20 18,10 <0,0001
Dosis 0,40 2 0,20 18,10 <0,0001
Error 0,23 21 0,01
Total 0,63 23
Tabla 4
Prueba de Kruskal Wallis
Variable Dosis N Medias D.E. Medianas H p
AumPeso 1 8 0,44 0,12 0,45 14,16 0,0006
AumPeso 2 8 0,68 0,09 0,70
AumPeso 3 8 0,74 0,11 0,75
04.- En un experimento, se compararon las propiedades hipnóticas de dos drogas A y B. Para ello se
midió, con cada una de las drogas, la cantidad de horas ganadas en sueño por cada sujeto. La aparente
superioridad de la droga B en el promedio de horas, ¿puede ser atribuida a las diferencias entre los
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
54
sujetos? (α=0,05)
DROGA A 2,2 3,5 1,7 4,4 2,8 1,6 2,5 2,0 2,4 2,9
DROGA B 5,3 1,2 5,9 2,3 6,7 5,0 6,1 1,3 4,9 6,0
Realizar el análisis estadístico suponiendo que las drogas se aplicaron:
a) a dos grupos diferentes de sujetos (asumir homogeneidad de varianzas).
b) a los mismos sujetos (en orden aleatorio y dejando transcurrir un tiempo prudencial).
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
A 10 2,60 0,85 0,92 0,5220
B 10 4,47 2,07 0,80 0,0190
difAB 10 -1,87 2,54 0,75 0,0028
05.- Un epidemiólogo desea comprar la efectividad de dos vacunas antirrábicas. Trabajó con 19 perros
Beagles, los dividió en 2 grupos. El grupo 1, de 10 perros, recibió una dosis de la vacuna tipo 1 y el
grupo 2, de 9 perros, recibió una dosis de refuerzo de la vacuna tipo 2. El titulo de anticuerpos se regis-
tró dos semanas después. Realizar la hipótesis de interés al 5%.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
vac1 10 4,38 2,81 0,97 0,8890
vac2 9 3,22 2,25 0,90 0,3791
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
abs dif 10 2,00 2,36 0,94 0,6812
Estadística descriptiva
Variable n Media D.E. Mín Máx
vac1 10 4,38 2,81 -0,68 8,40
vac2 9 3,22 2,25 -0,15 6,10
Prueba F para igualdad de varianzas
Variable Grupo(1) Grupo(2) n(1) n(2)Var(1) Var(2) F p
rta {vac1} {vac2} 10 9 7,8 8 5,06 1,56 0,5428
Prueba T para muestras Independientes
Variable Grupo(1)Grupo(2) n(1)n(2) media(1)media(2) p(Var.Hom.) T p
rta {vac1} {vac2} 10 9 4,38 3,22 0,5428 0,99 0,3376
Prueba T (muestras apareadas)
Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral
vac1 vac2 9 1,19 3,23 1,10 0,3025
06.- Un experimentador quiere probar si un nuevo probiótico reduce la mortandad en pollitos parrilleros.
Para esto, de manera experimental, mantiene a 200 pollitos en jaulas individuales y les asigna
aleatoriamente a la mitad el probiótico estándar y a la otra mitad el nuevo. A los 20 días, cuenta 85
sobrevivientes con el probiótico estándar y 93 con el nuevo. Pruebe si el nuevo probiótico reduce la
mortandad (α=0,05), y estime un intervalo de confianza del 95% para la diferencia de proporciones
poblacionales de sobrevivientes de ambos grupos.
07.- Se realizó un ensayo sobre el rendimiento (en kg/ha) de cultivares de papa utilizando diez parcelas
con plantas sanas y nueve con plantas enfermas por el mosaico deformante. Los datos obtenidos se
resumen en la tabla. Estimar, con una confianza del 90%, la diferencia de los rendimientos medios
poblacionales. Suponiendo que se obtuvo un p-valor=0.30 en la Prueba de homogeneidad de varianzas,
pruebe la condición para elegir la variable pivotal restante necesaria para realizar la estimación.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
55
SANAS 10 16.042 35.21 0,92 0,5220
ENFERMAS 9 12.027 42.43 0,91 0,4303
08.- Se quiere comparar la eficiencia de dos test para detectar cierto tipo de enfermedad. Para ello se
seleccionaron 200 pacientes con esa enfermedad, a 100 de ellos se les aplicó el test 1 y a los otros 100 el
test 2. En el primer caso el test dio positivo en 65 pacientes y en el segundo en 83. Construir un intervalo
de 95% de confianza para la diferencia de proporciones poblacionales de positivos.
09.- Una muestra de 150 compradores tomada en forma aleatoria en un comercio tenía un 96% de
mujeres y una muestra de 100 compradores tomada en el local de su mejor competidor resultó contener
88% de mujeres. Construir un intervalo de confianza del 90% para la diferencia de las proporciones de
compradores femeninos.
10.- Se hicieron análisis para determinar el porcentaje de gas amoníaco en un laboratorio durante 9 días
consecutivos mediante dos métodos diferentes. La composición del gas varía notablemente de un día
para otro. Los datos obtenidos son:
Método A 14 37 35 43 34 36 48 33 33
Método B 18 37 38 36 47 38 57 28 42
Determinar si hay diferencias entre los dos métodos al nivel del 5%
Estadística descriptiva
Variable n Media D.E. Var(n-1) Mediana
Método A 9 34,78 9,27 85,94 35,00
Método B 9 37,89 10,97 120,36 38,00
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Método A 9 34,78 9,27 0,88 0,2575
Método B 9 37,89 10,97 0,97 0,9367
Dif A-B 9 -3,11 6,58 0,95 0,7470
11.- Se ha demostrado que un alto contenido de nitrato en la composición de los alimentos da origen a
numerosos efectos nocivos. En un experimento se tomaron 16 ratas al azar de una línea, las mismas
fueron alimentadas con una dieta estándar. A 9 de ellas, elegidas al azar, se les dio de beber agua con
2000 ppm de nitrato. Luego se midió la ganancia de peso y se expresó en porcentaje:
A 12,7 19,3 20,5 10,5 14,0 10,8 16,6 14,0 17,2
B 18,2 22,9 10,1 14,3 10,2 17,1 15,7
¿Se puede concluir que la dosis de nitrato disminuye la ganancia de peso de las ratas? Justifique
estadísticamente su respuesta (α= 0,05). Pruebe las condiciones para elegir la variable pivotal en las que
se basa para realizar el test de hipótesis.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Dieta A 9 15,07 3,56 0,92 0,4897
Dieta B 7 15,50 4,53 0,93 0,6560
Prueba F para igualdad de varianzas
Variable Gr(1) Gr(2) n(1) n(2) Var(1) Var(2) F
PESO {A} {B} 9 7 12,66 20,56 0,62
12.- Para realizar un ensayo sobre la actividad estrogénica se compararon varias soluciones que habían
sido sometidas a una técnica de inactivación in vitro. Se inyectaron ratones hembra y como medida de la
actividad estrogénica se utilizó el peso del útero. Los siguientes datos de los pesos de úteros, en mg, de
diez ratones hembra para cada uno de los tratamientos: control y dos soluciones diferentes son:
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
56
Control 89,8 93,8 112,6 101,6 97,2 106,5 98,1 94,4 105,3 95,7
Solución 1 64,4 79,8 69,4 76,3 67,1 71,5 78,2 68,6 70,4 71,9
Solución 2 75,2 62,4 73,8 71,8 65,1 74,6 66,8 70,1 64,7 69,3
Estadística descriptiva
Soluciones Variable n Media D.E. Mín Máx Mediana
0 Peso 10 99.50 6.94 89.80 112.60 97.65
1 Peso 10 71.76 4.95 64.40 79.80 70.95
2 Peso 10 69.38 4.50 62.40 75.20 69.70
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar si se cumplen las condiciones para elegir la variable pivotal para un DCA modelo fijo
b) Realice la prueba correspondiente en forma completa
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RE_Peso 30 0.00 1.06 0.96 0.6534
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
abs dif 30 0,05 0,00 79,70
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 16,45 2 8,23 0,71 0,5010
Trat 16,45 2 8,23 0,71 0,5010
Error 313,20 27 11,60
Total 329,65 29
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
Peso 30 0.87 0.86 6.94
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 5607.95 2 2803.98 90.59 <0.0001
Soluciones 5607.95 2 2803.98 90.59 <0.0001
Error 835.68 27 30.95
Total 6443.63 29
Tabla 4
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
57
Prueba de Kruskal Wallis
Variable Soluciones N Medianas H p
Peso 0 10 97.65 19.79 0.0001
Peso 1 10 70.95
Peso 2 10 69.70
13.- Se estudió la influencia de un nuevo fertilizante sobre el rendimiento de una oleaginosa. Como se
desea estudiar el comportamiento del fertilizante bajo distintas condiciones climáticas, se eligieron 8
estaciones experimentales ubicadas estratégicamente en una región y en cada estación se tomó una
parcela. En una mitad, elegida aleatoriamente, se adicionó fertilizante y la otra mitad de la parcela no
recibió fertilizante.
Se han obtenido los siguientes resultados expresados en kg de producción por ha:
Estación número: 1 2 3 4 5 6 7 8
Con fertilizante 810 540 930 690 710 720 840 740
Control 610 405 805 560 570 620 730 620
En función del costo del fertilizante, los productores no estarían dispuestos a invertir en fertilizante si el
aumento debido al uso es de a lo sumo 140 kg/ha. ¿Con un nivel de significación del 10%, cree que los
productores invertirán en fertilizante?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
confertil 8 747,50 116,10 0,98 0,9469
sinfertil 8 615,00 118,65 0,96 0,8351
Dif (conf - sinf) 8 132,50 30,24 0,85 0,141 2
14.- Los siguientes datos indican el aumento de peso, en g, de 20 ratas elegidas al azar de las cuales la
mitad recibió proteínade maní crudo y la otra mitad de maní tostado. Probar si el tostado del maní ha
tenido efecto sobre su valor proteico medio (α=0,05). Suponga homogeneidad de varianzas y
distribuciones similares, y tenga presente que se sospecha que el tostado aumenta el valor proteico del
maní, y que, obviamente, a mayor nivel proteico mayor aumento de peso.
Crudo 61 61 56 63 56 63 59 56 44 61
Tostado 55 54 47 59 51 61 57 54 62 58
Shapiro-Wilks (modificado)
dieta Variable n Media D.E. W* p (una cola)
Crudo peso 10 58,00 5,64 0,80 0,0140
Tostado peso 10 55,80 4,59 0,96 0,8156
Crud-Tost peso 10 2,2 1,23 0,80 0, 0140
15.- La desviación estándar de la concentración de sodio en la sangre de una muestra de 10 anguilas
marinas, tomada al azar, fue de 40,5 mg%; mientras que para una muestra de 10 anguilas de agua dulce,
también tomada al azar, resultó 32,1 mg%. ¿Se puede concluir estadísticamente que la varianza de la
concentración de sodio en las anguilas marinas es superior a la de agua dulce? (α=0,01). ¿En qué se
debe condiciones para elegir la variable pivotal basar para realizar la prueba de hipótesis sugerida?
16.- Con el fin de probar si un tratamiento especial sobre tubos de ensayo modifica la resistencia al calor,
se realizó un pequeño experimento. De un lote de tubos se tomaron dos muestras y a una se le aplicó el
tratamiento. Luego fueron probados y registradas las resistencias al calor, obteniéndose:
NO TRATADOS TRATADOS
X = 81,4 UC X = 91,8 UC
S² = 37,3 UC2 S² = 40,7 UC2
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
58
n = 15 n = 15
Estimar la diferencia entre las medias poblacionales de los tubos tratados y no tratados mediante un
intervalo de confianza del 95%. Suponiendo que se obtuvo un p-valor de 0.30 y 0.8 en las Pruebas de
Shapiro Wilks para los tratados y no tratados respectivamente, pruebe la condición restante para elegir la
variable pivotal necesaria para realizar la estimación.
Prueba F para igualdad de varianzas (BILATERAL)
Variable Grupo(1) Grupo(2) n(1) n(2) F p
Trat {1} {2} 15 15 2,06 0,188
17.- En un experimento se cruzaron conejos gigantes polacos y conejos flamencos en dos criaderos
obteniéndose 10 conejos de esa cruza en el criadero 1, y 61 en el criadero 2. Los siguientes datos
corresponden a longitudes del fémur (en mm) de los conejos resultantes de la cruza.
n X S
Criadero 1 10 83,30 1,65
Criadero 2 61 80,50 3,81
¿Es significativamente mayor la varianza de las longitudes del fémur entre conejos del criadero 2 con
respecto a los del criadero 1? Justifique estadísticamente su respuesta (α = 0,05). ¿En qué condiciones
para elegir la variable pivotal se basa para realizar la prueba de hipótesis?
18.- Dos establecimientos dedicados al cultivo de maíz híbrido siembran en quince parcelas diferentes,
obteniendo los siguientes rendimientos (en Kg/parcela):
ESTABLECIMIENTO 1 : 114 - 86 - 93 - 75 - 102 - 89 - 83 - 89 - 92 - 96 – 100 - 98 - 87 - 80 - 86
ESTABLECIMIENTO 2 : 107 - 94 - 86 - 70 - 78 - 90 - 82 - 77 - 95 - 84 - 100 - 89 - 92 - 99 - 85
Construir un intervalo del 99% de confianza para el cociente de las varianzas de los rendimientos de maíz
híbrido entre los establecimientos. ¿En qué condiciones para elegir la variable pivotal se basa para
realizar el intervalo de confianza?
19.- Dos tratamientos A y B fueron asignados al azar a cada uno de dos lotes de animales tomados
aleatoriamente de una población. La respuesta registrada fue el aumento de peso, en kg, durante el
período experimental. Datos:
A
x =1,57kg ;
B
x =1,89kg ; nA=11 ; nB=10 ; s
2
A=0,15kg
2; s2B=0,12kg
2.
Calcular un intervalo de confianza para el cociente de las varianzas (A/B) de los tratamientos, con un
coeficiente de confianza del 95% suponiendo que las variables en estudio se distribuyen normalmente.
¿Qué conclusiones puede extraer del experimento?
20.- En un área de 30 m x 10 m sembrada con plantas de una determinada especie, se observaron 296
plantas con flor y 987 sin flor. En otra área del mismo tamaño sembrada con 1000 plantas de la misma
especie se observaron sólo 200 con flor. ¿Puede suponerse a un nivel del 1% que la proporción de
plantas florecidas es la misma en ambas áreas?
21.- Con el fin de comparar la efectividad de tres fármacos se seleccionaron al azar doce peces con
cierta infección viral de una población, y se los dividió aleatoriamente en tres grupos, a cada grupo se
lo medicó con un fármaco diferente y se midió la carga viral al principio y al final del tratamiento para
cada animal.
Responder:
a- La unidad experimental es ...................................................................................................
b- Los tratamientos son ...........................................................................................................
c- La observación es ................................................................................................................
d- El objetivo del trabajo es .....................................................................................................
22.- Se realiza un experimento para comparar la absorción media de garrapaticida por unidad de tejido
muscular, registrándose la concentración sanguínea del principio activo. Para ello se seleccionan al
azar dieciséis perros y se los subdivide en cuatro grupos aleatoriamente. A cada uno de los subgrupos
se le asigna un producto diferente: A, B, C y D.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
59
Responder:
a- La unidad experimental es ..................................................................................................
b- Los tratamientos son ..........................................................................................................
c- La observación es ...............................................................................................................
d- El objetivo del trabajo es ....................................................................................................
23.- La columnista Ann Landers se preguntó si tener hijos valía la pena considerando los problemas
que acarrean. Le preguntó a los lectores: “Si pudiera volver a empezar, ¿valdría la pena tener hijos?”
Unas semanas después el titular de su columna era: “El 70% de los padres afirman que tener hijos no
vale la pena”, ya que el 70% de los padres norteamericanos que le escribió opinaron que si pudieran
volver a elegir no tendrían hijos. ¿Es esta conclusión válida? Justificar.
24.- Con el objeto de medir el efecto del ejercicio en enfermedades coronarias, un grupo de investiga-
dores decidió comparar el índice de enfermedad en dos grandes grupos de personas que trabajan en
los colectivos de Buenos Aires: choferes e inspectores. Los inspectores realizan más ejercicio, ya que
su actividad requiere que estén caminando gran parte del día, mientras que la tarea de los choferes es
más sedentaria. Se consideraron aquellas personas que vinieran realizando el mismo trabajo durante
los últimos 8 años y además la distribución de las edades en ambos grupos es similar. Se observó que
el índice de enfermedades coronarias entre los conductores era sustancialmente mayor.
a) Este experimento ¿es observacional o experimental? Justificar.
b) ¿Por qué cree usted que los investigadores le dan importancia a la distribución de las edades?
c) ¿Cree que puede haber efectos confundidos no mencionados en el experimento que expliquen el
resultado obtenido?
25.- Los registros de 3000 historias clínicas muestran que los fumadores están más propensos a de-
primirse que los no fumadores.
a) ¿De qué tipo de estudio se trata?
b) ¿Considera que están controlados todos los factores?
26.- Estudios realizados en el período 1850-1900 enEstados Unidos, muestran que el promedio de
duración de los matrimonios era de 12 años.
a) ¿De qué tipo de estudio se trata?
b) Mencione posibles factores de confusión
c) Usted está interesado en diseñar un experimento para analizar el mismo objetivo, ¿qué factores
tendría en cuenta?
d) ¿Muestran estas observaciones que la proporción de divorcios era alta en ese periodo?
27.- Se desea saber si cuatro tratamientos antiinflamatorios utilizados en patologías articulares difieren
en cuanto a su efectividad. Se eligieron al azar 24 caballos con dicho signo clínico y se los repartió en 4
grupos de igual tamaño y a cada uno se le asigna un tratamiento distinto. Al final de un período deter-
minado, cada grupo es revisado clínicamente para cuantificar la efectividad del tratamiento y el puntaje
asignado corresponde a la reducción del área inflamada y va de 0 a 100. Se obtuvieron los siguientes
puntajes:
Tratamiento
1 2 3 4
64 76 58 95
75 81 74 90
72 90 76 80
80 80 60 87
79 89 75 85
71 85 69 89
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
60
Estadística descriptiva
Trat Variable n Media D.E. Mín Máx Mediana
1 Puntaje 6 73,50 5,89 64,00 80,00 73,50
2 Puntaje 6 83,50 5,47 76,00 90,00 83,00
3 Puntaje 6 68,67 7,89 58,00 76,00 71,50
4 Puntaje 6 87,67 5,05 80,00 95,00 88,00
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar si se cumplen las condiciones para elegir la variable pivotal de un DCA modelo fijo paramé-
trico
b) Realice la prueba correspondiente en forma completa al 5%
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RE_Puntaje 24 0.02 1.05 0.88 0.0224
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
abs dif 24 0,08 0,00 74,08
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 22,83 3 7,61 0,61 0,6135
Trat 22,83 3 7,61 0,61 0,6135
Error 247,67 20 12,38
Total 270,50 23
Tabla 3
Análisis de la varianza
Variable N R² R² Aj CV
Puntaje 24 0.64 0.59 7.88
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 1383.67 3 461.22 12.11 0.0001
Trat 1383.67 3 461.22 12.11 0.0001
Error 761.67 20 38.08
Total 2145.33 23
Tabla 4
Prueba de Kruskal Wallis
Variable Tratamientos N Medianas H p
Puntaje 1 6 73.50 16.50 0.0009
Puntaje 2 6 83.00
Puntaje 3 6 71.50
Puntaje 4 6 88.00
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
61
28.- De cierto producto se tomaron 25 muestras, lo más parecidas posibles y se almacenaron bajo dife-
rentes condiciones (métodos). Se trata de ver con los datos de hidratación del cuadro adjunto si hay
diferencias significativas entre los métodos de almacenamiento en cuanto al contenido de agua (en %).
Método
A B C D E
8,30 7,90 8,10 7,40 7,60
8,10 7,10 8,50 8,50 7,70
8,40 7,90 7,82 8,50 7,90
8,30 7,80 8,30 8,50 7,98
8,40 7,68 8,15 8,22 8,10
Estadística descriptiva
Método Variable n Media D.E. Mín Máx Mediana
A Hidratación 5 8.30 0.12 8.10 8.40 8.30
B Hidratación 5 7.68 0.33 7.10 7.90 7.80
C Hidratación 5 8.17 0.25 7.82 8.50 8.15
D Hidratación 5 8.22 0.48 7.40 8.50 8.50
E Hidratación 5 7.86 0.20 7.60 8.10 7.90
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems:
a) Verificar si se cumplen las condiciones para elegir la variable pivotal de un DCA modelo fijo paramé-
trico
b) Realice la prueba correspondiente en forma completa al 5%
SALIDAS Y GRAFICOS OBTENIDOS POR COMPUTADORA:
Tabla 1
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RE_Hidratación 25 0,00 1,02 0,87 0,0078
Tabla 2
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
abs dif 25 0,07 0,00 148,73
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 0,10 4 0,03 0,36 0,8329
Método 0,10 4 0,03 0,36 0,8329
Error 1,41 20 0,07
Total 1,51 24
Tabla 3
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
62
Análisis de la varianza
Variable N R² R² Aj CV
Hidratación 25 0,44 0,33 3,76
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 1,43 4 0,36 3,89 0,0170
Método 1,43 4 0,36 3,89 0,0170
Error 1,84 20 0,09
Total 3,26 24
Tabla 4
Prueba de Kruskal Wallis
Variable Método N Medianas H p
Hidratación A 5 8,30 11,75 0,0185
Hidratación B 5 7,80
Hidratación C 5 8,15
Hidratación D 5 8,50
Hidratación E 5 7,90
29.- La flebitis es una inflamación de las venas que altera el equilibrio hemodinámico en el individuo que
la padece, que generalmente presenta otros signos cardiológicos. Se puede producir por causas natu-
rales o artificiales como, por ejemplo, la aplicación endovenosa de ciertas drogas, ya sea por la droga
en sí misma (principio activo), o por el excipiente (vehículo).
El problema de detectar la aparición de flebitis es de particular importancia para los investigadores,
ya que se pueden prevenir complicaciones cardíacas.
Este estudio se diseñó con la finalidad primordial de buscar mecanismos para la detección temprana
de la misma. Para ello se trabajó con conejos del bioterio y se eligió como droga a la amiodarona (anti-
arrítmico), para ser aplicada por vía endovenosa, ya que como efecto colateral se observa la aparición
de flebitis en el lugar de la aplicación.
Se sospecha que un aumento en la temperatura de los tejidos cercanos al lugar de la administración
intravenosa serían señal de una inflamación inminente.
Se administraron tres tratamientos intravenosos en conejos. Estos fueron:
� amiodarona en una solución excipiente
� sólo una solución excipiente
� una solución salina (control)
Los conejos utilizados como animales de prueba se asignaron al azar a los tres grupos de tratamien-
tos y se les insertó una aguja en la vena de una de las orejas, por donde les fueron suministradas las
soluciones.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
63
Un incremento en la temperatura de la oreja tratada se consideró como posible indicador temprano
de flebitis. La diferencia en la temperatura de las orejas (tratada menos no tratada) se usó como varia-
ble respuesta.
El incremento medio estimado en la temperatura de las orejas de conejos tratados con amiodarona
más excipiente fue de 1,20ºC, que es un valor con significado clínico, mientras que las estimaciones
medias respectivas para las soluciones excipiente y salina fueron de 0,13ºC y 0,000ºC, que no son
significativas en el sentido clínico.
Si la amiodarona incrementa la temperatura más que la solución excipiente, entonces se presumi-
ría que contribuye a la inflamación de los tejidos. De la misma manera, la comparación de la solución
excipiente con la salina proporcionaría información sobre la contribución del excipiente a la inflamación
de los tejidos.
Identificar en este diseño:
¿Cuál es la variable respuesta a analizar?
¿Qué factores se controlaron mediante el diseño experimental?
a) ¿Qué hipótesis se planteó elinvestigador?
¿Qué conclusiones podrían resultar del experimento?
¿Considera que se han respetado los principios básicos del diseño experimental (repetición, aleatorización
y control local)?
30.- La vida útil de las carnes refrigeradas sin cocción es el tiempo en que un corte previamente empa-
quetado es sano, nutritivo y vendible. Un paquete de estos expuesto al aire ambiental tiene una vida útil
aproximada de 48 hs, después de la cual la carne comienza a deteriorarse por contaminación de mi-
crobios, degradación del color y encogimiento. El empaque al vacío es efectivo para suprimir el desa-
rrollo de microbios; sin embargo, continúan siendo un problema los otros aspectos.
Algunos estudios recientes sugieren las atmósferas controladas de gas, como alternativa a los
empaques actuales. Dos atmósferas que prometen combinar la capacidad de suprimir el desarrollo de
microbios con la conservación de las cualidades de la carne son:
1) dióxido de carbono puro (CO2) y
2) mezclas de monóxido de carbono(CO), oxígeno (O2) y nitrógeno (N2).
Se cree que alguna forma de atmósfera controlada proporcionará un entorno más efectivo de em-
paque para el almacenamiento de carne.
En base a las siguientes preguntas previas:
a. Para reducir el desarrollo de bacterias, ¿es más efectiva la creación de una atmósfera
artificial que el aire ambiental del empaque comercial?
b. ¿Son más efectivos los gases que el vacío total?
c. ¿Es más efectivo el CO2 que una mezcla de CO, O2 y N2?
El investigador diseña un experimento a fin de responderlas, incluyendo carne envasada, con un em-
paque comercial de plástico, con:
1) aire del ambiente
2) al vacío
3) una mezcla de gases con 1% de CO, 40% de O2 y 59% de N2
4) 100% de CO2
Los empaques con aire del ambiente y al vacío sirven como tratamientos de control, ya que ambos
son estándares, con cuya efectividad se puede comparar la de los nuevos empaques.
A cada conjunto de empaque se le asignaron al azar tres cortes del mismo tamaño (75 g). Cada
corte se empacó por separado en las condiciones asignadas.
Se desea, en este caso, estudiar la efectividad de cada tratamiento para suprimir el desarrollo bac-
terial. Después de nueve días de almacenamiento a 4ºC en una instalación normal, se midió el número
de bacterias sicotrópicas en la carne. Las bacterias sicotrópicas se encuentran en la superficie de la
carne y se asocian con el deterioro de la carne.
Se pide:
a) Señalar el tratamiento o factor que se analiza con sus niveles.
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
64
b) Exprese la hipótesis del investigador
c) Explicar si es un diseño experimental o cuasiexperimental, justificando adecuadamente.
d) ¿Cuáles podrían ser las conclusiones de este experimento?
31.- En un estudio se analiza la hipótesis de que el ancho del escudo, o placa dorsal, medida en µm, de
ninfas de garrapata del conejo, Haemaphysalis leporispalustris, es mayor en regiones cálidas que en tem-
pladas. Para poner a prueba esta suposición se toma una muestra aleatoria de 10 conejos infestados por
la garrapata que pertenecen a granjas de clima cálido (Región 1), y lo mismo se hace en granjas de clima
templado (Región 2), seleccionándose, también 10 conejos infestados. Los datos obtenidos son:
Shapiro-Wilks (modificado)
Región Variable n Media D.E. W* p (una cola)
1 Ancho 10 209,50 50,14 0,89 0,2657
2 Ancho 10 177,30 61,58 0,81 0,0290
Prueba de Wilcoxon para muestras independientes (Ma nn Whitney)
Grupos Media
Desvío es-
tándar
Mediana
Media del
rango
Estadístico p-valor
Región 1 209,50 50,14 222,50 12,20
Región 2 117,30 61,58 199,00 8,80
122,00 0,1984
Realizar la prueba de interés al 10%.
32.- En un estudio farmacológico se compararon los tiempos de recuperación, en días, de pacientes
que fueron tratados con un principio activo, y los tiempos de recuperación de los que fueron considera-
dos como grupo control, a los que se les aplicó un placebo. Para el primer grupo se seleccionaron alea-
toriamente 20 pacientes que recibieron el principio activo. El segundo grupo, formado por 20 pacientes,
también seleccionados de manera aleatoria, recibió un placebo. ¿Se puede suponer, al 5%, que los
tiempos de recuperación son diferentes?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Principio activo 20 10.864 2.162543 0.964 0.6262
Placebo 20 12.300 3.537248 0.9697 0.7482
Al realizar la Prueba de homogeneidad de varianzas se obtuvo que F=0,3738, p-valor=0,0378
Región 1 Región 2
225 220
220 190
240 250
145 80
260 100
255 95
270 200
185 215
130 225
165 198
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
65
RESPUESTAS A LOS EJERCICIOS Unidades 1 y 4
PROBLEMAS PROPUESTOS
UNIDAD 1
2) a.-
0H
z = 4,72 RECHAZO Ho ; b.- [123,92 ; 300,08]
3) b.- estimación puntual: -1.498 ; Int. de confianza: IC [-1,78 ;-1.22]
c.-
0H
F = 0,289 RECHAZO Ho
4) b.- z ≥ 1,64 ; c.-
0H
z = 2,965 RECHAZO Ho
5) a.-
0H
t = 0,74 NO RECHAZO Ho ; b.- [-0,21 ; 0,43]
6) w= 14,54 IC: [-0,032; 4,128]
7) 42,5U = NO RECHAZO Ho
UNIDAD 4
3) a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) = 0,1103 NO RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,8031 NO RECHAZO H0
b) ANOVA del DCA paramétrico; FH0:164.13 VC: F4;25;0.95=2.76 Rechazo H0
4) a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) = 0,0469 RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,9412 NO RECHAZO H0
b) Kruskal Wallis; HH0: 22.24 VC: X
2
4;0.95=9.488 Rechazo H0
5) a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) =0.0201 RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,9550 NO RECHAZO H0
b) Kruskal Wallis; p-valor=0,001 RECHAZO H0
HH0: 146.17 VC: X
2
3;0.95=7.815 Rechazo H0
6) a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) =0.7830 NO RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,8649 NO RECHAZO H0
b) ANOVA del DCA paramétrico; p-valor=0,0001 RECHAZO H0
c) FH0:18.45 VC: F2;15;0.95=3.68 Rechazo H0
PROBLEMAS COMPLEMENTARIOS
UNIDAD 1
01) [-0,1679; 0,0759]
02) a.- [0.6161 ; 2.8474] ; b.-
0H
t = -3,485 RECHAZO Ho
04) a. Considerando muestra 1 como sujetos tratados con droga A. UH0=26 NO RECHAZO Ho ;
b. T+=2 T+0,05=11 (unilateral izq) Rechazo H0
05)
0H
t = 0.99 NO RECHAZO Ho
06) a.-
0H
z = 1,81 RECHAZO Ho ; b.- [-0,007 ; 0,167]
07) Sa2: 1503.53 (kg7ha)2 IC [3984,03 ; 4045,97] kg/ha
08) IC [ 0.06; 0.298]
09) IC [0.02 ; 0.14]
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
66
10)
0H
t = -1,42 NO RECHAZO Ho
11)
0H
t = 0.21 NO RECHAZO Ho
13)
0H
t = -0.70 NO RECHAZO Ho
14) Ucrudo = 68 NO RECHAZO Ho
15) Fho= 1.58 NO RECHAZO Ho
16) IC [5.73 ; 15.07] UC
17)
0H
F =0.187 RECHAZO Ho
18) IC [0.230 ; 4.245]
19) F9,10; 0,975 = 3,96 ; F10;9 ; 0,025 = 0,26 ; IC [ 0,32 ; 4,81 ]
20)
0H
z = 1,716 NO RECHAZO H0
31) Uobs=33 NO RECHAZO Ho
32) w=31.48
0H
t = -1,5489 NO RECHAZO Ho
UNIDAD 4
3.- a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) =0,2558 NO RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,4593 NO RECHAZO H0
b) ANOVA del DCA paramétrico; p-valor<0,0001 RECHAZO H0
FH0:18,10 VC: F2;21;0.95=3.49 (GL: 2;20) RECHAZO H0
12.-a) i) Los errores son independientes.
ii) normalidad: p -valor (Shapiro – Wilks) = 0,65 NO RECHAZO H0iii) homocedasticidad: p-valor (Levene) = 0, 05 NO RECHAZO H0
b) ANOVA del DCA paramétrico; p-valor=0,0001 RECHAZO H0
FH0:90.59 VC: F2;27;0.95=3.39 (GL: 2;25) Rechazo H0
27.- a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) = 0,0224 RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,6135 NO RECHAZO H0
b) Kruskal Wallis; p-valor=0,0009 RECHAZO H0
HH0: 16.50 VC: X
2
3;0.95=7.815 Rechazo H0
28.- a) i) Los errores son independientes.
ii) normalidad: p-valor (Shapiro – Wilks) = 0,0078 RECHAZO H0
iii) homocedasticidad: p-valor (Levene) = 0,8329 NO RECHAZO H0
b) Kruskal Wallis; p-valor=0,0185 RECHAZO H0
HH0: 11.75 VC: X
2
4;0.95=9.488 Rechazo H0
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
67
MODELO DE PARCIAL
1er. Parcial de ESTADÍSTICA ANALÍTICA Tema 2401 FECHA: …
/…/….
APELLIDO Y NOMBRE:..........................................................................................
COMISIÓN NRO:………………… Cantidad de Hojas (sin incluir éstas):……
Problema 1
El dueño de dos establecimientos ganaderos de la provincia del Chubut (A y B) puso en marcha un plan
de mejoramiento de la calidad de la lana basado en la incorporación de machos productores de una
reconocida cabaña en el establecimiento A. Luego de unos años tomó 8 animales al azar de cada esta-
blecimiento y midió la longitud (en mm) de la lana del vellón resultando:
A 80,9 80 80,7 82,3 81,8 78,1 81,1 79,5
B 77,6 77,2 76,8 78,5 78 78,1 76,2 72,9
Shapiro-Wilks (modificado)
Establecim n Media D.E. W* p(Unilateral D)
A 8 80,55 1,34 0,96 0,8696
B 8 76,91 1,78 0,81 0,0554
Prueba F para igualdad de varianzas
Variable Gr(1) Gr(2) n(1) n(2) Var(1) Var(2) F p prueba
Long {A} {B} 8 8 1,78 3,18 0,56 0,4620 Bilateral
a) (4p) Definir la o las variables de interés.
b) (6p) Analizar las condiciones aplicadas al problema para decidir qué variable pivotal utilizará para
realizar inferencias. (No es necesario que redacte la conclusión). Indicar la distribución de la variable
pivotal elegida.
c) (10p) ¿Se observa mayor longitud del vellón en el establecimiento A, al nivel de significación del
5%? Realizar el test completo.
d) (4p) ¿Cuándo utiliza la prueba de Welch? Detalle: las condiciones necesarias e hipótesis a plantear.
e) (6p) ¿Cuándo cree conveniente utilizar una prueba para la media de las diferencias apareadas?
Ejemplifique brevemente, indicando variable pivotal, y condiciones necesarias para seleccionar la co-
rrespondiente variable pivotal.
Problema 2
Interesa comparar la preferencia por la marca XXX de vacuna contra el moquillo canino en dos localida-
des.
En una localidad se seleccionaron 35 veterinarios y se halló que 21 prefieren utilizar en la marca XXX
mientras que en la otra localidad se seleccionaron 55 veterinarios y resultó que sólo 28 la prefieren para
vacunar contra el moquillo.
¿Al 5% se puede afirmar que la proporción de veterinarios que eligen la marca XXX de vacuna es supe-
rior en la segunda localidad?
a) (3p) Definir una variable de interés e indicar estimador puntual.
b) (7p) Probar al 5% la sospecha de los investigadores.
c) (3p) ¿Considera adecuado realizar un intervalo de confianza, a partir de la decisión tomada? Justifi-
car
d) (5p) ¿Cuándo realiza un test de nivel asintótico? Justificar. Comentar el o los casos que conoce
cuando las poblaciones no son independientes indicando los correspondientes estadísticos de prueba.
Problema 3
En el bioterio de una empresa farmacológica, están evaluando la ganancia de peso en ratas Wistar en
crecimiento. Por problemas económicos, deben seleccionar el alimento balanceado más económico, sin
provocar deterioro en la salud de las ratas.
En la actualidad se presentan tres proveedores de balanceados, cada uno con sus formulaciones, que,
Estadística Analítica 2017 Fac. Cs. Veterinarias (U.B.A)
68
dicen, provocan un buen aumento de peso en ratas en crecimiento. Uno de los balanceados está formu-
lado a base de carne de vaca; el otro, a base de carne de cerdo; y el último, a base de cereales.
Para probar si los aumentos de peso producidos por los balanceados difieren, seleccionan aleatoriamen-
te 15 ratas Wistar en crecimiento, y las colocan en jaulas individuales. A cada rata se le asigna uno de
los balanceados de manera aleatoria que consumen durante 10 días. Los datos obtenidos son los si-
guientes:
Vaca 79 107 102 100 87
Cereal 107 67 74 98 58
Cerdo 94 91 98 96 79
a) (6p) ¿Cuáles son los principios básicos de un diseño de experimentos? Explicar brevemente cada
uno y su importancia
b) (5p) Indicar Factor/es, nivel/es, unidad experimental y cantidad de repeticiones por tratamiento
c) (12p) Escribir el modelo correspondiente al diseño paramétrico e interpretar el o los parámetros, en
términos del problema
d) (8p) ¿Qué puede decir acerca de la validez del DCA Paramétrico? Establecer hipótesis nula y alter-
nativa cuando corresponda hacerlo y decidir, justificando la decisión.
e) (1p) Definir residuos. Calcular el residuo e23 e interpretar en términos del problema
f) (5p) Explicar brevemente en que se basa la prueba de Levene, para probar homogeneidad de Va-
rianzas.
g) (10p) A partir de los resultados obtenidos en el inciso “b”, elegir la salida adecuada de InfoStat,
para probar, con un nivel 0,05, si los aumentos de peso difieren en las ratas alimentadas con los balan-
ceados seleccionados.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)
RE_aumPeso 15 0,00 1,04 0,97 0,8942
Análisis de la varianza – Test de Levene
Variable N R² R² Aj CV
AbsDif 15 0,22 0,09 98,67
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo. 324,40 2 162,20 1,73 0,2179
Dieta 324,40 2 162,20 1,73 0,2179
Error 1122,00 12 93,50
Total 1446,40 14
Análisis de la varianza
Variable N R² R² Aj CV
aumPeso 15 0,18 0,04 16,20
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F
Modelo. 549,73 …… 274,87 ……………..
Dieta 549,73 …… 274,87 ……………..
Error 2502,00 12 …………
Total 3051,73 14
Prueba de Kruskal Wallis
Variable Dieta N D.E. Medianas H
aumPeso Cerdo 5 7,50 94,00 1,82
aumPeso Cereal 5 20,85 74,00
aumPeso Vaca 5 11,60 100,00
………………..
Firma