Logo Passei Direto

Estadística analítica guía de trabajos prácticos

User badge image
verogrismau

en

Material
¡Estudia con miles de materiales!

Vista previa del material en texto

1er CUATRIMESTRE 2022 
Estadística Analítica 
 
Cronograma temático 
 Semana Fecha Contenido Temático Modalidad 
 1 14/03/2022 Revisión de conceptos. Diseño de experimentos. 
Intervalo de confianza y prueba de hipótesis para la 
diferencia de medias. Ejercitación. 
-- 
 2 21/03/2022 
(Ju 24/03) 
 Prueba de Mann Whitney. Intervalo y prueba para 
la media de variables apareadas. Test para la 
mediana de diferencias apareadas. Ejercitación. 
Jueves 
Virtual 
 3 28/03/2022 
(Sá 02/04) 
 Intervalos de confianza y pruebas de hipótesis para 
la diferencia de proporciones de dos poblaciones. 
Distribución F. Intervalo de confianza y pruebas de 
hipótesis para el cociente de varianzas de dos 
poblaciones. Ejercitación. 
-- 
 4 04/04/2022 Introducción al Diseño de Experimentos y Diseño 
Completamente Aleatorizado (DCA). Prueba 
paramétrica. Ejercitación. 
-- 
 5 11/04/2022 
(Ju 14 y Vi 
15/04) 
DCA: Prueba no paramétrica. Ejercitación. Virtual 
 6 18/04/2022 Integración -- 
 7 25/04/2022 1er. Parcial: Martes 26/4 - Jueves 28/4 (en horario 
de cada comisión) 
-- 
 8 02/05/2022 Chi cuadrado: pruebas de bondad de ajuste, 
independencia y homogeneidad. Ejercitación. 
-- 
 9 09/05/2022 Regresión lineal simple. Dócima e intervalos de 
confianza para los parámetros de la recta utilizando 
la t de Student. Ejercitación. 
-- 
 10 16/05/2022 Regresión Lineal Simple: Intervalos de predicción y 
de confianza. Coeficiente de determinación. ANOVA 
en la regresión. Ejercitación. 
-- 
 11 23/05/2022 
(Mi 25/05) 
 Regresión lineal múltiple. Ejercitación. -- 
 12 30/05/2022 Correlación Simple paramétrica y no paramétrica. 
Ejercitación. 
Virtual 
 13 06/06/2022 Integración -- 
 14 13/06/2022 
(Vi 17/06) 
 2do. Parcial: Martes 14/6 - Jueves 16/6 (en horario 
de cada comisión) 
-- 
 15 20/06/2022 
(Lu 20/06) 
 -------- -- 
 16 27/06/2022 Recuperatorio: Martes 28/6 a las 18hs -- 
 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 1 
INFERENCIA PARA DOS POBLACIONES 
 
Objetivos específicos: 
 
 Comprender la importancia de diseñar experimentos. 
 Analizar la adecuación de cada diseño en función del contexto de la investigación. 
 Aplicar los conceptos de inferencia estadística a la comparación de dos poblaciones, utilizando como 
procedimientos la estimación y la prueba de hipótesis. 
 Seleccionar el procedimiento de inferencia adecuado en función del objetivo y del cumplimiento de los 
supuestos. 
 Resolver problemas e interpretar conclusiones aplicando los métodos de análisis sobre dos 
poblaciones. 
 
Contenidos temáticos: 
 
 Diseño de experimentos: necesidad, ventajas, propósitos, definiciones previas. Tipos de diseños y 
alcances. 
 Revisión de conceptos relativos a la estimación puntual y por intervalos. Intervalos de confianza 
para la diferencia de medias y para la media de las diferencias. Estimaciones para la diferencia de dos 
proporciones, para el cociente de varianzas, y para el cociente de desvíos estándar. 
 Revisión de conceptos relacionados con las pruebas de hipótesis. Prueba de hipótesis para: 
diferencia de medias en base a dos muestras independientes: diferencia de medias, cociente de 
varianzas, diferencias de proporciones. Muestras apareadas: media de las diferencias. 
 Relación entre intervalo de confianza y prueba de hipótesis bilateral. Aplicaciones. 
 
Glosario: 
 
Diseño de experimentos: experimento, unidad experimental, tratamiento, factor, niveles de un factor, 
observación, efecto. Repetición, aleatorización, control local. Estudios observacionales, pre-
experimentales, cuasiexperimentales y experimentales. 
Inferencia para dos poblaciones: Población, muestra. Parámetro. Estimador. Estimación. Estimador 
puntual. Intervalo. Intervalo de confianza. Nivel de confianza. Hipótesis de trabajo. Hipótesis estadística. 
Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región crítica. Regla de decisión. 
Distribución F de Snedecor. Diferencia de medias y de proporciones, cociente de varianzas para muestras 
independientes. Muestras apareadas: media de las diferencias. 
 
 
El diseño de experimentos 
 
La ciencia, tiene entre sus objetivos la explicación y comprensión de los acontecimientos. Un requisi-
to fundamental en toda ciencia fáctica es el contraste de las hipótesis planteadas, poniendo a prueba las 
mismas mediante una confrontación con la experiencia. 
El diseño experimental crea las condiciones para el contraste de la hipótesis y brinda la metodología 
estadística correspondiente para el análisis de los datos. Es el proceso de planear un experimento para 
obtener datos apropiados que puedan ser analizados mediante métodos estadísticos, con objeto de 
producir conclusiones válidas y objetivas. La metodología estadística es el único enfoque objetivo para 
analizar un problema que involucre datos sujetos a errores experimentales. Así es que hay dos aspec-
tos en cualquier problema experimental: el diseño del experimento y el análisis estadístico de los datos. 
 El propósito del diseño experimental es controlar la máxima cantidad de información pertinente 
al problema bajo investigación. Sin embargo también es importante que el diseño o plan sea tan simple 
como sea posible, a fin de ahorrar tiempo, dinero, personal y material experimental. Para que la meto-
dología de diseño de experimentos sea eficaz es fundamental que el diseño sea el adecuado. 
 
Un experimento puede realizarse por alguno de los siguientes motivos: 
 Determinar los factores principales que influyen sobre la variable respuesta. 
 Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable 
de interés o respuesta. 
 Comparar las respuestas en diferentes niveles de observación de variables controladas. 
 Obtener un modelo estadístico-matemático que permita hacer predicciones de respuestas futuras. 
 
2 
 
Para poder realizar un buen diseño experimental, es necesario previamente comprender el pro-
blema que se desea estudiar, planteándose un conjunto de preguntas clásicas: 
1- ¿Cuáles son las características de interés? 
2- ¿Qué variables afectan a las características que se van a analizar? 
3- ¿Cuántas veces debería repetirse el experimento? 
4- ¿A partir de qué valor se considerará que el efecto es significativo? 
Lo cual conduce a elegir las variables más apropiadas y sus niveles de medición, elegir la o las 
respuestas a evaluar y el modelo de diseño. 
 
Para responder estas preguntas es necesario definir claramente algunos términos fundamentales: 
 Experimento: es un ensayo o una observación, realizado bajo condiciones establecidas y contro-
ladas por el experimentador, susceptible de repetirse bajo las mismas condiciones. 
 Variable de interés o respuesta: es la variable que se desea estudiar. 
 Unidad experimental: es la parte más pequeña de material experimental, entidad física o sujeto, 
en la que se aplica un tratamiento una sola vez. También puede entenderse como cada una de las 
reproducciones del experimento. 
 Tamaño del Experimento: es el número total de observaciones recogidas en la ejecución del ex-
perimento. Ejemplo: si se asignan 10 gallinas a cada una de tres dietas el tamaño del experimento es 
30. 
 Factor: es una variable que se sospecha que puede ejercer influencia sobre la variable respuesta 
de interés. 
 Factor controlado: se denomina así a una variable manipulada por el investigador o variable in-
dependiente, a fin de estudiar su influencia sobre la variable de interés o dependiente. Algunos autores 
la denominan variable de entrada al proceso. Ejemplo: si pensamos que la temperatura o la humedad 
pueden afectar a la conservación de cierta propiedad de un alimento o medicamento, se puede contro-
lar manteniendo dicho producto con tres valores distintos de temperatura. 
 Niveles del factor: son cada una de las categorías, o valores, oformas específicas que adopta la 
variable independiente o controlada. Ejemplo: en el caso de las tres dietas, el factor dieta tiene tres 
niveles; en el caso del rodeo, el factor tiene dos niveles. 
 Tipos de factores: existen factores cuantitativos, cuyos niveles son cantidades numéricas, y cuali-
tativas, cuyos niveles son procedimientos o cualidades. Ejemplo de factor cuantitativo puede ser la 
cantidad de fertilizante adicionado a las parcelas de cultivo por hectárea con niveles: 10kg/ha – 20 
kg/ha -30 kg/ha de fertilizante. Ejemplo de factor cualitativo puede ser el tipo de nutriente adicionado a 
una dieta con niveles: potasio, magnesio y calcio. 
 Tratamiento: conjunto de condiciones experimentales o procedimientos creados para el experi-
mento en función de la hipótesis de investigación a las que se someterá a las unidades experimentales 
en un diseño elegido. Con varios factores es una de las combinaciones específicas de los niveles de 
los factores de estudio, y en un diseño unifactorial es uno de los distintos niveles del factor en el caso. 
Por ejemplo: si se asignan tres dietas distintas a las gallinas de un criadero, cada una de las dietas es 
un tratamiento. Si en un tambo se combinan tres raciones de alimentación dos rodeos con vacas en 
ordeñe (uno con vacas de alta producción y el otro con las de baja producción). Cada combinación de 
rodeo y ración constituye un tratamiento (6 tratamientos). 
 Observación: valor que asume una variable, también denominada variable respuesta, en una de-
terminada realización del experimento, es decir cada registro realizado en el contexto del experimento 
de la variable respuesta. 
 Efecto: diferencia entre los valores medios poblacionales de la variable respuesta en presencia y 
ausencia de un nivel del factor. Si la variable respuesta de interés es el engorde semanal medido en 
gramos de una gallina con cierta dieta enriquecida, el efecto es la diferencia entre el engorde medio 
poblacional con la dieta enriquecida y el engorde medio poblacional con la dieta tradicional, ambos 
medidos en gramos. 
 Diseño equilibrado o balanceado: es el diseño en el que todos los tratamientos son asignados a 
un número igual de unidades experimentales, en el cual se obtiene la misma cantidad de repeticiones 
por tratamiento. Por ejemplo hay cuatro vacas en cada combinación de rodeo y nutriente para el agua. 
 
Principios Básicos del diseño experimental 
 
Los tres principios básicos que caracterizan a un diseño experimental: 
 
 Repetición: cuando un tratamiento es aplicado a más de una unidad experimental. Las observacio-
nes repetidas con las mismas condiciones experimentales en el contexto de un experimento no coinci-
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 3 
den necesariamente, y por lo tanto una de las cuestiones fundamentales a la hora de diseñar un expe-
rimento es la selección del tamaño de muestra o número de repeticiones adecuado en cada contexto. 
Las razones por las cuales es deseable realizar repeticiones del experimento son: 
a- Proporcionar una estimación del error experimental (error generado por causas no controladas por 
el experimentador), que actúa como unidad básica de medida para indicar el significado de las di-
ferencias. 
b- Obtener mayor precisión en la estimación. 
c- Permitirnos extender el alcance de la inferencia relativa al experimento. 
 
El error experimental según el contexto puede reflejar: 
 errores de experimentación 
 errores de observación 
 errores de medición 
 variación del material experimental 
El error experimental puede reducirse generalmente adoptando una o más de las técnicas siguientes: 
 usando material experimental tan homogéneo como sea posible. 
 utilizando información proporcionada por otras variables aleatorias 
 teniendo cuidado al dirigir el experimento 
 usando un diseño experimental más eficiente. 
 
 Aleatorización: Todo procedimiento de prueba se basa en un conjunto de supuestos que deben 
satisfacerse para que la prueba resulte válida. Una de las suposiciones más frecuentes es que las ob-
servaciones, o los errores en ellas, son independientes. Dicho en otras palabras la aleatorización ha-
ce válida la prueba. 
 
 Control local: Se denomina de esta manera al conjunto de acciones que implementa el investiga-
dor con el fin de reducir al máximo posible el error experimental manteniéndolo en un rango de varia-
ción manejable. 
Por ejemplo: selección de unidades experimentales homogéneas, división en bloques, calibración de 
instrumentos, etc. 
 
Tipos de estudios de investigación 
 
Los estudios observacionales son un conjunto de estudios en los que no hay intervención por 
parte del investigador y este se limita a medir las variables que define en el estudio. Por ejemplo, los 
estudios epidemiológicos. 
Ventajas de los estudios observacionales: 
1. Son más prácticos y factibles de realizar ya que la cooperación de los sujetos es menos necesaria 
2. Sus resultados son más generalizables a poblaciones, geográfica o demográficamente definidas. 
Inconvenientes de los estudios observacionales: 
1. Escaso control de las influencias de los factores de confusión sobre los resultados del estudio. 
(Los factores de confusión son factores no tenidos en cuenta que pueden llegar a modificar los re-
sultados de un análisis). 
2. Debido a la falta de control por parte del investigador, cada estudio observacional tiende a ser úni-
co, siendo muy difícil reproducir los resultados por otro investigador. 
 
Los estudios pre-experimentales se caracterizan por analizar una única variable y prácticamente 
no existe ningún tipo de control. No existe manipulación de la variable independiente ni se utiliza el 
grupo de control; por consiguiente son escasas las posibilidades de que este grupo sea representativo 
de los demás. Este tipo de diseño consiste en administrar un tratamiento o estímulo en la modalidad de 
solo pre-prueba / posprueba. 
Un estudio de intervención, también llamado estudio experimental, es un estudio caracterizado 
por la manipulación artificial del factor de estudio por el investigador y por la aleatorización de los casos 
o sujetos en dos grupos, llamados control y tratado. 
Cuando la característica de la aleatorización en el estudio no se cumple, se dice que el estudio es 
cuasiexperimental. La falta de aleatorización de los estudios cuasiexperimentales indica que no existe 
manera de asegurar la equivalencia inicial de los grupos denominados experimental y de control. 
También es usual que, en un experimento, se utilicen controles históricos. El problema que presenta 
este tipo de diseño es que el grupo actualmente en tratamiento puede presentar importantes diferen-
cias relativas al tratamiento respecto al grupo de control histórico. Los trabajos con controles históricos 
están generalmente sesgados a favor del tratamiento, mientras que los experimentos aleatorios evitan 
este tipo de sesgo. 
4 
 
PROBLEMAS RESUELTOS 
 
 EJERCICIO 1) Mediante los estudios ecográficos, los bebés pueden actualmente ser observados 
mientras están en el seno materno. Sin embargo, gran cantidad de experimentos desarrollados en 
animales de laboratorio dieron como resultado que la aplicación de ultrasonidos podía ser la causa de 
que el peso al nacer fuese inferior al normal. 
 Ante el temor de que esta conclusión fuese aplicable a los humanos, un grupo de especialistas del 
Hospital John Hopkins de Baltimore puso en marcha un estudio para investigar el tema. En el mismo 
se observó el peso al nacimiento de los bebés que estuvieron expuestos a controles ecográficos (ultra-
sonido) y de los que no estuvieron expuestos. 
 También en este caso los bebés expuestos al ultrasonido durante el embarazo pesaban en su mayo-
ría al nacer menos que aquellos que no lo habían estado, pero un dato a tener en cuenta es que los 
obstetras recomendaban el ultrasonido cuando sospechaban que el embarazo no se desarrollaba con 
normalidad. 
a) ¿Se trata de unestudio observacional o experimental? ¿Por qué? 
b) ¿Puede concluirse que el ultrasonido influye sobre el peso del nacimiento? 
 
SOLUCIÓN 
a) Se trata de un estudio observacional, porque no hay intervención del investigador. 
b) Los bebés expuestos al ultrasonido y los no expuestos presentaban diferencias que no tenían nada 
que ver con el hecho de ser tratados o no. De modo tal que los investigadores tuvieron un conjunto de 
factores de confusión con el cual enfrentarse. La conclusión del estudio fue, por lo tanto, que las eco-
grafías y el menor peso de los bebés tenían una causa común: problemas durante el embarazo. 
 
EJERCICIO 2) Mediante la siguiente experiencia se quiere determinar si una droga reduce el nivel pro-
medio de glucosa en sangre (glucemia) en una línea de ratas diabéticas. Se tomaron al azar dos grupos 
de ratas de esta línea, al primero de 40 animales se les suministró la droga (grupo tratado), mientras que 
al segundo de otras 30 ratas de la misma línea se les suministró un placebo (grupo control). 
Los niveles sanguíneos de glucosa (mg/ml) en las ratas fueron: 
 
Tratadas con droga Tratadas con placebo 
1,82 1,89 1,39 1,79 1,27 1,73 2,01 1,74 1,91 1,52 1,41 
1,88 1,88 1,66 1,93 1,56 1,93 1,70 1,74 2,16 1,60 1,70 
1,69 1,94 1,62 1,44 1,68 1,99 1,82 1,40 1,68 1,57 1,91 
1,83 1,60 1,58 2,12 1,61 1,91 1,70 
2,15 1,91 1,93 2,22 2,18 1,75 1,93 2,03 
2,37 1,65 2,09 1,75 2,00 2,23 2,10 1,95 2,18 
1,95 1,92 2,01 2,48 1,67 2,23 1,96 1,87 2,06 
2,00 2,26 1,94 1,89 
 
 
 
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(una cola) 
Droga 40 1,73 0,20 0,97 0,7640 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 5 
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(una cola) 
Placebo 30 2,02 0,20 0,97 0,7499 
 
a) Definir las variables en estudio. 
b) Expresar la hipótesis de trabajo de los investigadores. 
c) Enunciar y verificar las condiciones necesarias para seleccionar al estadístico de contraste más 
adecuado para probar si la droga es más efectiva para reducir el nivel promedio de glucosa en sangre 
al 5%. Asuma que la droga no modifica la varianza poblacional del nivel de glucosa en sangre, y que 
ésta es conocida, simbólicamente 2droga=2placebo =0,04 mg2/ml2 
d) Realice la prueba en interés al 5%. 
e) Construya un intervalo de confianza del 95% para la diferencia entre la media poblacional de la 
glucemia de las ratas tratadas con droga y la media poblacional de la glucemia de las ratas tratadas con 
placebo. 
 
Datos del problema: 
 
 Tamaños de las muestras: n1= 40 y n2= 30 
 Varianzas poblacionales: Conocidas e iguales. (2droga=2placebo = 0,04 mg2/ml2) 
 Nivel de significación: α= 0,05 
 Nivel de confianza: 1 - α = 0,95 
 
SOLUCIÓN 
 
a) Variables en estudio 
 X1: nivel de glucosa de una rata de una línea diabética, tratada con droga, en mg/ml 
 X2: nivel de glucosa de una rata de una línea diabética, tratada con placebo, en mg/ml 
 
b) La hipótesis de trabajo que se desea poner a prueba es: 
“El empleo de la droga disminuye el nivel medio de glucosa en sangre de ratas de la línea diabética” 
 
c) Para poder plantear las hipótesis estadísticas y llevar a cabo la prueba, hay que verificar las condi-
ciones teóricas necesarias. En este caso, dichas condiciones son: 
-Que ambas variables (X1 y X2) sean independientes 
-Que se extraigan dos muestras aleatorias X11, X12, …,X1n1 e X21, X22, …, X2n2 
-Que X1 y X2 se distribuyan normalmente. 
-12 y 22 deben ser conocidas 
 
En términos del problema se enunciarían: 
- Los niveles de glucosa de las ratas de una línea diabética, en mg/ml, tratadas con droga y trata-
das con placebo, son independientes. 
- Los niveles de glucosa de las ratas de una línea diabética, en mg/ml, tratadas con droga y trata-
das con placebo, se distribuyen normalmente con sus respectivos parámetros μ1 ,12 y μ2 ,22 
- Se extrajeron dos muestras aleatorias de ratas de una línea diabética a las que posteriormente se 
le suministró a un grupo droga y al otro placebo. 
- Las varianzas poblacionales de los niveles de glucosa de las ratas de una línea diabética, en 
mg/ml, tratadas con droga y tratadas con placebo deben ser conocidas. 
6 
 
Verificación de condiciones para la elección de la mejor variable pivotal o estadístico de contraste: 
 
La condición de independencia se cumple por la forma en que se realizó el experimento: a un grupo de 
ratas, tomadas al azar, se le suministró la droga y a otro grupo diferente, también tomado al azar, se lo 
trató con placebo. 
Por otro lado, el enunciado nos aporta el dato de las varianzas poblacionales. Por ende, la única condi-
ción que aún debemos verificar mediante la prueba de hipótesis correspondiente es que X1 y X2 se dis-
tribuyan normalmente. 
Empezaremos realizando unos gráficos denominados gráfico de cuantil-cuantil (qqplot) como un primer 
acercamiento al tratamiento de la condición en estudio. En este gráfico se comparan dos distribucio-
nes, la de los datos muestrales y la de una normal. Cuando los puntos están perfectamente alineados, 
se infiere que la distribución es exactamente normal, si los puntos están muy cercanos a la línea, la 
distribución es aproximadamente normal, grandes apartamientos de esta estructura indican falta de 
normalidad. Esto sin embargo no tiene la fuerza de un test estadístico es una técnica exploratoria. 
 
Para X1: 
 
 
 
 
Observando el gráfico se puede ver que 
los puntos no se alejan mucho de la recta, 
sin embargo, por ser un gráfico, no se 
puede hacer inferencia sobre el 
comportamiento distribucional de la 
variable a nivel poblacional. 
 
 
 
 
 
 
 
Para poder concluir a nivel poblacional es necesario un test de normalidad. En Elementos de 
Estadística se estudió la prueba Shapiro-Wilks, para verificar normalidad, cuyas hipótesis son: 
 
 
 
2
0 1 1 1
2
1 1 1 1
H :X ~N μ ;σ 
H :X no se distribuye normalmente N μ ;σ 



 
 
En todos los casos para esta prueba utilizaremos un nivel de significación del 10% 
 
Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X1 40 1,73 0,20 0,97 0,7640 
 
La regla de decisión tiene el siguiente formato: 
No se rechaza la hipótesis nula si el p-valor>0,10 
Se rechaza la hipótesis nula si el p-valor 0,10 
 
Como el p-valor= 0,7640 y es mayor que =0,10 no se rechaza H0 y se puede concluir que: 
Con un nivel de significación del 10% no tengo evidencias suficientes para rechazar mi hipótesis nula 
(  21 1 1~N ;X   ) entonces el nivel de glucosa en sangre de las ratas tratadas con droga, en mg/ml, se 
distribuye normalmente en esta población de ratas de línea diabética en estudio. 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 7 
 
Análogamente se estudia la normalidad de la variable X2: 
 
 
 
 
 
 
 
2
0 2 2 2
2
1 2 2 2
H :X ~N μ ;σ 
H :X no se distribuye normalmente N μ ;σ



 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X2 30 2,02 0,20 0,97 0,7499 
 
Como ya fue visto, la regla de decisión es: 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
 
Como el p-valor= 0,7499 y es mayor que =0,10 no se rechaza H0 y se puede concluir que: 
Con un nivel de significación del 10% no tengo evidencias suficientes para rechazar mi hipótesis nula 
(  22 2 2X ~N μ ;σ ) entonces el nivel de glucosa en sangre de las ratas tratadas con placebo, en mg/ml, 
se distribuye normalmente en esta población de ratas de línea diabética en estudio. 
 
Nota: este test no será necesario si la información asegura distribución normal de la variable. 
d) Una vez verificada la condición teórica faltante se puede seguir adelante con la prueba. 
 
Hipótesis estadísticas 
El interés del investigador es probar si la droga disminuyeel nivel medio de glucosa en sangre, por lo 
tanto quiere saber si la media del nivel de glucosa en sangre de ratas tratadas con droga es menor que 
la media del nivel de glucosa en sangre de las ratas tratadas con placebo. 
Simbólicamente: 1 2  . Esta expresión no lleva el signo igual, por lo tanto debe corresponder a 
la hipótesis alternativa. Es decir que las hipótesis estadísticas son: 
0 1 2
1 1 2
:
:
H
H
 
 

 
 
Equivalentemente podría escribirse 
0 1 2
1 1 2
: 0
: 0
H
H
 
 
 
  
 o también 
0 2 1
1 2 1
: 0
: 0
H
H
 
 
 
  
 
 
Cualquiera de estas formas expresan las mismas hipótesis estadísticas. Sin embargo hay que 
elegir una expresión para poder continuar con la prueba manteniendo la elección a lo largo de todo el 
análisis y concluir para las hipótesis elegidas. Si esto no se mantiene se podría estar concluyendo 
erróneamente. En este caso se va a trabajar con: 
 
 
0 1 2
1 1 2
:
:
H
H
 
 

 
 
 
 Nivel de significación: =0,05 
 
 Estadístico de prueba (o variable pivotal) 
 
Se está realizando un test de hipótesis para la diferencia de medias poblacionales, habiendo veri-
ficado que ambas variables pueden considerarse con distribución normal, por lo cual se cuenta con dos 
opciones al elegir la variable pivotal: Z o t de Student (en sus dos variantes), dependiendo del conoci-
8 
 
miento o no las varianzas poblacionales. En este caso las varianzas poblacionales son conocidas, por 
lo tanto se utiliza Z, la expresión de la variable pivotal es: 
 
   
 
21 1 2
2 2
1 2
1 2
X -X - μ -μ
Z= ~N 0;1
σ σ
+
n n
 
 Región crítica: 
El valor crítico es: 0,05 1,64z   y , por lo tanto, la región crítica es: 1,64Z   
 
 Regla de decisión: 
Rechazo H0 si 1,64
oH
Z   
No rechazo H0 si 1,64
oH
Z   
 
 Cálculo de ZHo: 
 
Hasta este momento no utilizamos los valores muestrales, excepto en la verificación de las condi-
ciones para la elección de la variable pivotal, sin embargo se podría haber hecho con muestras piloto y 
recién en esta instancia extraer las muestras para el análisis. Antes de calcular el valor del estadístico 
de prueba hay que calcular las medias muestrales utilizando las fórmulas dadas en la unidad de esta-
dística descriptiva de Elementos de Estadística: 1 2x =1,73 mg/ml ; x =2,02 mg/ml . Hay que tener en 
cuenta que la prueba se está realizando bajo la hipótesis nula que contiene el caso en que las medias 
poblacionales son iguales, por lo tanto la diferencia de las medias poblacionales es cero, es decir que 
1 2 0   . Se utiliza esta igualdad en la prueba debido a que 1 2 0   es el valor extremo entre 
la hipótesis alternativa y la hipótesis nula, la decisión que se tome se cumplirá para cualquier otro re-
sultado que valide la hipótesis nula ( 1 2  ). Reemplazando estos valores y el resto de la informa-
ción en la fórmula nos queda: 
 
     21 1 2
2 2
1 2
1 2
X -X - μ -μ 1,73-2,02 -0 -0,29 -0,29
Z= = = = =-6,017
0,04820,04 0,04 0,001+0,00133σ σ ++
40 30n n
 
 
 Decisión: Se rechaza la hipótesis nula porque 6,017
oH
z   , es menor que –1,64, o sea que 
ZCALCULADO < ZCRITICO. 
 
 
 Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula ( 0 1 2:H   ), por lo tanto la media poblacional del nivel de glucosa en sangre de ratas dia-
béticas tratadas con droga, es menor que la media poblacional del nivel de glucosa en sangre de ratas 
diabéticas tratadas con placebo. Por lo tanto puedo decir que la droga es efectiva. 
 
 
 
 
 
e) La fórmula del intervalo del 95% que se está pidiendo se despeja de la variable pivotal y es: 
 
   
2 2 2 2
1 2 1 2
1 2 α 1 2 α1- 1-2 2
1 2 1 2
σ σ σ σ
x - x -z + ; x - x +z +
n n n n
 
 
  
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 9 
 
reemplazando se obtiene que 
 
   
   
0,04 0,04 0,04 0,04
1,73 2,02 1,96 ; 1,73 2,02 1,96
40 30 40 30
0, 29 1,96 0,0023; 0, 29 1,96 0,0023
0,29 0,0939; 0,29 0,0939 0,3839; 0,1961
 
       
 
       
       
 
 
Por lo tanto el intervalo de confianza para la diferencia de medias poblacionales 1 2  es: 
[-0,3839 mg/ml; -0,1961 mg/ml] 
 
Conclusión: Con un nivel de confianza del 95%, se espera que el intervalo [-0,3839 mg/ml; -0,1961 
mg/ml] cubra o abarque a la diferencia entre la media poblacional del nivel de glucosa de las ratas tra-
tadas con droga y la media poblacional del nivel de glucosa de las ratas tratadas con placebo, en estas 
poblaciones de ratas diabéticas. 
 
Nota: Observemos que el 0 (cero) no está incluido en el intervalo de confianza, y que ambos límites son negativos, 
lo cual es indicador de que la diferencia es negativa. Sin embargo, hay que tener en cuenta que el IC no es equi-
valente a la prueba de hipótesis realizada en el punto anterior porque la prueba es unilateral. 
 
 
EJERCICIO 3) Se tomó una muestra aleatoria de 21 cerdos Yorkshire del norte de la provincia de Bue-
nos Aires. Los mismos tenían 3 meses de edad y pesos homogéneos, y se los separó, aleatoriamente en 
dos lotes. Al lote A se le asignó una ración estándar y al lote B otra con distinta formulación. La siguiente 
tabla contiene las ganancias de peso de cada animal, luego de 30 días de experiencia, expresadas en kg. 
 
Lote A 24 26 25 23 28 27 28 24 29 29 
Lote B 26 32 28 25 29 27 28 27 27 28 30 
 
 
Por estudios anteriores se sabe que ambas variables se distribuyen normalmente con varianzas igua-
les, pero desconocidas. 
a) Interpretar el parámetro en estudio en términos del problema. 
b) Enunciar las condiciones necesarias para seleccionar la variable pivotal más indicada para realizar 
inferencias/estimaciones para el parámetro especificado en el inciso anterior. 
c) ¿Se puede suponer, al 5%, que la ganancia media de peso de los animales alimentados con la 
ración B supera significativamente la ganancia media de peso de los animales alimentados con ración 
A? 
d) Construir un intervalo para la diferencia de medias al 95%. ¿Qué puede concluir? 
e) El intervalo construido en el inciso anterior ¿Aporta algún tipo de información adicional a la investi-
gación en estudio? 
 
Datos del problema: 
 
 Variables en estudio: 
XA: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As. 
alimentado con la ración estándar A 
XB: ganancia de peso de un cerdo Yorkshire de 3 meses de edad del norte de la provincia de Bs. As. 
alimentado con la formulación distinta B 
 Tamaños de las muestras: nA=10 y nB=11 
 Varianzas Poblacionales: σA2 = σB2 = σ2 (desconocidas) 
 Nivel de significación: α=0,05 
 Nivel de confianza: 1 - α = 0,95 
 Hipótesis de trabajo: “La ganancia media de peso de los animales alimentados con la ración B supera 
la ganancia media de peso de los animales alimentados con ración A” 
 
10 
 
SOLUCIÓN 
 
a) μA- μB: Diferencia entre las medias poblacionales de las ganancias de peso de los cerdos Yorkshire de 
3 meses de edad del norte de la provincia de Bs. As. alimentados con la ración estándar A y con la ración 
distinta B. 
 
b) Condiciones para elegir la mejor variable pivotal: 
- XA y XB son variables aleatorias independientes. 
- Se extrajeron dos muestras aleatorias XA1, XA2, …,XAn1 e XB1, XB2, …,XBn2 
-Ambas variables tiene la misma varianza poblacional aunque ésta tiene un valor desconocido. 
-XA  N (A, 2) y XB  N (B, 2) 
 
Enunciándolas en términos del problema: 
- Las ganancias de peso de los cerdos Yorkshire de 3 meses de edad del norte de la provincia 
de Bs. As. alimentados con la ración estándar A y las de los alimentados con la formulación 
distinta B, son independientes. 
- Se extrajeron dos muestras aleatorias de cerdos Yorkshire de 3 meses de edad del norte de la 
provincia de Bs. As., un grupo fue alimentado con la ración estándar A y el otro con la formula-
ción distinta B. 
- Las varianzas poblacionales de las gananciasde peso de los cerdos Yorkshire de 3 meses de 
edad del norte de la provincia de Bs. As. alimentados con la ración estándar A y de los alimen-
tados con la formulación distinta B, son iguales y desconocidas. 
- Las ganancias de peso de los cerdos Yorkshire de 3 meses de edad del norte de la provincia 
de Bs. As. alimentados con la ración estándar A y también las de los alimentados con la formu-
lación distinta B, se distribuyen normalmente con sus respectivos parámetros (µA; µB; 2). 
 
En este caso, a diferencia del ejercicio anterior, en el enunciado no se pide verificar las condiciones. Si 
tuviésemos que hacerlo, el texto que presenta el problema asegura la normalidad de ambas variables, 
por estudios anteriores, por lo tanto no es necesaria la prueba de Shapiro–Wilks para verificar dicha 
condición. Por otro lado la condición de independencia también se cumple por la forma en que se reali-
zó el experimento: a un grupo de cerdos, tomado al azar, se lo alimenta con la ración A y al otro grupo, 
también tomado al azar, se lo alimentó con la ración B. Finamente, la homoscedasticidad (igualdad de 
varianzas) también es asegurada por el enunciado. 
 
c) Hipótesis estadísticas: La hipótesis de trabajo simbólicamente nos lleva a la expresión: B A  , por lo 
tanto esta corresponde a la hipótesis del investigador que ubicamos en la hipótesis alternativa, ya que no 
contiene la igualdad. 
 
0
1
:
:
B A
B A
H
H
 
 

 
 
 
nuevamente, existen diversas formas de plantear la misma hipótesis, como por ejemplo: 
0
1
: 0
: 0
B A
B A
H
H
 
 
 
  
 
 
Nota: En este caso, se trabajará con la segunda expresión y se concluirá para esta expresión. 
 
 
 
 Nivel de significación: =0,05 
 
 Variable pivotal: En este caso, se está realizando un test para la diferencia de medias poblacionales 
con variables que pueden ser consideradas distribuidas normalmente, por lo tanto hay varias opciones 
para la variable pivotal (Z o t-Student). Como las varianzas poblacionales son desconocidas no se puede 
utilizar la variable Z, por lo tanto se utilizará la variable pivotal t de Student. 
En Estadística Analítica, al comparar dos medias poblacionales en poblaciones independientes, 
trabajaremos con dos tipos de variables pivotales con distribución t de Student dependiendo del 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 11 
conocimiento de la igualdad de las varianzas poblacionales (será un valor desconocido pero igual a ambas 
varianzas poblacionales). Si se conoce que A2=B2 entonces la fórmula a utilizar es: 
 
   
 2~1 1 A B
B A B A
n n
a
A B
x x
t t
s
n n
 
 
  


 
 
Donde sa es la raíz cuadrada de la estimación de la varianza amalgamada, es decir que la varianza 
muestral amalgamada es un promedio ponderado entre la varianza muestral de la variable XA y la varianza 
muestral de la variable XB, y estima a la única varianza poblacional que se desconoce, 2. 
 
 Región crítica: Observando la hipótesis alternativa planteada se deduce que la región crítica es 
unilateral derecha (es decir que se rechaza la hipótesis nula a valores grandes de la variable pivotal). Se 
llega a esta conclusión analizando que si 0B A   , entonces, en la mayoría de los casos debería ser 
0B Ax x  , lo que hará que el numerador de por resultado un número positivo y el denominador 
siempre es positivo (desvío estándar poblacional), así que el cálculo de la VP será positivo en la mayoría 
de los casos en que se cumpla la hipótesis alternativa, esto me indica que la región crítica es unilateral 
derecha. El valor crítico que se utiliza es 2;1 10 11 2;0,95 19;0,95 1,729A Bn nt t t       , 
La Region critica puede representarse de alguna de las siguientes maneras: 
 
De forma analítica 
 t ≥ 1,729 
 t  [1,729 ; ∞) . 
 
De forma Gráfica: 
 
Nota: En la representación gráfica de la Región Crítica, la mis-
ma debe estar dibujada sobre el eje X, desde el valor crítico 
(incluido), hacia el infinito (representado con una flecha). 
 
 
 
 
 Regla de decisión: Rechazo H0 si 1,729
oH
t  y no rechazo H0 si 1,729
oH
t  
 
 Cálculo: Para obtener el valor calculado del estadístico de prueba, hay que realizar ciertos cálcu-
los auxiliares (
2
A B aX ; X y S ) utilizando las fórmulas habituales para las medias y las varianzas muestra-
les, y la siguiente fórmula para la varianza amalgamada: 
2 2
2 ( 1) ( 1)
2
A A B B
a
A B
n s n s
s
n n
  

  
Se obtuvo: 
2 226,3 ; 27,91 ; 4,90 ; 3,69A B A Bx x s s    y 
2 (9)4,90 (10)3,69 44,1 36,9 4,26
10 11- 2
as
 
 

 
 = 
19
 
por lo tanto 2,06as  
 
Reemplazando estos valores en la fórmula de la variable pivotal queda: 
 
     
0
27,91 26,3 0 1,61 1,61 1,61
1,78
2,06*0,44 0,9061 1 1 1 21
2,06 2,06
10 11 110
B A B A
H
a
A B
x x
t
s
n n
     
     
 
 
12 
 
Como 0 1,78Ht  y utilizando la regla de decisión se rechaza la hipótesis nula ya que 1,78 es mayor 
que 1,729. 
 
 Conclusión: Con un nivel de significación del 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula (Ho: B - A  0), por lo tanto, la diferencia entre la media poblacional de la ganancia de peso 
de los cerdos alimentados con la ración B y la media poblacional de la ganancia de peso de los cerdos 
alimentados con la ración A es mayor a cero, en estas poblaciones de cerdos de 3 meses de raza 
Yorkshire del norte de la provincia de Buenos Aires. 
 
 Respuesta: Se puede suponer, al 5%, que la ganancia media poblacional del peso de los cerdos 
alimentados con la ración B supera significativamente a la ganancia media poblacional del peso de los 
cerdos alimentados con la ración A en esta población de cerdos Yorkshire de 3 meses de edad del nor-
te de la provincia de Bs. As. 
 
Para este problema, la salida de InfoStat correspondiente es: 
Prueba T para muestras Independientes 
Gr(A) Gr(B) n(A) n(B) media(A) media(B) p(Var.Hom.) T p prueba 
{A} {B} 10 11 26,30 27,91 0,6623 -1,78 0,0452 Unilat 
 
Nota: InfoStat compara grupos en orden alfabético, por lo cual la prueba es unilateral izquierda, o sea que utiliza 
H1: A-B<0. Para la comparación es indistinta la forma en que se plantea la diferencia, siempre que se respete el 
sentido de la misma. El valor de t observado es el mismo que obtuvimos al aplicar la fórmula, pero de signo opues-
to, por haber invertido el orden de la diferencia. 
Si se presenta la salida de computadora, existe la opción de la regla de decisión y decisión con el valor de t dado 
en la tabla, así como también con el p-valor de la prueba (0,0452) comparándolo con el  utilizado. Por ser un 
curso de introducción a la materia, la cátedra recomienda la regla de decisión y decisión con el estadístico de con-
traste bajo la hipótesis nula, t. 
Como puede verse, al realizar la Prueba t para muestras independientes, también se realiza una prueba para eva-
luar la Homogeneidad de Varianzas (luego se analizará en detalle en el resuelto 7), el p-valor (p(Var.Hom) es 
0,6623, por lo que se cumple este supuesto. 
 
 
 
En este caso, en que la región crítica es unilateral izquierda, 
el cálculo del p valor es: 
p valor= P (t  tH0.) = P (t19 -1,78) 
 
 
 
Ahora, si consideramos la región crítica derecha que planteamos 
al principio, el p valor se grafica y se calcula de la siguiente forma, 
dado que la región crítica es unilateral derecha: 
p valor= P (t  tH0) = P (t19≥ 1,78) 
 
 
d) La fórmula del intervalo de 95% de confianza para la diferencia de medias se deduce de la distribución 
de la variable pivotal: 
 
2;1 /2 2;1 /2
1 1 1 1
( ) ;( )
A B A BB A n n a B A n n a
A B A B
x x t s x x t s
n n n n      
 
      
 
 
 
Reemplazando con los valores correspondientes queda: 
   
     
10 11 2;0,975 10 11 2;0,975
1 1 1 1
27,91 26,3 *2,06 ; 27,91 26,3 *2,06
10 11 10 11
1,61 2,093*2,06*0, 44; 1,61 2,093*2,06*0,441,61 1,90; 1,61 1,90 0,29; 3,51
t t   
 
       
 
       
 
Por lo tanto el intervalo pedido es: [-0,29 Kg; 3,51 Kg] 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 13 
 
Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,29 Kg; 3,51 Kg] cubra o con-
tenga a la diferencia entre la media poblacional de la ganancia de peso de los cerdos alimentados con la 
ración B y la media poblacional de la ganancia de peso de los cerdos alimentados con la ración A, en es-
tas poblaciones de cerdos Yorkshire de 3 meses del norte de la provincia de Buenos Aires. 
 
Nota: Tener en cuenta que en este caso el IC no es equivalente a la prueba de hipótesis porque la prueba es uni-
lateral. 
 
e) Dado que el intervalo fue realizado para el mismo parámetro que se puso a prueba con la dócima de 
hipótesis del inciso c y que la decisión había sido rechazar Ho: B - A  0, es natural preguntarse 
entonces qué tan mayor a cero resulta B - A. Por lo tanto, tiene sentido realizar una estimación para 
dicha diferencia, por ende, el intervalo de confianza aporta información relevante a la investigación. 
 
 
EJERCICIO 4) En un experimento referido al uso de la vitamina B12 en casos de anemia perniciosa 
durante el período de remisión, se administró por vía intramuscular, 30 g de B12 a un total de 10 
pacientes tomado al azar. En ellos se midió la concentración de hemoglobina en sangre (mg%) en dos 
momentos, al inicio del tratamiento y luego de tres meses; con la sospecha que existe un aumento 
significativo de hemoglobina después del tratamiento. Los valores observados se muestran en la siguiente 
tabla: 
 
 Paciente 1 2 3 4 5 6 7 8 9 10 
Hemoglobina 
(mg%) 
Inicial (I) 12,2 11,3 14,7 11,4 11,5 12,7 12,3 13,0 12,7 13,0 
Después de 3 
meses (F, o final) 
13,0 13,4 16,0 13,6 14,0 13,0 14,2 15,1 15,9 14,5 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
D 10 -1,79 0,84 0,97 0,9425 
 
 
 
 
 
 
 
 
 
a) ¿Cuántas poblaciones y variables se tiene en estudio? Definirlas. 
b) Verifique las condiciones para seleccionar a la variable pivotal más indicada, en este caso, para 
realizar inferencias. 
c) Realice la prueba en interés al 5%. 
d) ¿Resulta significativa la realización de una inferencia mediante intervalo de confianza para la 
situación planteada? 
 
 
Datos del problema: 
 
 Nivel de significación: =0,05 
 
 Hipótesis de trabajo: “Hay aumento significativo del nivel medio de hemoglobina después del trata-
miento” 
 
14 
 
 
SOLUCIÓN 
 
a) Dado que no hay independencia entre las mediciones realizadas, ya que se realizaron dos veces sobre 
cada individuo, al inicio y al finalizar los 3 meses de aplicado el tratamiento con vitamina B12 , no se van a 
estudiar dos poblaciones de individuos independientes entre sí, sino a la misma población en dos momen-
tos diferentes. Esto implica que tenemos una sola muestra de pares de datos, “el antes y el después” de 
cada individuo, lo que resulta en un ejemplo de muestra que se denomina apareada. Por lo tanto, en este 
tipo de problemas se encuentra UNA sola población en estudio y UNA sola variable definida como la dife-
rencia de cada par de observaciones. 
 
Población en estudio: Individuos con anemia perniciosa durante el período de remisión. 
 
Variable en estudio: D:diferencia entre la concentración de hemoglobina en sangre (en mg%) al inicio del 
tratamiento con vitamina B12 y la concentración de hemoglobina en sangre (en mg%) después de tres 
meses del tratamiento con vitamina B12, de un paciente con anemia perniciosa. 
En símbolos: di = ii - fi i=1…N 
 
En la siguiente tabla están calculados los valores correspondientes a la diferencia planteada: 
 
di -0,8 -2,1 -1,3 -2,2 -2,5 -0,3 -1,9 -2,1 -3,2 -1,5 
 
Nota: En este caso se utilizará: di = ii - fi, pero también se podría haber definido la variable como di = fi - ii. La 
definición de esta variable debe quedar clara al comienzo de la resolución del ejercicio y debe mantenerse a lo 
largo del mismo. 
 
b) Antes de plantear las hipótesis estadísticas hay que analizar las condiciones para elegir la mejor varia-
ble pivotal para la situación planteada, ya que no es igual a las anteriores, dado que no hay independencia 
entre las mediciones realizadas. Por esta razón no se van a comparar las medias en los diferentes tiem-
pos, sino que se va a estudiar la media de la variable diferencia planteada en el inciso anterior. 
Por lo tanto debemos verificar: 
- (I1,F1), (I2, F2), …, (In1, Fn2) muestra aleatoria de pares 
- normalidad de la variable D definida como D1= I1-F1, D2= I2-F2,…, Dn= In-Fn ,… 
- Los pares de observaciones son independientes entre si. 
 
Definiendo como 
 I:”Concentración de hemoglobina en sangre (en mg%) al inicio del tratamiento con vitamina B12 de un 
paciente con anemia perniciosa” 
 F:”Concentración de hemoglobina en sangre (en mg%) después de tres meses del tratamiento con vita-
mina B12 de un paciente con anemia perniciosa, 
 
La muestra aleatoria de pares, se confecciona teniendo en cuenta a la independencia entre las diferentes 
unidades experimentales, que se cumple por el tipo de muestreo realizado. No confundir con “I y F no son 
independientes” en la misma unidad experimental. 
Por lo tanto, la única condición que debemos verificar es la normalidad de la variable D. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 15 
 
 
2
0
2
1
: ;
: ;
D D
D D
H D se distribuye normal
H D no se distribuye normal
 
 



 
 
Shapiro-Wilks (modificado) 
 
Variable n Media D.E. W* p (una cola) 
D 10 -1,79 0,84 0,97 0,9425 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
 
 
Como 0,9425 es mayor que 0,10, no se rechaza la hipótesis nula. Entonces, con un nivel de significación 
del 10% no tengo evidencias suficientes para rechazar H0 (  2 ;D DD se distribuye normal   ), enton-
ces la diferencia entre la concentración de hemoglobina en sangre (mg%) al inicio del tratamiento con 
vitamina B12 y la concentración de hemoglobina en sangre (mg%) luego de 3 meses de tratamiento con 
vitamina B12 en pacientes con anemia perniciosa se distribuye normalmente en esta población de pacien-
tes con anemia perniciosa en estudio. 
Simbólicamente  2~ ;D DD N   
 
c) Iniciemos la prueba de hipótesis: 
 
 Hipótesis estadísticas: si el tratamiento produce un aumento en el nivel de hemoglobina en 
sangre, los niveles de hemoglobina medidos a los 3 meses deberían ser mayores que los medidos al 
inicio del tratamiento, es decir que la variable D = I – F, tendría una media negativa. Simbólicamente 
0D  . 
La definición de la hipótesis alternativa depende exclusivamente de la definición de la variable en 
estudio, por esta razón debe quedar clara la forma en que se realiza la diferencia entre Ii y Fi. 
 
Luego, las hipótesis estadísticas son: 
0
1
: 0
: 0
D
D
H
H



 
 
 
 
 Variable pivotal: Por ser una prueba de medias apareadas, es decir que trabaja con una sola 
variable, la opción más usual para la variable pivotal es una t de Student (difícilmente se conocerá la 
varianza poblacional de la variable diferencia) con la siguiente fórmula:  1~
D
n
D
d
t t
s
n



 , donde n-1 
quedará igual a 9. 
Observar que esta expresión es la misma que la utilizada en Elementos de Estadística para estudiar 
una población, la variable estudiada es D, su media muestral es d y su varianza muestral es 2Ds . 
 
 Región crítica: Observando la hipótesis alternativa planteada, se ve que la región crítica es 
unilateral izquierda, con valor crítico: 1;0,05 10 1;0,05 9;0,95 1,83nt t t      (los grados de libertad son 10 
- 1, porque hay 10 diferencias 
La región crítica queda definida entonces como 1,83t   . 
 
 
 
16 
 
Gráficamente: 
 
 
 Regla de decisión: Rechazo H0 si 1,83oH
t   y no rechazo H0 si 1,83
oH
t   
 
 Cálculo: Para obtener el valor calculado del estadístico de prueba hay que realizar ciertos cálculos 
auxiliares (
2
Dd y s ), utilizando las fórmulas habituales para la media muestral y la varianza muestral, 
sobre las 10 diferencias. 
Utilizando los valores calculados para di (ver la tabla correspondiente al plantear la forma de realizar la 
misma), se obtuvo 1,79d   y 2 0,71Ds  , reemplazando en la fórmula de la variable pivotal: 
 
1,79 1,79
6,7
0,84 0,26
10
oH
t
 
    . 
 
Como el valor observado –6,7 es menor que –1,83, vale decir pertenece a la región crítica, se rechaza 
la hipótesis nula. 
 
 Conclusión: Con un nivel de significación del 5% existen evidencias suficientes para rechazar la 
hipótesis nula ( 0D  ), por lo tanto la media poblacional de las diferencias entre la concentración de 
hemoglobina en sangre (mg%) de pacientes con anemia perniciosa al inicio del tratamiento y la 
concentración de hemoglobina en sangre (mg%) de pacientes con anemia perniciosa después de tres 
meses de iniciado el tratamiento con vitamina B12 es menor que cero, en la población de pacientes con 
anemia perniciosa. Por lo cual la hemoglobina aumenta significativamente luego del tratamiento con 
vitamina B12. 
 
A continuación se da la salida del programa InfoStat para este problema 
 
Prueba T para un parámetro Valor del parámetro probado: 0 
Variable n Media DE T p(Unilateral I) 
D 10 -1,79 0,84 -6,72 <0,0001 
 
Nota: con un p-valor tan pequeño puede decirse que ésta es una decisión “fuerte“. 
 
 
Para el caso de que la región crítica sea unilateral izquierda, el 
cálculo del p valor es: 
P-valor= P (t  V.Calc.) 
 
 
Nota: Al comienzo del ejercicio se definió la variable diferencia como: di = ii - fi, Se recomienda realizar de nuevo la 
prueba, pero definiendo de la otra forma a la variable y observar qué se modifica y qué permanece igual. 
 
d) Al haberse rechazado la hipótesis nula 0D  , nos preguntaremos qué tan menor a cero es el pa-
rámetro en estudio y una inferencia por intervalo de confianza aportaría información preciada para la 
respuesta a dicha pregunta. 
 
EJERCICIO 5) Se desea estudiar si una nueva dieta logra un incremento significativo en el peso con 
respecto a una dieta normal en conejos de raza Nueva Zelandia. Se seleccionan 10 pariciones, de ca-
da una de ellas se extraen dos conejos machos de 120 días de vida, asignando de manera aleatoria, la 
forma de alimentación. Los resultados fueron los siguientes: 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 17 
Par 1 2 3 4 5 6 7 8 9 10 
Peso dieta normal (kg) (X1) 3,9 3,8 4,2 4,8 4 3,5 3,5 4,3 4,1 4,2 
Peso dieta nueva (kg) (X2) 3,7 4,5 3,8 4,1 4,2 4,3 3,4 4 6,8 4,6 
 
a) Según el problema en estudio ¿Se trata de muestras apareadas o independientes? Justifique y 
defina a la/s variable/s en estudio. 
b) Enuncie las condiciones para seleccionar el estadístico de contraste más adecuado para realizar 
inferencias en la situación en estudio y comente brevemente acerca de su cumplimiento. 
c) Utilizando un nivel de significación del 5% pruebe la hipótesis planteada por los investigadores. 
d) ¿Qué tipo de error se pudo haber cometido? Interpretarlo en términos del problema 
 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p (una cola) 
Dieta norm 10 4,03 0,39 0,94 0,7055 
Dieta nueva 10 4,34 0,94 0,78 0,0072 
D(nueva-norm) 10 -0,31 0,97 0,84 0,0738 
 
SOLUCIÓN 
a) Para poder decidir si nos encontramos ante muestras apareadas necesitamos analizar si hay 
independencia o no entre el peso de un conejo con la nueva dieta y el peso de un conejo con la dieta 
normal. Como los animales que se pesaron son de la misma camada entonces comparten las mismas 
características genéticas, por lo tanto hay dependencia entre dichas muestras, lo que se confecciona 
como otro ejemplo de muestras apareadas. 
En consecuencia, elegimos la variable en estudio será: 
 
D (X2-X1)= diferencia entre el peso de un conejo alimentado con una dieta nueva y el peso de su 
gemelo alimentado con una dieta normal. 
 
b) Se pide una prueba que compare las medias poblacionales y para empezar deberíamos testear si 
cumple el supuesto teórico de normalidad de la variable en estudio. Para lo cual se aplicaría la prueba 
de Shapiro Wilks con las hipótesis sobre la distribución de D. Como nos pide comentar brevemente 
acerca del análisis de las condiciones, diremos que como el p-valor de dicha prueba resulta ser 
0,07380,10 se rechaza H0 que dice que  2 ;D DD se distribuye normal   , entonces la diferencia 
entre el peso de los conejos alimentados con una dieta nueva y el peso de los conejos alimentados con 
una dieta normal, no se distribuye normalmente en esta población de conejos machos Nueva Zelandia 
de 120 días en estudio. 
 
Como la distribución de la variable no es normal no podemos utilizar las dos variables pivotales que se 
basan fuertemente en esta condición que son la Z y la t. Por otro lado, el tamaño de muestra es menor a 
30, lo que retira la posibilidad de utilizar el teorema central del límite, por lo que no podemos usar como 
variable pivotal a la Z correspondiente. Lo que sí se puede decir, es que la variable con la que estamos 
trabajando es por lo menos ordinal al tratarse de una variable numérica, suponemos que posee una 
distribución simétrica (no realizaremos un test para este supuesto aunque sí podría verse una idea 
intuitiva en un box-plot), única mediana y cada par es independiente de los demás, por esta razón 
podemos utilizar el test de libre distribución de Wilcoxon para muestras apareadas, ya que cumple con las 
condiciones pertinentes. 
 
En resumen: 
- (X11,X21), (X12, X22), …, (X1n, X2n) muestra aleatoria de pares. 
- Se define la variable D como D1= X21-X11, D2= X22-X12, …, Dn= X2n- X1n con distribución desconocida pero 
forma simétrica y de única mediana. 
- X1 y X2 son de escala al menos ordinal, por lo tanto la variable D es de escala al menos ordinal. 
- Los pares de observaciones son independientes entre si. 
 
 
c) Desarrollemos el test pedido: 
 
Nota: No podrá utilizarse a µD en las hipótesis estadísticas, ya que no es un test paramétrico. Es por esto que se 
usara D en las mismas. 
18 
 
 
Hipótesis estadísticas: 
0
1
: 0
: 0
D
D
H
H



 
 
 
Primero, debemos calcular los valores correspondientes a la “diferencia entre el peso de un conejo 
alimentado con una dieta nueva y el peso de su gemelo alimentado con una dieta normal”, en la 
muestra analizada. 
 
Continuando para realizar el test de Wilcoxon, como fue visto en Elementos de Estadística, a cada 
valor de estas diferencias se deberá restarle el correspondiente D bajo H0 (en nuestro caso es de 0). 
 
Luego, debemos obtener el valor absoluto de esta diferencia (AbsD), y asignar un rango a estos 
valores, diferenciando los rangos provenientes de diferencias negativas y diferencias positivas. 
 
 Recordemos que, en caso de que dos valores de D - θ posean valores absolutos iguales, los rangos 
correspondientes a cada una se promedian y se coloca el promedio de los rangos empatados a cada 
valor. 
 
Dieta nueva Dieta norm D=Nuev-Norm D - θ Abs(D) Rango (-) Rango (+) 
3,7 3,9 -0,2 -0,2 0,2 2,5 
4,5 3,8 0,7 0,7 0,7 7,5 
3,8 4,2 -0,4 -0,4 0,4 5,5 
4,1 4,8 -0,7 -0,7 0,7 7,5 
4,2 4 0,2 0,2 0,2 2,5 
4,3 3,5 0,8 0,8 0,8 9 
3,4 3,5 -0,1 -0,1 0,1 1 
4 4,3 -0,3 -0,3 0,3 4 
6,8 4,1 2,7 2,7 2,7 10 
4,6 4,2 0,4 0,4 0,4 5,5 
 
Luego debemos calcular el valor de la variable pivotal bajo H0. 
 
Llamemos T+ a la suma de rangos provenientes de valores de la variable (D – θ) positivos. 
T+ tendrá una distribución exacta Tn cuyos valores críticos se encuentra en la tabla de “Prueba de 
rangos con signos de Wilcoxon”. En nuestro ejemplo: 
 
VP: T+ ~ T10 
 
En este caso: TH0+ = 7,5 + 2,5 + 9 + 10 + 5,5 = 34,5 
 
 
Valores Críticos: la tabla sólo ofrece los valores críticosinferiores para cuando se trabaja a una cola o 
a dos colas con ciertos niveles de significación. Si se necesita algún valor crítico superior, se deberá 
hallar mediante la fórmula: 
 
;1 ;
1
2n n
n n
T T 

  . 
 
En nuestro caso, la región crítica es unilateral derecha, por lo que tendremos que usar la fórmula 
anterior para calcular el valor crítico superior. 
 
Buscamos en la tabla el valor crítico inferior, T10; 0,05 = 11, y aplicamos la fórmula: 
 
 
   
10;0.95 10;0.05
1 10 10 1
11 44
2 2
n n
T T
 
     
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 19 
Nota: recordamos que para buscar un valor en la tabla de Wilcoxon necesitamos: 
1. Identificar si el test es unilateral o bilateral. 
2. El nivel de significación de la prueba 
3. En n del experimento 
 
 
 
La región crítica, por tanto, es: T+  44 
 
Regla de decisión: Rechazo H0 si 44
0
HT 
 No rechazo H0 si 44
0
HT 
 
Decisión: como 5,34
0
HT y 34,5 < 44, entonces no rechazo H0. 
 
Conclusión: Con un nivel de significación del 5%, no existen evidencias suficientes para rechazar H0 
( 0D  ). Por lo tanto, se puede decir que la mediana poblacional de la diferencia entre el peso de los 
conejos machos de raza Nueva Zelandia alimentados con una dieta nueva y el peso de sus gemelos 
alimentados con una dieta normal es menor o igual a cero en esta población. 
Al mismo nivel se puede suponer que la nueva dieta no logra un incremento de peso significativo en los 
conejos de la raza Nueva Zelandia en estudio. 
 
Si se cuenta con la salida de Infostat, se puede tomar la decisión utilizando el valor de la suma (R+) 
que equivale a nuestro T+H0, o, en caso de contar con el p-valor, puede contrastarse el mismo con el 
nivel de significación de la prueba. 
 
Prueba de Wilcoxon (muestras apareadas) 
Variable N Suma(R+) E(R+) Var(R+) p(2 colas) 
Dif(Nuev-Norm) 10 34,50 27,50 95,88 0,1244 
 
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según 
la siguiente tabla: 
 
H0 H1 Región crítica 
00 :  H 01 :  H  
2/;2/; 2
1
 nn T
nn
TóTT 

  
00 :  H 01 :  H ;nTT 
 
00 :  H 01 :  H  
;2
1
nT
nn
T 

 
 
 
d) Al tomar la decisión de no rechazar H0 existe la posibilidad de haber cometido sólo uno de los dos 
tipos de errores posibles, en este caso sería el error tipo II: no rechazar H0 cuando ésta es falsa. 
En términos del problema sería: no rechazar que la mediana poblacional de la diferencia entre el peso 
de los conejos alimentados con una dieta nueva y el peso de sus pares alimentados con una dieta 
normal es menor o igual a cero, cuando en realidad ésta es mayor. 
 
 
EJERCICIO 6) Con el fin de comparar las poblaciones de adultos y adolescentes que ven un 
programa de TV los sábados por la noche, se tomaron muestras al azar de 400 y 600 individuos 
respectivamente. A la pregunta: “¿realmente le gusta el programa?”, contestaron que sí, 100 adultos y 
300 adolescentes. 
 
a) Definir el parámetro en estudio y su correspondiente estimador en términos del problema 
b) Analizar las condiciones necesarias para realizar estimaciones con la variable pivotal más indicada 
en este caso e indicarla con su correspondiente distribución. 
20 
 
c) Estimar puntualmente y con una confianza del 95% la diferencia entre las proporciones de adultos y 
adolescentes que ven el programa y les gusta. 
d) Probar, al 5%, si ambas proporciones son iguales. 
e) ¿De qué forma podría haber utilizado la información que propicia el intervalo del inciso c) para 
decidir acerca de la prueba realizada en el inciso anterior? 
 
Datos del problema 
 
 Variables en estudio: 
X1: Cantidad de adultos que ven el programa los sábados a la noche y les gusta en un grupo de 400. 
X2: Cantidad de adolescentes que ven el programa los sábados a la noche y les gusta en un grupo de 600 
 
 Tamaños de muestras: n1 = 400; n2 = 600 
 
 Nivel de confianza: 1 –  = 0,95. 
 
SOLUCIÓN 
 
a) Parámetro en estudio: p1-p2: diferencia entre las proporciones poblacionales de adultos y adolescen-
tes que ven el programa y les gusta 
Estimador: ˆ ˆ1 2p -p : diferencia entre las proporciones muestrales de adultos y adolescentes que ven el 
programa y les gusta. 
 
b) Antes de comenzar a construir el intervalo hay que verificar las condiciones para arribar a la variable 
pivotal mas indicada. 
 
 Condiciones: 
- X1 y X2 son variables aleatorias independientes. 
- Se extrajeron dos muestras aleatorias X11, X12, …,X1n1 e X21, X22, …,X2n2 
-Tanto X1 como X2 son variables aleatorias con distribución Binomial: X1  Bi (n1 ; p1) y X2  Bi (n2;p2) 
-n1 y n2 deben ser por lo menos iguales a 30. 
 
Al analizar las condiciones, nos encontramos con un muestreo al azar de adolescentes y adultos, lo 
que confeccionan dos muestras aleatorias y, por el tipo de muestreo, nos indica que las variables resul-
tan independientes ya que las muestras de adolecentes y adultos con la información dada no aparen-
tan tener relación entre sí. 
 
En este caso, a diferencia de los ejercicios anteriores, la condición que se le debe pedir a las distribu-
ciones de las variables, como ya fue dicho, es que ambas tengan distribución binomial. La verificación 
de esta condición es más sencilla que la verificación de la normalidad, ya que solamente hay que ob-
servar que el experimento al que está asociada cumplan con las condiciones de binomialidad, es decir: 
 
 Que cada repetición del experimento tenga dos resultados posibles (éxito y fracaso). Si lo aplica-
mos al ejemplo veremos que las dos posibles respuestas que podemos obtener, al encuestar a una 
persona, son: “que le guste el programa del sábado a la noche” y “que no le guste el programa del sá-
bado a la noche”. 
 
 Que los resultados (éxito y fracaso) sean mutuamente excluyentes en una misma repetición. Con-
textualizando, que sean mutuamente excluyentes quiere decir que tanto un adulto como un adolescen-
te pueden elegir sólo una de las dos respuestas posibles: “que le guste el programa del sábado a la 
noche” o “que no le guste el programa del sábado a la noche” 
 
 Que los resultados (éxito y fracaso) sean independientes de repetición en repetición. En el contex-
to del problema, quiere decir que la respuesta de un adulto o de un joven no modifica la probabilidad 
de una posible respuesta de otro adulto o joven respectivamente, en otra repetición del experimento al 
azar. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 21 
 Que el número de repeticiones esté prefijado de antemano, en este caso 400 adultos y 600 ado-
lescentes encuestados, y que la probabilidad de éxito sea constante a lo largo de todas las repeticio-
nes del experimento aleatorio. 
 
 
En este caso ambas variables cumplen con estas condiciones. 
Finalmente, como ya fue explicitado, los tamaños muestrales resultan grandes, y conjuntamente con 
las demás condiciones expuestas, se posibilita la aplicación del corolario del teorema central del límite. 
 
La variable pivotal para realizar estimaciones resultará: 
 
   
   
 1 2 1 2 1 21 2
1 21 1 2 2
1 2
ˆ ˆ
ˆ ˆ0;1 
ˆ ˆ ˆ ˆ1 1
dp p p p x xZ N donde p y p
n np p p p
n n
  
   
 

 
 
c) Estimación puntual: como ya fue explicitado el estimador será 1 2ˆ ˆp p , por lo tanto, la estimación 
puntual será el valor que toma dicha diferencia con los datos de las muestras en análisis: 
 
ˆ
1
cantidad de adultos que ven el programa los sábados a la noche y les gusta 100
p = = = 0,25
cantidad total de adultos 400
 
ˆ
2
cantidad de adolescentes que ven el programa los sábados a la noche y les gusta 300
p = = = 0,5
cantidad total de adolescentes 600
 
 
Por lo tanto la estimación puntual es: ˆ ˆ
1 2p -p = 0,25 - 0,5 = -0,25 
 
Intervalo de confianza: Utilizando la fórmula del intervalo de confianza para la diferencia de proporcio-
nes que se deduce utilizando lavariable pivotal expuesta en el inciso anterior se llega a: 
 
           1 1 2 2 1 1 2 21 2 1 21 1 2 2
1 2 1 2
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ1 1 1 1
ˆ ˆ ˆ ˆ;
p p p p p p p p
p p z p p z
n n n n  
    
      
  
 
 
 Reemplazando: 
 
           
 
0, 25 1 0, 25 0,5 1 0,5 0,25 1 0,25 0,5 1 0,5
0, 25 0,5 1,96 ; 0,25 0,5 1,96
400 600 400 600
0,1875 0, 25 0,1875 0, 25
0,25 1,96 ; 0,25 1,96
400 600 400 600
0, 25 1,96*0,03; 0,25 1,96*0,03 0,25 0,0588; 0,25
    
       
  
 
        
 
           0,0588 0,31; 0,19   
 
Nota: Recordar que en este caso, el intervalo no lleva unidades 
 
 Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [-0,31;-0,19] cubra o 
contenga a la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a 
la noche y les gusta, y la proporción poblacional de adolescentes que ven el programa los sábados a la 
noche y les gusta, en estas poblaciones de adultos y adolescentes que ven el programa los sábados a 
la noche. 
 
22 
 
d) Las hipótesis estadísticas pueden escribirse como: 
 
H0: p1 - p2 = 0 
H1: p1 - p2 0 
 
 
Ó 
H0: p1 = p2 
H1: p1 p2 
 
 
Se debe elegir una opción y continuar con ella todo el ejercicio 
 
 
El nivel de significación es 5%, siendo el estadístico de contraste: 
 
   
 
 1 2 1 2 1 2 1 21 2
1 2 1 2
1 2
ˆ ˆ
ˆ ˆ ˆ0;1 ; 
1 1
ˆ ˆ1
dp p p p x x x xZ N donde p p y p
n n n n
p p
n n
   
    
 
  
 
 
 
Nota: como en una dócima de hipótesis tendremos en H0: p1-p2=0  p1=p2 bajo el supuesto de la ve-
racidad de la hipótesis nula. Resulta entonces que 
 
 
 y como p1=p2=p entonces p 
 
 
Entonces se calcula p̂ como un promedio ponderado entre 1p̂ y 2p̂ , siendo p̂ un mejor estimador de 
p. Por lo tanto, el estadístico de contraste que se utiliza resulta ser diferente al estadístico expuesto en 
el inciso b que se emplea para realizar inferencias. 
 
Región crítica: Como p1-p20 por la hipótesis alternativa, la región crítica es bilateral, y está formada 
por los valores de Z mayores o iguales a 1,96, y los menores o iguales a -1,96. 
 
La regla de decisión es: 
RECHAZO H0 si Zobs  1,96 o Zobs ≤ -1,96 
NO RECHAZO H0 si -1,96 < Zobs < 1,96 
 
Cálculo de zobs: 
1 2
1 2
100 300
ˆ 0, 4
400 600
x x
p
n n
 
  
 
 
 
 
 
0, 25 0,5 0 0, 25 0,25
7,81
0,03211 1 0, 24*0, 4 1 0, 4
240400 600
Obsz
   
    
    
 
 
Decisión: Como zobs = -7,81 la decisión es rechazar H0 
 
En esta situación (región crítica bilateral) el p valor se grafica y se calcula de la siguiente forma: 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 23 
 
p valor = 2* P (Z  -7,81) 
 Conclusión: 
 
Con un nivel de significación del 5%, existen evidencias suficientes para rechazar H0 (p1-p2=0), por lo 
tanto la diferencia entre la proporción poblacional de adultos que ven el programa los sábados a la no-
che y les gusta, y la proporción poblacional de adolescentes que ven el programa los sábados a la noche y 
les gusta, es distinta de cero en estas poblaciones de adultos y adolescentes que ven el programa los 
sábados a la noche. 
 
e) Al haberse realizado en el inciso c) la estimación para el parámetro en estudio (p1-p2) mediante un 
intervalo de 95% de confianza, entonces se puede utilizar esta información para tomar una decisión 
para una prueba de hipótesis siempre y cuando: 
 Ambas correspondan al mismo parámetro, 
 con un nivel de significación que sumado al de confianza nos de 1 (en este caso sería 0,05) 
 que posea una región crítica bilateral, así la equivalencia con los valores tabulares es directa. 
 
Éstas condiciones se cumplen en la prueba realizada en el inciso d), por lo que, ayudados con el inter-
valo calculado [-0,31;-0,19], decidiremos acerca de la veracidad de H0: p1-p2=0 mediante la siguiente 
regla de decisión: 
 Rechazo H0 si 0  [-0,31;-0,19] 
 No rechazo H0 si 0  [-0,31;-0,19] 
 
Al no pertenecer el cero al intervalo, esto nos aporta evidencias suficientes para rechazar H0. 
 
 
EJERCICIO 7) Basándose en el mismo texto y los mismos datos del problema 3 con excepción de la 
igualdad de las varianzas poblaciones, responda los siguientes ítems: 
a.- Estimar el cociente entre las varianzas, puntualmente y con un nivel de confianza del 95%. 
b.- Los nutricionistas que desarrollaron la nueva ración (B) sostienen que además esta genera mayor 
uniformidad en el crecimiento. Probar la hipótesis sugerida con un nivel de significación del 5%. 
 
Nota: “Mayor uniformidad” hace referencia a la obtención de ganancias de peso parecidas dentro del lote, con baja 
dispersión, siendo ésta una característica deseada por los productores. También podría haberse dicho que el 
crecimiento generado por la ración B es más homogéneo que el crecimiento generado por la ración A 
 
SOLUCIÓN 
 
Los datos son los mismos que los del problema 3 y el análisis de las condiciones para la elección de la 
variable pivotal nos indica que: 
- XA y XB son variables aleatorias independientes. 
- Se extrajeron dos muestras aleatorias XA1, XA2, …,XAn1 e XB1, XB2, …,XBn2 
-XA  N (A, 2) y XB  N (B, 2) 
 
 
 
 
 
 
7,81 -7,81 
24 
 
Entonces: 
a) 
 Estimación puntual: se pide estimar puntualmente el cociente entre las varianzas, por ejemplo, sim-
bólicamente
2
2
A
B

 , cuyo estimador puntual es el cociente de las varianzas muestrales, es decir 
2
2
A
B
s
s
 
 Utilizando la fórmula de la varianza muestral se obtiene: 
     
2 2
12 2
1
1 1
2631 1 1 44,1
6961 6961 6916,9 4,9
1 9 10 9 9
i
A i
x
s x
n n
   
         
      
 
     
2 2
22 2
2
2 2
3071 1 1 36,91
8605 8605 8568,09 3,69
1 10 11 10 10
i
B i
x
s x
n n
   
         
      
 
Por lo tanto el estimador puntual del cociente entre A2 y B2 es: 
2
2
4,9
1,3279
3,69
A
B
s
s
  
 
Nota: En este caso se estima el cociente entre la varianza poblacional de A y la varianza poblacional 
de B, pero también podríamos resolver este ejercicio haciendo el cociente inverso, dado que en el 
enunciado no hay ninguna orientación en especial para realizarlo. 
 
 Intervalo de confianza: La fórmula del intervalo de confianza para el cociente de varianzas se de-
duce de la variable pivotal que se utiliza para estudiar el cociente de varianzas, cuya fórmula es: 
 
2 2
2 2
( 1),( 1) ( 1), ( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
s s
s
F F F F
s


 
     
 
La distribución se grafica de la siguiente manera: 
 
 
 
Donde: 
   1 1 , 1 ;
2A B
n n
F F 
 
 y 
   2 1 , 1 ;1
2A B
n n
F F 
  
 
 
 
Como en la tabla de F de Snedecor que se usa en el presente curso el valor de F1 no está tabulado, 
para conocerlo es necesario hacer uso de la siguiente igualdad: 
 
   
   
1 , 1 ;
2
1 , 1 ;1
2
1
A B
B A
n n
n n
F
F  
  
 
 
Por ejemplo, en el problema que estamos resolviendo: 
 
9,10;0,975 9,10;0,025
10,9;0,975
1 1
3,78; 0, 25
3,96
F F
F
    
 
El intervalo se construye basándose en las siguientes igualdades: 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 25 
2
2
2( 1),( 1); ( 1),( 1);1
2 2
2
1
A B A B
A
B
n n n n
A
B
s
s
P F F  

    
 
 
    
 
 
 
 
 
2
2
2
( 1),( 1); ( 1),( 1);122 2
1 1
1
A B A B
A
B
A
n n n n
B
P
sF F
s
 

 
    
 
 
    
 
 
 
 
 
2
2
2
( 1),( 1);1 ( 1),( 1);22 2
1 1
1
A B A B
A
B
A
n n n n
B
P
sF F
s
 

 
    
 
 
    
 
 
 
 
 
 
2 2
2 2 2
2
( 1),( 1);1 ( 1),( 1);
2 2
1
A B A B
A A
B A B
B
n n n n
s s
s s
P
F F 
 

    
 
 
    
 
 
 
 
 
 
Entonces, en nuestro problema: 
2
2
1,3279 1,3279
3,78 0, 25
AB


 
  
 
 
2
2
0,3513 5,3116A
B


 
  
 
 
 
Nota: Recordar que en este caso, el intervalo no lleva unidades 
 
 Conclusión: Con una confianza del 95% se espera que el intervalo [0,35136; 5,3116] cubra al 
cociente entre la varianza poblacional de la ganancia de peso de los cerdos alimentados con la ración A 
durante 30 días, y la varianza poblacional de la ganancia de peso de los cerdos alimentados con la ración 
B durante 30 días, en estas poblaciones de cerdos Yorkshire de 3 meses de edad del norte de la provincia 
de Buenos Aires en estudio. 
 
b) 
 Hipótesis de trabajo: “la nueva ración genera mayor uniformidad en el crecimiento”. 
 
 Condiciones para la elección de la variable pivotal: Ya fueron verificados en el ejercicio 3 las condi-
ciones de independencia y normalidad de las variables “ganancia de peso de los cerdos alimentados con 
la ración A durante 30 días” y “ganancia de peso de los cerdos alimentados con la ración B durante 30 
días”. 
 
 Hipótesis estadísticas: Si se quiere probar que la nueva formulación es más uniforme, se quiere 
probar que la nueva formulación es menos variable que la ración A, simbólicamente:
2 2
A B  , esta 
26 
 
expresión no contiene el signo igual por lo que corresponde a la hipótesis alternativa. Entonces las 
hipótesis quedan: 
2 2
0
2 2
1
:
:
A B
A B
H
H
 
 
 


 o equivalentemente 
2
0 2
2
1 2
: 1
: 1
A
B
A
B
H
H








 
 
 
al igual que en las demás pruebas se debe plantear solo un par de hipótesis y mantenerlas a lo largo de 
toda la prueba, en esta caso vamos a trabajar con la segunda expresión 
 
 Nivel de significación: =0,05 
 
 Variable pivotal: Existe una única opción al elegir la variable pivotal en esta prueba, la F de Snedecor, 
cuya fórmula es: 
2 2
2 2
( 1),( 1) ( 1),( 1)2 2
2 2
~ o ~
A B A B
A A
A B
n n n n
B A
B B
s s
s
F F F F
s


 
     siendo n1-1=9 y n2-1=10 
 
 Región crítica: Observando la hipótesis alternativa, se ve que la región crítica es unilateral derecha. 
 
El valor crítico que la determina debe buscarse en la tabla de la distribución de F de Snedecor. 
Éste es:          1 , 1 ;1 10 1 , 11 1 ;1 0,05 9,10 ;0,95 3,02A Bn nF F F        . 
Por lo cual, la región crítica es 3,02F  
 
 Regla de decisión: Rechazo H0 si 0 3,02HF  y no rechazo H0 si 0 3,02HF  
 
 Cálculo del estadístico de prueba: Todos los valores necesarios ya fueron calculados, por lo tanto, 
reemplazando en la fórmula, se obtiene: 
 
 
 
Observar que el cociente de las varianzas poblacionales fue 
reemplazado por 1, porque el cálculo se hace bajo la hipótesis nula que 
plantea la igualdad de las varianzas. Como 1,3279 es menor que 3,02, 
No se rechaza la hipótesis nula. 
 
 
 Conclusión: Con un nivel de significación del 5% no hay evidencia suficiente para rechazar H0 
(
2
0 2
: 1A
B
H


 ). Esto significa que el cociente entre la varianza poblacional de la ganancia de peso de los 
cerdos Yorkshire del norte de la provincia de Buenos Aires de 3 meses de edad alimentados con la 
ración A y la varianza poblacional de la ganancia de peso de los cerdos Yorkshire del norte de la 
provincia de Buenos Aires de 3 meses de edad alimentados con la ración B, es menor o igual a 1. Por 
lo tanto, al mismo nivel, no es cierta la hipótesis de los nutricionistas. 
 
Nota: a continuación se da la salida del programa InfoStat para este problema. Observar que los resultados son los 
mismos que se obtuvieron anteriormente. 
 
Prueba F para igualdad de varianzas 
Grupo(A) Grupo(B) n(A) n(B) Var(A) Var(B) F p prueba 
 1 2 10 11 4.900 3.691 1.328 0.3312 Unilat D 
 
 
0
2
2
2
2
4,9
3, 69 1,3279
1
A
B
H
A
B
s
s
F


  
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 27 
EJERCICIO 8) En un criadero el dueño quiere estudiar si el alimento N produce un menor engorde 
en los cerdos que el alimento T. Para ello a un grupo de cerdos seleccionados aleatoriamente se les 
administró el alimento N y a otro grupo, también seleccionado al azar, el alimento T y al cabo de un 
tiempo se registraron los aumentos de peso (kg). 
 
Alimento T 70 62 85 85 70 65 82 89 88 
Alimento N 81 90 90 86 88 83 89 85 94 95 100 
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
T 9 77,33 10,51 0,84 0,0801 
N 11 89,18 5,56 0,96 0,8858 
 
 
a) ¿El diseño del experimento utiliza muestras apareadas o independientes? Justificar la respuesta 
b) Verificar las condiciones para seleccionar el estadístico de prueba más indicado para probar la hipó-
tesis de los investigadores (en caso de utilizar una prueba de hipótesis NO CONCLUYA) 
c) Probar la sospecha del dueño del criadero a un nivel del 5%. 
d) Clasifique a la prueba realizada en el inciso anterior según si es parámetrica o de libre distribución 
(no parámetrica) y si es exacta o aproximada. 
 
Datos del problema: 
 
 Variables en estudio: 
XT: “Aumento de peso, en kg, de un cerdo que recibió el alimento T” 
XN: “Aumento de peso, en kg, de un cerdo que recibió el alimento N” 
 
 Tamaño de las muestras: nT= 9 y nN= 11 
 
 Nivel de significación: =0,05 
 
SOLUCIÓN 
 
a) Como primer paso debemos verificar si las muestras en estudio son independientes o contienen da-
tos apareados. En este caso, como los cerdos provienen de grupos diferentes tomados al azar y al no 
contar con información adicional que indique que comparten características genéticas consideraremos 
que las muestras son independientes. 
 
b) Por lo dicho anteriormente podemos decir entonces que 
- XT y XN son variables aleatorias independientes. 
- XT1, XT2, …,XT nT e XN1, XN2, …,XN nN son muestras aleatorias. 
 
Para verificar la condición de normalidad sobre las variables en estudio, realizamos el test de Shapiro-
Wilks para ambas: 
 
 
2
0 T
2
1 T
: ~N ; 
: no se distribuye normalmente ; 
T T
T T
H X
H X
 
 



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
Como el p-valor es de 0,0801<0,10 se rechaza la hipótesis nula , por lo tanto, XT no se distribuye nor-
malmente (µT ; 2T) 
 
En el enunciado nos pide que no concluyamos por lo tanto no es necesario hacerlo. 
 
 
28 
 
Veamos el test de Shapiro-Wilks para la variable XN: 
 
 
 
2
0 N
2
1 N
: ~N ; 
: no se distribuye normalmente ; 
N N
N N
H X
H X
 
 



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
Como el p-valor es de 0,88580,10 no se rechaza la hipótesis nula. Por lo tanto, XN no se distribuye 
normalmente (µN ; 2N) 
 
 
Por lo tanto, como no se cumple la condición de normalidad en una de las variables en estudio por lo 
que no podemos realizar una prueba t para muestras independientes, y al tener muestras de tamaño 
pequeño (n<30) no podemos utilizar el TCL por lo tanto debemos realizar un análisis no paramétrico, la 
prueba de Mann-Whitney. 
Las condiciones para aplicar dicho test son: 
- XT y XN deben ser variables aleatorias independientes entre sí. 
- XT1, XT2, …,XT nT y XN1, XN2, …,XN nN deben ser muestras aleatorias. 
- las variables en estudio XT y XN deben ser de escala por lo menos ordinal. 
- XT y XN deben poseer distribuciones similares (esto lo asumiremos pero podría comprobarse a partir 
de gráficos). 
Como estas condiciones se cumplen, desarrollaremos el correspondiente test de Mann-Whitney 
 
c) Para plantear las hipótesis estadísticas correspondientes, notemos que las muestras no poseen el 
mismo tamaño (nT= 9 y nN= 11). Denominaremos como muestra 1 a aquella que posee la menor 
cantidad de observaciones. En caso de muestras de igual tamaño, se elige indistintamente. Para 
este ejemplo, el subíndice 1 corresponde a los cerdos que recibieron el alimento T y 
consecuentemente, el subíndice 2 corresponde a los cerdos que recibieron el alimento N.Al no cumplirse las condiciones necesarias para realizar un test paramétrico, debemos recurrir a un 
test de libre distribución (no paramétrico), en este caso el test de Mann-Whitney. 
Este test usa otra medida de la población: la mediana poblacional, siendo: 
 
1 : Mediana Poblacional del aumento de peso (en Kg) de los cerdos alimentados con el alimento T. 
2 : Mediana Poblacional del aumento de peso (en Kg) de los cerdos alimentados con el alimento N.
 
Para respetar el orden 1  2 y, dado que se desea probar que el alimento N produce menor aumento 
de peso que el alimento T, las hipótesis quedan planteadas de la siguiente forma: 
 
H0: 1  2  0 
H1: 1  2 > 0 
 
Se combinan ambas muestras en una única muestra ordenada y luego asignamos a cada dato su ran-
go (posición) según su valor, sin tener en cuenta de cuál de las muestras proviene. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 29 
 
 
Luego se registra T1 = Suma de rangos de la muestra designada como 
muestra 1. 
 
T1 = 3,5+1+9+9+3,5+2+6+14,5+12,5 = 61 
 
Variable pivotal: 
 
 1 2
1 1
1 ;
1
- ~
2 n n
n n
U T U

 donde n1=9 y n2=11 
 
 
 
 
 
Valores críticos: 
La tabla sólo trae los valores críticos inferiores trabajando a una o dos colas con ciertos niveles de signifi-
cación. En este caso, la región crítica es unilateral derecha ya que la hipótesis alternativa plantea que 
1 > 2 . En consecuencia, buscamos el valor crítico considerando que 1 9n  y 2 11n  , y el nivel de sig-
nificación es 5% (a una cola). Observando en la tabla correspondiente U9;11, al 5% de significación y a la 
prueba de una cola obtenemos U9,11; 0.05= 27 
 
Para hallar el valor crítico superior, se utiliza la fórmula: 
1 2 1 2n ,n ; /2 n ,n ; 1- /2 1 2
U U n n    
9,11;0.95
9,11;0.95
27 9 11
9 11 27 99 27 72
U
U
  
     
 
 
Luego la región crítica resulta U ≥ 72 
 
Regla de decisión: Rechazo H0 si UH0 ≥ 72 
 No rechazo H0 si UH0 < 72 
 
 
0
1 1
1
1 9 10
61 61 45 16
2 2H
n n
U T
 
       
Como UH0=16 < 72, entonces no rechazo H0 
 
Conclusión: Al nivel de significación del 5%, no existen evidencias suficientes para rechazar H0 (H0: 1  2 
 0), por lo que la diferencia entre la mediana poblacional del aumento de peso, en kg, de los cerdos que 
recibieron el alimento T y la mediana poblacional del aumento de peso, en kg, de los cerdos que recibieron 
el alimento N es menor o igual a cero en estas poblaciones de cerdos de cierto criadero en estudio. 
 
Nota: La resolución anterior es una muestra de cómo se resuelve dicha prueba. De ahora en más, los test estadís-
ticos de libre distribución ( no paramétricos) se resolverán utilizando las salidas de Infostat. 
 
Prueba de Wilcoxon para muestras independientes 
Variable Grupo 1 Grupo 2 W p(2 colas) 
Engorde Alimento T Alimento N 61,00 0,1070 
 
Observemos que W es la suma de los rangos positivos, por lo tanto, si se quiere obtener el valor del estadístico de 
prueba bajo la hipótesis nula hay que calcularlo de la misma manera que antes. Recuerden, que también se puede 
tomar la decisión utilizando el p-valor y compáralo con el nivel de significación de la prueba. 
 
En este caso, utilizando el p-valor se llegaría a la misma conclusión (como debería ser) dado que es menor al nivel 
de significación de la prueba 
 
. 
En caso de tener otro par de hipótesis, la selección del valor crítico correspondiente se realizará según 
la siguiente tabla: 
T R(T) N R(N) 
70 3,5 81 5 
62 1 90 16,5 
85 9 90 16,5 
 85 9 86 11 
70 3,5 88 12,5 
65 2 83 7 
82 6 89 14,5 
89 14,5 85 9 
88 12,5 94 18 
 95 19 
 100 20 
30 
 
H0 H1 Región crítica 
0 1 2H :θ =θ 1 1 2H :θ θ 1 2 1 2n ,n ;α/2 1 2 n ,n ;α/2ó n n -U U U U   
0 1 2H :θ θ 1 1 2H :θ <θ 1 2n ,n ;αU U
 
0 1 2H :θ θ 1 1 2H :θ >θ 1 21 2 n ,n ;αn nU U  
 
 
d) El test realizado en el inciso anterior resulta ser de libre distribución (no paramétrico) ya que las va-
riables cumplen con las condiciones enunciadas en b) 
Además también puede clasificarse como exacto por la distribución de la variable pivotal que se utiliza 
para realizar inferencias, ésta no resulta aproximada. 
 
 
EJERCICIO 9) Con el fin de comparar el rendimiento académico (en una escala de 0 a 100 puntos) 
entre establecimientos privados y estatales, se seleccionan aleatoriamente 15 personas que han reali-
zado estudios secundarios en establecimientos privados, y 15 personas que han realizado estudios 
secundarios en establecimientos estatales. Los datos obtenidos son los siguientes: 
 
PRIVADO 41 65 41 64 51 55 47 92 91 80 45 53 56 71 52 
ESTATAL 90 65 59 65 54 42 48 46 44 43 65 36 35 57 49 
 
a) Definir las variables aleatorias en estudio. 
b) Verificar las condiciones para seleccionar la mejor variable pivotal para la situación en estudio. 
c) Realizar la prueba de interés al 5%. 
d) ¿Qué tipo de error se puso haber cometido? Interpretarlo en términos del problema. 
 
Shapiro-Wilks (modificado) 
 Tipo Variable n Media D.E. W* p(una cola) 
Estatal Rendimiento 15 53,20 14,29 0,91 0,2897 
Privado Rendimiento 15 60,27 16,68 0,87 0,0555 
 
Prueba de Wilcoxon para muestras independientes 
Variable Grupo 1 Grupo 2 n(1) n(2) W p(2 colas) 
Rendimiento Estatal Privado 15 15 206,50 0,2802 
 
SOLUCIÓN 
 
a) Variables en estudio: 
X1: “rendimiento académico (en una escala de 0 a 100 puntos) de un alumno de escuela estatal” 
X2: “rendimiento académico (en una escala de 0 a 100 puntos) de un alumno de escuela privado” 
 
b) Como primer paso debemos recalcar que nos encontramos ante dos muestras aleatorias de indivi-
duos que, con la información que propicia el enunciado, no aparentan tener relación entre sí. Por lo 
tanto las variables definidas son independientes. Luego debemos verificar la condición de normalidad 
de cada una, por lo que realizamos el test de Shapiro-Wilks: 
 
 
 
2
0 1 1 1
2
1 1 1 1
: ~N ; 
: no se distribuye normalmente ; 
H X
H X
 
 



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
Como el p-valor es de 0,2897>0,10 no se rechaza la hipótesis nula y concluye: Con un nivel de signifi-
cación del 10%, no tengo evidencias suficientes para rechazar la hipótesis nula (X1N(1;12)) por lo 
tanto el rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de escuela estatal 
se distribuye normalmente en esta población de alumnos de escuela estatal. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 31 
 
 
2
0 2 2 2
2
1 2 2 2
: ~N ; 
: no se distribuye normalmente ; 
H X
H X
 
 



 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
Como el p-valor es de 0,05550,10 se rechaza la hipótesis nula y concluye: con un nivel de significa-
ción del 10%, tengo evidencias suficientes para rechazar la hipótesis nula (X2N(2;22)) por lo tanto el 
rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de escuela privada no se 
distribuye normalmente en esta población de alumnos de escuela privada. 
 
No se cumple la condición de normalidad para el rendimiento académico de las personas que provie-
nen de establecimientos secundarios privados, por lo que no podemos realizar una prueba t para 
muestras independientes, y además, los tamaños de muestra resultan ser menores a 30 por lo que 
realizaremos un análisis de libre distribución (no paramétrico), la prueba de Mann-Whitney, aunque 
todavía debemos verificar las siguientes condiciones: 
- X1 y X2 deben ser variables aleatorias independientes entre sí. 
- X11, X12, …,X1 n1 e X21, X22, …,X2 n2 deben ser muestras aleatorias. 
- las variables en estudio X1 y X2 deben ser de escala por lo menos ordinal. 
- X1 y X2 deben poseer distribuciones similares 
 
 
 
 
Paraverificar el supuesto de distribuciones si-
milares usaremos los boxplot. 
Como podemos ver, ambas distribuciones de 
rendimiento académico de los individuos que 
provienen de establecimientos estatales y pri-
vados, son asimétricas positivas. Además am-
bas distribuciones tienen similar dispersión. 
 
 
 
 
c) Las hipótesis a testear para este test, en este caso, son: 
 
 H0: 1  2 = 0 
 H1: 1  2 ≠ 0 
 
Denominaremos como muestra 1 a aquella que posee la menor cantidad de observaciones. En caso de 
empate, se elige indistintamente. Para este ejemplo, la muestra 1 será la proveniente de las escuelas esta-
tales (E) y la muestra 2 provendrá de las escuelas privadas (P). Siempre se respetará el orden de la dife-
rencia (1  2) en las hipótesis. 
 
Interpretando en términos del problema: 
1= mediana poblacional del rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de 
escuela estatal. 
2= mediana poblacional del rendimiento académico (en una escala de 0 a 100 puntos) de los alumnos de 
escuela privada. 
 
La dócima podemos resolverla de dos maneras: utilizando el valor W (suma de los rangos correspon-
dientes a las observaciones de la muestra 1) o el p-valor. 
32 
 
 
- Utilizando el valor W: 
Variable pivotal: 
 
 1 2
1 1
1 ;
1
- ~
2 n n
n n
U T U

 donde 1 2 15n n  
 
Valores críticos: 
La tabla sólo trae los valores críticos inferiores trabajando a una o dos colas con ciertos niveles de signifi-
cación. 
Para buscarlo debemos considerar que 1 2 15n n  , la prueba es a “dos colas”, y el nivel de significación 
es 5%. Observando en la tabla correspondiente U15;15, que corresponde al 5% de significación y a la prue-
ba de dos colas obtenemos U15,15; 0.025 = 64 
 
Para hallar el valor crítico superior en caso de necesitarlo, se utiliza la fórmula: 
1 2 1 2n ,n ; 1- /2 1 2 n ,n ; /2
U n n U    
15,15;0.975 15 15 64 225 64 161U       
 
Región crítica: (U 64) (U 161)   
 
Regla de decisión: Rechazo H0 si 64
0
HU ó si 1610 HU 
 No rechazo H0 si 16164
0
 HU 
 
Cálculo del estadístico de contraste bajo H0: 
 
Por tabla W= 206,5 = T1 
 
 
0
1 1
1
1 15 16
206,5 206,5 120 86,5
2 2H
n n
U T
 
       
Decisión: Como 1615,8664
0
 HU , entonces no rechazo H0 
 
- Utilizando el p-valor: 
 
No se rechaza H0 si el p-valor>0,05 
Se rechaza H0 si el p-valor 0,05 
Decisión: Como p-valor= 0,2802 >0,05, no se rechaza H0 
 
Conclusión: Al nivel de significación del 5%, no existen evidencias suficientes para rechazar H0 (H0: 1  2 
= 0), por lo que la diferencia entre la mediana poblacional del rendimiento académico de los individuos que 
han realizado estudios secundarios en establecimientos estatales y la mediana poblacional de los que han 
realizado sus estudios secundarios en establecimientos privados en estas poblaciones de individuos que 
realizaron sus estudios en escuelas estatales o privadas es igual a cero. 
Como respuesta a la pregunta, podemos decir, que, al 5%, los rendimientos académicos no difieren signi-
ficativamente entre los individuos que han realizado sus estudios secundarios, al comparar establecimien-
tos estatales y privados. 
 
d) Al no haber rechazado H0 se pudo cometer el error de tipo II que sería no rechazar H0 cuando ésta 
es falsa. En términos del problema el error sería no rechazar que la diferencia entre la mediana 
poblacional del rendimiento académico de los individuos que han realizado estudios secundarios en 
establecimientos estatales y la mediana poblacional de los que han realizado sus estudios secundarios 
en establecimientos privados es igual a cero, cuando en realidad es distinta a cero. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 33 
 
EJERCICIO 10) Los datos que se presentan a continuación provienen de los pesos, en g, de 22 ratas 
hembras, de entre 28 y 84 días de vida. Doce de ellas fueron alimentadas con una dieta alta en proteínas, 
y 10 con una dieta baja en proteínas. Se tiene la hipótesis de que el peso medio de las ratas alimentadas 
con la dieta alta en proteínas es mayor que el peso medio las ratas alimentadas con la dieta baja en 
proteínas. 
 
Alta en proteína 120,2 120,57 119,78 120,29 118,62 120,69 120,27 119,13 118,04 120,29 117,46 119,7 
Baja en proteína 102,13 105,3 103,39 104,73 98,00 95,89 98,65 98,73 95,2 102,47 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Alta en proteína (A) 12 119,58 1,049 0,8715 0,1683 
Baja en proteína (B) 10 100,45 3,62 0,9282 0,4305 
 
a) 
i) ¿Cuál es el objetivo de los investigadores? 
ii) Según el diseño del experimento, ¿se trata de muestras apareadas o independientes? Justifi-
car y definir la/s variable/s en estudio y la unidad experimental. 
b) Construir un intervalo para el cociente de varianzas para las poblaciones en estudio al 95%. 
c) Utilizando la información provista por el intervalo anterior y las tablas dadas en el enunciado, anali-
zar las condiciones para seleccionar la variable pivotal para realizar inferencias para este caso. 
d) ¿Se puede suponer, al 5%, que se cumple la hipótesis de los investigadores? 
e) Si cree usted que resulta necesario, realice una estimación del parámetro en estudio con una con-
fianza del 95%. 
 
Datos del problema: 
 
 La hipótesis de trabajo que se desea poner a prueba es: 
“La dieta alta en proteínas produce un peso medio mayor que la dieta baja en proteínas” 
 
 Tamaños de las muestras: nA= 12 y nB= 10 
 
 Varianzas poblacionales: Desconocidas 
 
 Nivel de significación: =0,05 
 
 Nivel de confianza: 1-=0,95 
 
 
SOLUCIÓN 
 
a) 
i) Los investigadores desean probar si alimentar ratas con una dieta alta en proteínas, generara un 
aumento de peso mayor que aquellas con baja concentración proteica 
ii) Las muestras en estudio resultan ser aleatorias por el tipo de muestreo y además, al no proveerse 
información adicional acerca de la relación entre las ratas, suponemos que son unidades experimenta-
les independientes entre sí. Por lo que las variables en estudio serían dos: 
XA: peso de una rata de entre 28 y 84 días de vida alimentada con una dieta alta en proteínas, en g. 
XB: peso de una rata de entre 28 y 84 días de vida alimentada con una dieta baja en proteínas, en g 
La unidad experimental sería una rata de entre 28 y 84 días de vida. 
 
b) Desprendiéndose de la variable Pivotal 
2
2
( 1),( 1)2
2
~
A B
A
B
n n
A
B
s
s
F F


  
 
La fórmula del intervalo de confianza es: 
34 
 
 
 
Utilizando los datos del problema: 
 
 
Dónde: 1
( 1),( 1);
2A B
n n
F F 
 
 y 2
( 1),( 1);1
2A B
n n
F F 
  
 . 
 
   2 12 1 , 10 1 ;0,975 3,91F F    
 1 (12 1),(10 1);0,25
(10 1),(12 1);0,975
1 1
0,28
3,59
F F
F   
    
 
 
2 21.049 1.049
3.62 3.62; 0.02;0.30
3.91 0.28
 
 
 
 
  
 
 
Conclusión: Con un nivel de confianza del 95% se espera que el intervalo [0.02 ; 0.3] cubra al cociente 
entre las varianzas poblacionales del peso de las ratas alimentadas con una dieta alta en proteínas y 
una dieta baja en proteínas para estas poblaciones de ratas de entre 28 y 84 días de vida en estudio. 
 
c) Verificación de las condiciones para elegir la mejor variable pivotal: Para poder plantear las hipótesis 
estadísticas y poder llevar a cabo la prueba, hay que verificar ciertas condiciones necesarias. En este 
caso, son: 
-que ambas variables (XA y XB) sean independientes 
-que se extraigan dos muestras aleatorias XA1, XA2, …,XA nA y XB1, XB2, …, XB nB 
-que cada XAi y cada XBi se distribuya normalmente. 
-A2 y b2 son desconocidas, pero ¿iguales? 
 
Como fue dicho, la condición de independencia se cumple por la forma en que se realizó el experimen-
to: a un grupo de ratas seleccionado aleatoriamente se le suministró la dieta alta en proteínas y a otro 
grupo, también tomado al azar, se le suministro una dieta baja en proteínas.Para testear la normalidad, haremos un test de Shapiro Wilks para cada variable. 
 
Para XA: se realizó un test de Shapiro Wilks cuyas hipótesis son: 
 
 
 
2
0 A
2
1 A
: ~N ; 
: no se distribuye normalmente ; 
A A
A A
H X
H X
 
 



 
 
Al realizar el test, utilizando InfoStat, se obtuvieron los siguientes resultados: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
XA 12 119.58 1.049 0.8715 0.1683 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 35 
Como p-valor= 0,1683 y es mayor que =0,10, no se rechaza la hipótesis nula. Por lo tanto, con un nivel 
de significación del 10% no tengo evidencias suficientes para rechazar H0 (  2A~N ;A AX   ), por lo tanto 
el peso de las ratas de entre 28 y 84 días de vida alimentada con una dieta alta en proteínas medido en g, 
se distribuye normalmente. 
 
 
Análogamente se estudia la normalidad de la variable XB: 
 
 
 
2
0 B
2
1 B
: ~N ; 
: no se distribuye normalmente ; 
B B
B B
H X
H X
 
 



 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
XB 10 100.45 3.62 0.9282 0.4305 
 
No se rechaza H0 si el p-valor>0,10 
Se rechaza H0 si el p-valor 0,10 
 
Como p-valor= 0,4305 y es mayor que =0,10, no se rechaza la hipótesis nula. Por lo tanto, con un nivel 
de significación del 10%, no tengo evidencias suficientes para rechazar H0 (  2B~N ;B BX   ), por lo tanto 
el peso de las ratas de entre 28 y 84 días de vida alimentada con una dieta baja en proteínas medida en g, 
se distribuye normalmente. 
 
Al analizar las varianzas poblacionales, en este caso, no hay información de su valor, por lo tanto son 
desconocidas, y hay que probar si pueden considerarse iguales mediante una prueba de hipótesis 
utilizando la variable pivotal vista en el ejercicio 7. Dicho test se llama “de homogeneidad de varianzas”, 
cuyas hipótesis son: 
22
1
22
0
:
:
BA
BA
σσH
σ=σH
 
Y la salida de InfoStat correspondiente es: 
 
Prueba F para igualdad de varianzas 
Variable Grupo(A) Grupo(B) n(A) n(B) Var(A) Var(B) F p prueba 
Peso {Alta} {Baja} 12 10 1,10 13,10 0,08 0,0009 Bilateral 
 
Sin embargo, el enunciado nos pide que utilicemos la información que otorga el intervalo realizado en 
el inciso anterior. Como ya fue explicado en el ejercicio 6 inciso e, un intervalo puede utilizarse para 
decidir una prueba de hipótesis siempre y cuando: 
 Ambas correspondan al mismo parámetro, 
 con un nivel de significación que sumado al de confianza nos de 1 (en este caso sería 0,05) 
 que posea una región crítica bilateral, así la equivalencia con los valores tabulares es directa. 
Cumpliéndose estas condiciones, se puede pensar que la hipótesis nula que pondremos a prueba re-
fleja que el cociente es igual a 1 
En símbolos: 2 2/ 1A Bσ σ  
 
Por lo tanto, para decidir utilizando el intervalo habría que ver si: 
 Rechazo H0 si 1  [0.02 ; 0.3] 
 No rechazo H0 si 1  [ 0.02 ; 0.3] 
 
Como 1  [ 0.02 ; 0.3], entonces tenemos evidencias suficientes como para rechazar H0 y por lo tanto 
la varianza poblacional del peso de las ratas alimentadas con una dieta alta en proteínas medida en g, 
es distinta de la varianza poblacional del peso de las ratas alimentadas con una dieta baja en proteínas 
36 
 
medida en g, en estas poblaciones de ratas de entre 28 y 84 días de vida alimentadas con las dietas 
nombradas y trabajando con un nivel de significación del 5%. 
 
Se podría haber arribado a la decisión a través del uso del p-valor dado en la salida de InfoStat donde el resultado 
es p-valor= 0,0009 que se compara contra el nivel de significación utilizado en la prueba (0,05). Como p-valor es 
0,0009 0,05= se rechaza H0 
 
Además, la tabla también nos ofrece el valor del estadístico bajo H0 que es F= 0,08 . Éste debe compa-
rarse con los valores tabulares hallados anteriormente que forman la región crítica F0,28 y 3,91 F 
Como Fobs=0,08 0,28 Rechazo H0. 
 
En resumen, ambas variables se distribuyen normalmente con varianzas desconocidas y diferentes. 
 
d) Hipótesis estadísticas 
 
Como el interés del investigador es probar si al alimentar a las ratas con una dieta con alta con-
centración de proteínas produce un peso medio superior, simbólicamente: 21   . Por lo que las hipó-
tesis estadísticas son: 
0 B
1 A B
:
:
AH μ μ
H μ > μ

 
 
 Nivel de significación: =0,05 
 
 Estadístico de prueba (o variable pivotal) 
 
Se está realizando un test de hipótesis para la diferencia de medias poblacionales de variables con 
distribución normal, por lo cual se cuenta con dos opciones al elegir la variable pivotal: Z o t de Stu-
dent, dependiendo del hecho de conocer o no las varianzas poblacionales. En este caso, las varianzas 
poblacionales son desconocidas y desiguales, por lo tanto se utiliza una t, con la siguiente expresión: 
 
 
   
2 2 
   


A B A B
A B
A B
x x
t t
s s
n n
, 
 
siendo , los grados de libertad que se calculan siguiendo la parte entera de la expresión: 
 
22 2
2 22 2
1 1
A B
A B
A B
A B
A B
s s
n n
s s
n n
n n

 
 
 
   
   
   
 
 
 
 Región crítica: 
Es unilateral derecha, dado que H1: 1-2>0 , por lo tanto el valor crítico es: 95,0,w
t , siendo  
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 37 
 
   
 
2 22 2
2
2 2 2 2 2 22 2
2
1,10 13,1
0,091 1,3112 10
0,091 1,311,10 13,1
12 10 11 9
12 1 10 11 1
1,401 1,9628 1,9628
10,2
0,008281 1,7161 0,00075 0,19 0,19075
11 9
A B
A B
A B
A B
A B
s s
n n
s s
n n
n n

              
       
                 
   

8
 
 
Como puede verse, el resultado es un número decimal, y los grados de libertad están representados 
por números enteros positivos. ¿Cómo resuelvo este dilema? Tomando la parte entera del resultado, o 
sea, 10. 
El valor crítico es 10;0,95 1,812t  y la región crítica queda determinada por: 1,812t  
 
 Regla de decisión: Rechazo H0 si 1,812
oH
t  
No rechazo H0 si 1,812
oH
t  
 
 Cálculo de tHo: 
 
Antes de calcular el valor del estadístico de prueba hay que calcular las medias muestrales utili-
zando las fórmulas dadas en la unidad de estadística descriptiva de Elementos de Estadísti-
ca: A B119 58 ; 100 45x = , x = , . Hay que tener en cuenta que la prueba se está realizando bajo la hi-
pótesis nula que contiene el caso en que las medias poblacionales son iguales, por lo tanto la diferen-
cia de las medias poblacionales es cero, es decir que 0A B   . Reemplazando estos valores y el 
resto de la información en la fórmula nos queda: 
 
0H 2 2
 ( ) 0 (119,58 100, 45) 19,13 19,13 19,13
t 16,162
1,18361,1 13,1 0,091 1,31 1, 401
12 10
A B
A B
A B
x x
s s
n n
  
     

 
 
 Decisión: Se Rechaza la hipótesis nula porque 
0
16,162Ht  , es mayor que 1,812 
 
 Conclusión: Con un nivel de significación de 5% tengo evidencia suficiente para rechazar la hipó-
tesis nula ( 0 : A BH   ), por lo tanto la media poblacional del peso de las ratas de entre 28 y 84 días 
de vida que reciben la dieta alta en proteínas es mayor que la media poblacional de las ratas de entre 
28 y 84 días de vida que reciben la dieta baja en proteínas, en estas poblaciones de ratas de entre 28 
y 84 días de vida en estudio. 
 
La correspondiente salida de Infostat es: 
 
Prueba T para muestras Independientes 
 
 n Media Varianza pHomVar T p-valor 
Grupo A 12 119,59 1,1 0,0003 16,16 <0,0001 
Grupo B 10 100,45 1,1 
 
Se puede observar en la salida que se realiza la prueba de homogeneidad y se rechaza la hipótesis de 
igualdad de varianzas; luego se realiza la prueba de diferencia de medias unilateral izquierda 
suponiendofalta de homogeneidad. 
 
38 
 
e) Al haberse rechazado H0, un intervalo de confianza aportaría una estimación de cuán grande es la 
media poblacional del peso de las ratas de entre 28 y 84 días de vida que reciben la dieta alta en pro-
teínas con respecto a la media poblacional de las ratas de entre 28 y 84 días de vida que reciben la 
dieta baja en proteínas. 
La fórmula del intervalo del 95% que se está solicitando se despeja de la variable pivotal y es: 
 
2 2 2 2
A B A B
A B ,1 2 A B ,1 2
A B A B
α α
s s s s
(x x ) t + ;(x x )+t +
n n n n  
 
   
  
 
 
reemplazando por los datos del problema se obtiene que 
 
   10,0,975 10,0,975
1,1 13,1 1,1 13,1
119,58 100, 45 119,58 100,45
12 10 12 10
19,13 2, 228 0,091 1,31;19,13 2,228 0,091 1,31
19,13 2, 228 1, 401;19,13 2, 228 1,401 19,13 2, 228*1,1836;19,13 2, 228*1,1
t + ; t +
 
     
 
       
         
   
836
19,13 2,637;19,13 2,637 16, 493 ;21,767g g

   
 
Conclusión: Con un nivel de confianza del 95%, se espera que el intervalo [16,493 g; 21,767 g] cubra a 
la diferencia entre la media poblacional del peso de la ratas de entre 28 y 84 días de vida alimentadas 
con la dieta alta en proteínas y la media poblacional de las ratas de entre 28 y 84 días de vida alimen-
tadas con la dieta baja en proteínas. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 39 
PROBLEMAS PROPUESTOS 
 
EJERCICIO 1) Para estudiar el efecto de un nuevo fertilizante sobre el rendimiento promedio de un 
cultivo de oleaginosas, se sembraron 12 ha del cultivo con fertilizante (F) y 10 ha sin fertilizante (S) 
elegidas aleatoriamente. Suponiendo que F = S = 105 kg/ha, con los datos obtenidos del experimento se 
presentan la siguiente tabla: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Fertilizante (F) 12 1089 87,42 0,94 0,6129 
Sin fertilizante (S) 10 877 97,31 0,98 0,9832 
 
a) Definir la/las variable/s en estudio. 
b) Enunciar y verificar el cumplimiento de las condiciones para elegir la variable pivotal más indicada para 
la situación en estudio. 
c) ¿Es la diferencia entre los rendimientos medios con y sin fertilizante, significativa al 5%? 
d) ¿Considera conveniente construir un intervalo de confianza para la diferencia entre las medias? 
Justifique. En caso de ser afirmativa la respuesta, realizar la estimación correspondiente. 
 
EJERCICIO 2) Las personas que tienen el síndrome de Raynaud sufren un súbito deterioro en la 
circulación sanguínea de los dedos de las manos y de los pies. Para estudiar esta enfermedad, en un 
experimento se midió la generación de calor, mediante calorimetría, en cal/cm2/min, de un dedo índice 
luego de haberlo sumergido en agua a 19°C. En este estudio, se contó con una muestra tomada al azar de 
10 individuos con el síndrome y una muestra de 10 individuos sanos. Los datos recabados por el 
experimentador se presentan en las siguientes tablas: 
 
Sanos (S) 2,43 1,83 2,43 2,70 1,88 1,96 1,53 2,08 1,85 2,44 
Síndrome de Raynaud (E) 0,81 0,70 0,74 0,36 0,75 0,56 0,65 0,87 0,40 0,31 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Sanos 10 2,11 0,37 0,92 0,5118 
Enfermos 10 0,62 0,20 0,89 0,2498 
 
a) Definir las variables y poblaciones en estudio 
b) Definir el parámetro en estudio en términos del problema 
c) Indicar las condiciones necesarias para seleccionar la mejor variable pivotal para este caso. Para la 
homogeneidad de varianzas asumir que E2 = S2 
d) Estimar puntualmente y por intervalo de confianza la diferencia entre la generación de calor media 
de los individuos enfermos (E) y la generación de calor media de los individuos sanos (S) (1- = 0,90). 
e) ¿La estimación realizada en el ítem anterior es exacta o aproximada? Justificar. 
f) Una nueva investigación afirma que la generación de calor por parte de los afectados por este 
síndrome es más homogénea. Probarlo con un nivel de significación del 5% utilizando la información 
de la siguiente tabla: 
 
Prueba F para igualdad de varianzas 
Variable Grupo(S) Grupo(E) n(S) n(E) Var(S) Var(E) F 
sindrome {1,00} {2,00} 10 10 0,14 0,04 3,46 
 
EJERCICIO 3) De una población de individuos afectados por una enfermedad, se tomaron dos muestras 
aleatorias e independientes de 100 individuos cada una. A una de las mismas (que llamaremos grupo A), 
se le administró un suero, al otro grupo (B, control) se le administró un placebo; en todo lo demás, los dos 
grupos fueron tratados idénticamente. Se encontró que en los grupos A y B, 75 y 55 individuos, 
respectivamente, se habían recuperado luego de un mes de observación. Para probar la hipótesis de que 
el suero ayuda a curar la enfermedad: 
a) ¿Cuál es el objetivo del experimento? ¿Cómo realiza la toma de muestras para cumplir dicho objetivo? 
b)Definir al parámetro en estudio. 
c)Analizar las condiciones en términos del problema para poder realizar la prueba de interés. 
d) Con un nivel de significación del 5% realizar la prueba de interés. 
40 
 
e) ¿Cree usted que la estimación del parámetro en estudio aportaría mayor información a la investigación? 
Justificar la respuesta 
 
EJERCICIO 4) Un estudio llevado a cabo para probar si la aspirina afecta el tiempo de coagulación, 
se tomó una muestra de 12 adultos varones. El tiempo de protrombina, que mide el tiempo en 
segundos entre el inicio de la reacción de coagulación y la formación del coágulo, fue medido en cada 
uno de los individuos antes y después de 3 hs de haber ingerido dos tabletas de aspirina (500mg cada 
una). 
 
Antes 12,3 12,0 12,0 13,0 13,0 12,5 11,3 11,8 11,5 11,0 11,0 11,3 
Después 12,0 12,3 12,5 12,0 13,0 12,5 10,3 11,3 11,5 11,5 11,0 11,5 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
antes 12 11.89 0.71 0.89 0.2210 
después 12 11.79 0.75 0.97 0.9213 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Dif_AD 12 0,11 0,51 0,86 0,1172 
 
Prueba T para muestras Independientes 
Grupo1 Grupo2 n1 n2 med1 med2 LI(95%) LS(95%) T p prueba 
Antes Después 12 12 11,89 11,78 -0,51 0,72 0,37 0,7186 Bilat 
 
Prueba T para un parámetro 
Valor del parámetro probado: 0 
Variable n Media DE LI(95) LS(95) T p(Bilateral) 
Dif_AD 12 0,11 0,51 -0,21 0,43 0,74 0,4748 
 
a) Realizar la verificación de las condiciones para la elección de la variable pivotal, sin expresar cálculos y 
utilizando la información que le proporciona alguna de las salidas de InfoStat que abajo se detallan 
comentando brevemente por qué eligió esa salida y a qué decisión llega a partir de la información 
b )Probar si existe alguna diferencia en el tiempo de protrombina, Realizar la prueba de interés al 5%. 
c) ¿Qué tipo de error se puso haber cometido? Expresarlo en términos del problema 
d) Si el intervalo de confianza del 95% correspondiente al parámetro en estudio resulta ser [-0,21;0,43] 
seg, realice una interpretación del mismo. 
e) ¿Cree usted que el intervalo calculado en el inciso anterior aporta alguna información a la investiga-
ción? Justificar. 
 
EJERCICIO 5) Las empresas que comercializan agua para beber, realizan controles de calidad dia-
riamente. Una de las variables de interés es el pH, que mide el grado de acidez del agua contenida en 
los envases lista para su distribución. Un pH menor a 7 es considerado ácido, un pH mayor a 7 es con-
siderado alcalino y un pH igual a 7 es considerado neutro. Un investigador sospecha que el material de 
los nuevos envases modifica el pH del agua. Para estimar la diferencia entre los pH medios, extraen 
aleatoriamente 20 muestras de agua con el envase viejo y 15 muestras de agua con el envase nuevo. 
Algunos datos obtenidos son: 
 
 
 Media Desvío Shapiro-Wilks (p-valor) 
Envase viejo8,366 0,54 0,6413 
Envase nuevo 6,318 3,73 0,9609 
Prueba de homogeneidad de varianzas: F = 0,0209, p-value = 0 
 
a) 
i. ¿Cuál es el objetivo del experimento? 
ii. Indicar la unidad experimental para este caso. 
b) Definir el parámetro en estudio y su estimador correspondiente e interpretarlos en términos del 
problema. 
c) Enunciar y verifique las condiciones necesarias para realizar inferencias para la situación de in-
terés. En caso de realizarse alguna prueba de hipótesis NO CONCLUYA. 
d) Estimar puntualmente y mediante un intervalo de confianza del 99% el parámetro especificado 
en el inciso b. 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 41 
e) ¿Se podría usar el Intervalo de Confianza del ítem anterior para hacer la conclusión de una 
prueba de hipótesis? Si la respuesta es sí, indicar las hipótesis de la prueba, el nivel de signifi-
cación y la decisión tomada. Si la respuesta es no, justificar. 
 
EJERCICIO 6) Alle y Bowen (1932) estudiaron el tiempo de supervivencia de la carpa dorada, en minu-
tos, cuando se coloca en suspensiones de plata. Los investigadores realizaron varios experimentos, entre 
ellos el siguiente: se asignan aleatoriamente 10 carpas a cada uno de dos grupos. En uno de ellos se ex-
ponen a las carpas a una concentración baja de nitrato de plata disuelto en el agua (Conc1, 50 g/l), y el 
otro grupo, a una concentración mayor (Conc2, 80g/l) con el fin de analizar se difieren los tiempos de su-
pervivencia entre ambos grupos. Los datos obtenidos se representan en las siguientes tablas: 
 
Conc1 210 180 240 60 55 75 78 82 125 83 
Conc2 81 75 156 180 102 200 135 85 78 87 
 
Shapiro-Wilks (modificado) 
Concentración Variable n Media D.E. W* p (una cola) 
1 Sobrevida 10 118,80 67,11 0,81 0,0247 
2 Sobrevida 10 117,90 46,46 0,82 0,0307 
 
Prueba de Wilcoxon para muestras independientes (Mann Whitney) 
 
Variable Gr1 Gr2 n1 n2 Me1 Me2 R-media1 R-media2 W p(2 colas) 
Sobrevida 1 2 10 10 82,50 94,50 9,75 11,25 97,50 0,5703 
 
a) Las muestras de carpas tomadas en el estudio ¿Se encuentran o no se encuentran apareadas? 
Según su respuesta a la pregunta anterior, ¿Qué modificación debería realizarse en el diseño del expe-
rimento para que se presente el otro caso y sea biológicamente posible? 
b) Definir la/s variable/s y población/es en estudio. 
c) Analizar las condiciones necesarias para realizar la prueba de interés al nivel del 10%. Exprese 
SOLAMENTE hipótesis estadísticas, regla de decisión y decisión tomada. 
d) Realice la prueba en estudio al 10%. 
e) Clasifique al test utilizado en el inciso d según si es asintótico, exacto, paramétrico y/o de libre dis-
tribución (no paramétrico) (puede responder varias opciones). Justifique su respuesta. 
 
 
 
 
 
 
 
 
 
 
 
42 
 
CUESTIONARIO 
 
1.- ¿Cuál es el objeto de un diseño experimental? ¿Qué beneficios trae? 
 
2.- ¿De qué manera puede controlarse la confusión de factores en el estudio experimental? 
 
3.- En un estudio observacional: 
a) ¿Se aleatorizaron las asignaciones a tratamiento y control? SÍ NO 
b) ¿Se Prefija qué característica determinó la separación entre los grupos? SÍ NO 
c) ¿Existen factores que pueden confundirse con los tratamientos? SÍ NO 
d) ¿Si existe posibilidad de confusión, puede controlarse? SÍ NO 
 
4.- En los estudios observacionales pueden establecerse asociaciones, es decir poner de manifiesto 
que una cosa está relacionada con otra. ¿Pueden estos estudios establecer causalidad? 
 
5.- ¿Cómo diseñaría un experimento para estudiar si la hipertensión durante el embarazo provoca be-
bés nacidos con menor peso? ¿Qué factor podría confundirse y cómo lo controlaría? 
 
6.- Según un estudio observacional realizado en el Kaiser Permanente de Walmut Creek, California, se 
daba un índice más elevado de cáncer de cuello de matriz entre mujeres que usaban anticonceptivos ora-
les que entre las que no usaban, independientemente de su edad, educación, estado civil, religión y hábito 
de fumar. Los investigadores llegaron a la conclusión de que la píldora causaba el cáncer del cuello de 
matriz. ¿Es correcta esta afirmación? ¿Por qué? 
 
7.- Identifique en el ejemplo anterior los términos: unidad experimental, tratamiento, factor, niveles del 
factor. 
 
8.- ¿En qué casos debe aplicarse el test de Welch? Especifique condiciones y Variable pivotal con su 
distribución. 
 
9.- ¿Puede resultar negativo algún límite de un intervalo de confianza para la diferencia de dos 
proporciones? Justifique su respuesta. 
 
10- ¿En qué casos es recomendable aplicar un test de Mann Whitney? Explicite las condiciones que 
deben cumplirse, las hipótesis, variable pivotal y su distribución. 
 
11.- ¿Cuándo le parece conveniente utilizar una prueba para la media de las diferencias apareadas? 
¿Cuántas son las variables en estudio? 
 
12.- Se tiene la sospecha de que la proporción de individuos que no tienen enfermedades cardiovascu-
lares en la población A es mayor que en la población B. Para poner a prueba esta hipótesis se tomó 
una muestra aleatoria de individuos de la población A y otra de la población B y se observó el número 
de individuos sin esta afección en cada grupo. 
a) La hipótesis de trabajo es: .......................................................................................................... 
b) Interpretación biológica de parámetro/s en estudio: ...................................................................... 
c) Las hipótesis estadísticas son: ..................................................................................................... 
d) Las condiciones necesarias para la validez de la prueba estadística son: .................................. 
 
13.- ¿Qué test de nivel asintótico ha utilizado en ésta unidad y en qué situaciones? 
 
14.- ¿En qué situaciones es conveniente realizar un test de Wilcoxon? 
 a)¿ Que condiciones deben cumplirse? 
b) ¿Cómo se realiza el muestreo? ¿Cuáles son las hipótesis estadísticas y la variable pivotal? 
15.- Para el caso de estudiar diferencias de proporciones poblacionales, indicar: 
 a) parámetro en estudio 
 b) estimador puntual 
 c) Estadístico de prueba para estimaciones por IC 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 43 
 DISEÑO COMPLETAMENTE ALEATORIZADO (DCA) 
ANÁLISIS DE LA VARIANZA (ADEVA) 
 
Objetivos específicos 
 Comprender la importancia de las aplicaciones del análisis de la varianza. 
 Adquirir vocabulario específico y manejar algunos métodos del Diseño Experimental. 
 Aplicar análisis de la varianza paramétrico y no paramétrico, según corresponda, en casos relativos 
al campo profesional del veterinario. 
 
Contenidos temáticos 
Concepto de Modelo. Supuestos. Método de mínimos cuadrados. ADEVA para DCA. Prueba de hipótesis 
para comparar valores medios de más de dos tratamientos. Análisis de varianza de una clasificación por 
rangos de Kruskal-Wallis. Aplicaciones. Interpretación de análisis realizados mediante programas de 
computación. 
 
Glosario 
Diseño completamente aleatorizado (DCA). Modelo estadístico. Análisis de la varianza (ADEVA) para un 
DCA, Modelo I. Pruebas de Hipótesis. Suma de cuadrados. Cuadrado medio. Varianza. Análisis de 
varianza Kruskal-Wallis. Rango. Variables al menos ordinales. Mediana. 
 
 
PROBLEMAS RESUELTOS 
 
EJERCICIO 1) Para comparar cuatro suplementos “de engorde” en bovinos de carne, se seleccionaron, 
al azar, cuarenta animales Hereford de iguales edad y sexo, y de pesos homogéneos para ser usados en 
un experimento. Los suplementos a comparar se definieron sobre la base de las características del grano 
de maíz empleado (“entero” o “partido”) y la fuente comercial de vitaminas y minerales (“A” y “B”). 
Entonces el suplemento 1 (S1) estuvo constituido por grano partido y fuente A, mientras que el 
suplemento 2 (S2) por grano partido y fuente B, el suplemento 3 (S3) por grano entero y fuente A, yel 
suplemento 4 (S4) por grano entero y fuente B. Se asignaron aleatoriamente 10 animales por 
suplemento, los que fueron alimentados individualmente con una dieta estándar más el correspondiente 
suplemento durante 80 días. Se registra la eficiencia de conversión (EfCon) individual (kg Materia Seca/ 
kg Ganancia de Peso) cuyos resultados se presentan en las siguientes tablas: 
 
S1 3,3 4,4 4,9 4,9 3,9 4,2 4,7 5,1 4,6 4,5 
S2 4,6 4,5 5 4 4,5 5,2 4,9 5,5 4,8 5,3 
S3 6,7 5,8 5 4,8 5,3 6,2 5 6,4 5,9 5,4 
S4 6,3 6 6,7 5,5 6,6 6,1 5,3 6,5 6,3 6,8 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
S1 10 4,45 0,54 0,92 0,5174 
S2 10 4,83 0,45 0,97 0,9167 
S3 10 5,65 0,65 0,92 0,4806 
S4 10 6,21 0,50 0,90 0,3451 
RE_EfCon 40 0,00 1,01 0,96 0,4386 
 
 
Análisis de la varianza – Test de Levene 
 Variable N R² R² Aj CV 
Abs_dif 40 0,07 0,00 75,24 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 0,25 3 0,08 0,86 0,4716 
Tratam 0,25 3 0,08 0,86 0,4716 
Error 3,51 36 0,10 
Total 3,76 39 
 
Análisis de la varianza 
Variable N R² R² Aj CV 
EfCon 40 0,65 0,62 10,32 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 19,87 3 6,62 22,18 <0,0001 
Tratam 19,87 3 6,62 22,18 <0,0001 
Error 10,76 36 0,30 
Total 30,63 39 
 
 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 44 
a) ¿Cuál es el objetivo del experimento? 
b) Defina la unidad experimental ¿En qué condiciones se desarrolla el experimento? ¿Qué se registra? 
c) ¿Qué diseño se empleó? ¿Por qué? ¿qué se asumió? 
d) ¿Cuál será el modelo teórico a emplear? Interpretar cada uno de sus componentes e indicar los paráme-
tros del diseño. 
e) ¿Qué puede decir con respecto a la validez del DCA paramétrico? 
f) Escribir las hipótesis de interés, y teniendo en cuenta la salida de computadora concluir al 5%. 
g) Los investigadores creen que al comparar los suplementos 1 y 4 se podrán encontrar diferencias signi-
ficativas en los valores medios de la eficiencia de conversión de los bovinos. Comprobar estadística-
mente al 10% expresando las hipótesis estadísticas, región crítica y decisión. 
 
SOLUCIÓN 
 
a) Objetivo: comparar la efectividad de cuatro suplementos diferentes para “engorde”. 
Los suplementos se definieron sobre la base de las características del grano de maíz empleado (“entero” 
o “partido”) y la fuente comercial de vitaminas y minerales (“A” y “B”) quedando constituidos por: 
 
Suplemento 1 (S1): grano partido y fuente A 
Suplemento 2 (S2): grano partido y fuente B 
Suplemento 3 (S3): grano entero y fuente A 
Suplemento 4 (S4): grano entero y fuente B. 
 
b) Unidad experimental: un bovino de raza Hereford. 
 
Condiciones en que se desarrolla el experimento: 40 bovinos de raza Hereford de iguales edad y sexo, y 
de pesos homogéneos, alimentados individualmente con una dieta estándar más el correspondiente 
suplemento durante 80 días. Se asigna al azar igual cantidad de bovinos a cada dieta. 
 
Variable respuesta: Eficiencia de conversión de un bovino (kg Materia Seca/ kg Ganancia de Peso) 
 
La variable respuesta se mide en bovinos que son sometidos a cuatro tratamientos: 
Dieta a base de suplemento 1 
Dieta a base de suplemento 2 
Dieta a base de suplemento 3 
Dieta a base de suplemento 4 
 
Es decir, una variable registrada en cuatro poblaciones. En éste caso la Dieta es el factor que tiene cua-
tro niveles (S1, S2, S3 y S4). 
 
c) Se aplicó un diseño completamente aleatorizado (DCA) debido a que los animales se asignaron sin res-
tricciones a los tratamientos. Se asumió que: 
 los factores raza, peso y sexo podían influir en los resultados por lo cual fueron controlados por el 
experimentador. Además se seleccionó como factor de interés a la dieta. 
 No hay otros factores que influyan en los resultados del experimento. 
 
d) El modelo teórico de DCA modelo fijo es: 
Yij = i + ij para i=1, 2, 3, 4; j=1, 2, …, N 
Donde: 
Yij: Eficiencia de conversión registrada en el j-ésimo bovino de raza Hereford que recibió la i-ésima dieta. 
(variable aleatoria) 
i: Eficiencia de conversión media poblacional de los bovinos Hereford que recibieron la i-ésima (pará-
metro) 
ij: variable aleatoria no observable correspondiente a la respuesta propia del j-ésimo bovino de raza He-
reford que recibió la i-ésima dieta. ( ~ N(0, 2)). (variable aleatoria) 
 
En cuanto a los parámetros del diseño, son: 
 i (i=1, 2, 3, 4) que está presente en la ecuación del modelo y 
 2 que es la varianza de los errores del modelo (). 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 45 
 
e) Condiciones para la elección de la variable pivotal: 
Antes de realizar el estudio, deberíamos verificar si: 
i) Las observaciones de eficiencia de conversión son independientes entre y dentro de cada tratamiento. 
ii) Para cada suplemento existe una subpoblación de valores de Eficiencia de conversión de los bovinos 
Hereford de sexo, edad y peso inicial similares con distribución normal 
iii) Para cada suplemento existe una subpoblación de valores de Eficiencia de conversión de los bovinos 
Hereford de sexo, edad y peso inicial semejantes con igual varianza. 
 
i) Esta condición se cumple porque los animales inicialmente eran homogéneos en cuanto a las otras 
características (peso, raza y sexo), fueron aleatorizados irrestrictamente y por lo tanto la eficiencia de 
conversión de un bovino es independiente de la de otro. 
 
ii) La segunda condición se puede probar a partir de la variable respuesta o de los errores del modelo: 
 
1) A partir de la variable respuesta: 
 
Para analizar la normalidad de la variable respuesta, debemos hacerlo dentro de cada tratamiento. Por 
ello, distinguiremos en la variable respuesta a 4 variables, cada una observada en una población. Éstas 
son: 
- Ef de conversión (S1) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 1. 
- Ef de conversión (S2) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 2. 
- Ef de conversión (S3) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 3. 
- Ef de conversión (S4) de un bovino (kg Mat Seca/ kg Gan de Peso) alimentado con el suplemento 4. 
 
 
Observando los p-valores se puede decir que en las cuatro poblaciones ocurre que, al 10%, no se rechaza la 
hipótesis de normalidad de Eficiencia de conversión. 
A modo de ejemplo, se concluirá para el suplemento 1, siendo luego similares las conclusiones para los 
restantes suplementos: 
 
Con un nivel de significación del 10%, no existen evidencias suficientes para rechazar la hipótesis nula 
(H0: S1 se distribuye N (1 , 12)) por lo tanto, puedo decir que la Eficiencia de conversión por los bovinos 
que consumieron el Suplemento 1 (S1): grano partido y fuente A, se distribuye normalmente en esta po-
blación de bovinos Hereford de iguales edad y sexo en estudio. 
 
2) A partir de los errores. 
 
 
Dado que el modelo es: Yij = i + ij para i=1, 2, 3, 4; j=1, 2, …, 10 
 
El error correspondiente a una observación es la diferencia entre el valor observado y valor medio esperado 
es decir ij = Yij - i 
Y, dado que los parámetros son información fija (i, i=1, 2, 3, 4) suponer que la variable respuesta se 
distribuye normalmente con cierta media poblacional y única varianza poblacional es equivalente a 
 
 H0: S1 se distribuye N(1 , 12) 
 H1: S1 no se distribuye N(2 ,12) 
 No rechazo H0 si el p-valor > 0,10 
 Rechazo H0 si el p-valor ≤ 0,10 
Como el p-valor es 0,5174  0,10 no se rechaza H0 
 
 H0: S2 se distribuye N(2 , 22) 
 H1: S2 no se distribuye N(2 ,22) 
 No rechazo H0 siel p-valor > 0,10 
 Rechazo H0 si el p-valor ≤ 0,10 
 Como el p-valor es 0,9167  0,10 no se rechaza H0 
 
 
 
H0: S3 se distribuye N(3 , 32) 
 H1: S3 no se distribuye N(3 ,32) 
 No rechazo H0 si el p-valor > 0,10 
 Rechazo H0 si el p-valor ≤ 0,10 
 Como el p-valor es 0,4806  0,10 no se rechaza H0 
 
 H0: S4 se distribuye N(4 , 42) 
 H1: S4 no se distribuye N(4 ,42) 
 No rechazo H0 si el p-valor > 0,10 
 Rechazo H0 si el p-valor ≤ 0,10 
 Como el p-valor es 0,3451  0,10 no se rechaza H0 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 46 
suponer normalidad para los errores con media poblacional cero y la misma varianza poblacional. (ij  N 
(0, 2) 
Dado que los errores son no observables el supuesto se verifica utilizando sus equivalentes a nivel 
muestral llamados residuos. ij ij ie = Y Y 
 
 Hipótesis estadísticas: 
H0: ij se distribuye N(0, 2) 
H1:  ij no se distribuye N(0,2) 
 
 No rechazo H0 si el p-valor>0,10 
 Rechazo H0 si el p-valor≤0,10 
 
Como el p-valor es de 0,43860,10 no se rechaza H0 
 
Con un nivel de significación del 10% no existen evi-
dencia suficiente para rechazar H0, es decir que los 
errores provenientes del modelo propuesto (DCA 
Modelo fijo: variable respuesta: Eficiencia de conver-
sión de un bovino; factor: suplemento dietario; niveles: 
Suplemento 1 (S1): grano partido y fuente A, Su-
plemento 2 (S2): grano partido y fuente B, Suple-
mento 3 (S3): grano entero y fuente A, Suplemento 
4 (S4): grano entero y fuente B) se distribuyen nor-
malmente en estas poblaciones de bovinos Hereford 
de iguales edad y sexo en estudio. 
 
 
En el gráfico no se observan puntos (residuos) 
con gran alejamiento de los valores normales 
teóricos, por lo que se puede suponer que la 
distribución que siguen los errores es normal. 
iii) Para analizar homogeneidad de varianzas, primero observemos el siguiente gráfico: 
 
 
 
En el diagrama de dispersión ( residuos vs valores 
predichos) no se observan diferencias notorias 
entre las varianzas de la Eficiencia de conversión 
en bovinos de raza Hereford de iguales edad y 
sexo para cada suplemento “de engorde” en 
bovinos para carne. 
 
Para verificar la condición mediante un test estadístico se puede aplicar la prueba de Levene 
H0 : 
2 2 2 2 2
1 2 3 4        
H1 : algún 
2 2
i  i=1, 2, 3, 4 
Se calcula para cada observación (repetición j-ésima del i-ésimo tratamiento) la diferencia en valor 
absoluto entre su puntuación (Yij) y la mediana del grupo o nivel del factor al que pertenece (Mnai) 
obteniendo así una nueva variable, denominada Absdif (valor absoluto de la diferencia). 
 
 
 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 47 
 ij ij idif y Mna  i=1, 2, 3, 4 j=1, 2, …, 10 
Con ésta variable (dif) se realiza un ANOVA. 
 
Análisis de la varianza – Test de Levene 
 Variable N R² R² Aj CV 
Abs_dif 40 0,07 0,00 75,24 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 0,25 3 0,08 0,86 0,4716 
Tratam 0,25 3 0,08 0,86 0,4716 
Error 3,51 36 0,10 
Total 3,76 39 
 
 
VP: F= CMtrat / CMerror ~ F(gl trat; gl error) 
 
 Rechazo H0 si F≥2,87 
 No rechazo H0 si F<2,87 
 
Como el F es 0,86 no se rechaza la hipótesis nula 
Con un nivel de significación del 5%, no tengo evidencias suficientes para rechazar Ho 
( 2 2 2 2 21 2 3 4        ) por lo tanto se puede considerar que las varianzas poblacionales de la 
Eficiencia de conversión de bovinos que consumieron el Suplemento 1 (S1): grano partido y fuente A, el 
Suplemento 2 (S2): grano partido y fuente B, el Suplemento 3 (S3): grano entero y fuente A, y el 
Suplemento 4 (S4): grano entero y fuente B; son iguales en estas poblaciones de bovinos Hereford de 
iguales edad y sexo en estudio. 
 
f) Verificadas las condiciones en los puntos anteriores, seleccionamos el DCA paramétrico por lo que 
miramos la tabla ANOVA (o ADEVA) realizada sobre la variable respuesta del diseño. 
 
Análisis de la varianza 
Variable N R² R² Aj CV 
EfCon 40 0,65 0,62 10,32 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 19,87 3 6,62 22,18 <0,0001 
Tratam 19,87 3 6,62 22,18 <0,0001  Significativo 
Error 10,76 36 0,30 
Total 30,63 39 
 
Las hipótesis estadísticas son: 
H0: i =  para i=1, 2, 3, 4 
 H1: algún i ≠  
 
Variable Pivotal : F= CMtrat / CMerror ~ F(gl trat; gl error) ~ F(3; 36) 
 
Valor Critico: F(3 ; 36) ; 0,95 
 
Como este valor no se encuentra en tabla, se usa el n anterior 
F(3 ; 35) ; 0,95 = 2,87 
 
Región Critica 
Rechazo H0 si Fobs ≥ 2,87 
No rechazo H0 si Fobs < 2,87 
 
Como F=22,18 >2,87 rechazamos H0. 
Si observamos el pvalor se tiene que p-valor<0,0001<0,05 se llega a la misma decisión. 
 
Se concluye: 
Con un nivel de significación del 5% existe evidencia suficiente para rechazar H0 (i =  
para i=1, 2, 3, 4), por lo tanto al menos un valor medio poblacional de Eficiencia de conversión en 
bovinos alimentados con Suplemento 1 (grano partido y fuente A), Suplemento 2 (grano partido y fuente 
B), Suplemento 3 (grano entero y fuente A), o Suplemento 4 (grano entero y fuente B) difiere de los 
restantes en estas poblaciones de bovinos Hereford de similares edades y sexos en estudio. 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 48 
 
Nota: Cuando se rechaza la hipótesis nula, es decir todos los valores medios no son iguales, es interesante comparar 
los valores medios poblacionales para ver cuál o cuales son diferentes. Existen diferentes métodos de comparacio-
nes múltiples pero esta parte del estudio escapa de los alcances de esta materia. 
 
g) Planteemos las hipótesis estadísticas 
H0: 1 = 4 
 H1:1 ≠ 4 
 
Luego de testeadas las condiciones de DCA, se supone que las variables en estudio se distribuyen 
normalmente y poseen varianzas poblaciones desconocidas pero iguales. Por lo tanto se utiliza la variable 
pivotal: 
   
 
1 4 1 4
18
1 4
~
1 1
a
x x
t t
s
n n
   


 
 
Así la región crítica será: t ≤ -1,73 U t ≥ 1.73 
Realizando el reemplazo con los datos hallados en las tablas presentadas, resulta tH0= -7,59, por lo que se 
decide rechazar H0. 
 
 
EJERCICIO 2) El esculeno es un hidrocarburo insaturado que se encuentra en aceites vegetales. En 
una experiencia se desea comparar cuantitativamente el contenido de esta sustancia entre 4 aceites ve-
getales: maní, maíz, soja y girasol. Para ello se tomaron aleatoriamente 8 alicuotas por cada tipo de acei-
te determinándose el contenido de esculeno en mg/100 g de aceite. (nota: en caso de ser necesario, 
asumir distribuciones simétricas) 
 
a) ¿Cuál es el objetivo del experimento? 
b) ¿Cuál fue la unidad experimental? ¿Qué se registra? 
c) Interpretar la observación resaltada en la tabla 1. 
d) Calcular e25 y e36 e interpretar. 
e) Verificar las condiciones para cumplir con el objetivo de los investigadores. 
f) Teniendo en cuenta lo decidido en el punto anterior y que el nivel de significación es del 5%, realizar 
la prueba en forma completa. 
 
Tabla 1: 
 Contenido de esculeno (mg/100 g de aceite) 
Aceite 
Maní 21 22 38 13 23 25 14 16 
Maíz 33 18 14 21 27 17 15 23 
Soja 8 12 21 9 16 7 6 11 
Girasol 5 12 10 13 9 10 15 6 
 
Tabla 2: 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(unacola) 
RE_Esculeno 32 -0,02 0,95 0,90 0,0180 
 
Tabla 3: 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj 
abs dif 32 0,09 0,00 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 43,38 3 14,46 0,95 0,4292 
Aceite 43,383 14,46 0,95 0,4292 
Error 425,50 28 15,20 
Total 468,88 31 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 49 
Tabla 4: 
Prueba de Kruskal Wallis 
Variable Aceite N Medias D.E. Medianas H p 
Esculeno Girasol 8 10,00 3,38 10,00 17,79 0,0005 
Esculeno Maíz 8 21,00 6,48 19,50 
Esculeno Maní 8 21,50 7,98 21,50 
Esculeno Soja 8 11,25 5,06 10,00 
 
SOLUCIÓN 
 
a) Objetivo: comparar el contenido medio de esculeno en aceites vegetales provenientes de maíz, maní, 
girasol y soja. 
 
b) La unidad experimental es una alicuota de aceite, a la que se le observa la concentración de esculeno, 
medida en mg/100 g de aceite. 
 
c) Y25=27 puede interpretarse como la concentración de esculeno, medida en mg/100 g de aceite de la 
quinta muestra de aceite de maíz. 
 
d) Sabiendo que e25= Y25 - . 
Nota: el valor de puede obtenerse de la salida de estadística descriptiva o calcularse como 
2
2
2
 iYY
n
 
Reemplazando : 
e25= 27 – 21 = 6 mg/100 g de aceite. La quinta muestra de aceite de maíz tiene una concentración de 
esculeno de 6 mg/100 g por encima del promedio de su grupo. 
E36= 7 – 21.5 =-14.5 mg/100 g de aceite. La sexta muestra de aceite de maní tiene una concentración de 
esculeno de 14.5 mg/100 g por debajo del promedio de su grupo. 
 
 
e) Comenzaremos a analizar las tres condiciones para un DCA paramétrico: 
 
i) Los errores (ij) son independientes dado que en cada población, las muestras de aceite fueron 
seleccionadas al azar y el contenido de esculeno de una alicuota es independiente del contenido de 
esculeno de otra. 
 
ii) Normalidad de los errores provenientes del modelo 
 
Hipótesis estadísticas: 
 
H0: ij ~N(0, 2) 
H1: ij no tiene distribución N(0, 2) 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p(unacola) 
RE_Esculeno 32 -0,02 0,95 0,90 0,0180 
 
No rechazo H0 si el p-valor>0,10 
Rechazo H0 si el p-valor≤0,10 
Como p-valor =0,0180≤0,10 entonces rechazo H0 
 
Con un nivel de significación del 10% existen 
evidencias suficientes para rechazar H0, es decir 
que los errores provenientes del modelo propuesto 
(DCA Modelo fijo: variable respuesta: 
concentración de esculeno, medida en mg/100 g 
de aceite; fator: tipo de aceite; niveles: maíz, maní, 
girasol y soja) no se distribuyen normalmente en 
 
Se observan varios residuos que son de gran 
magnitud y se alejan de los valores normales 
teóricos lo que pone en duda el supuesto de 
normalidad de los errores 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 50 
estas poblaciones de aceites en estudio. 
 
Al no cumplirse una de las condiciones entonces no es válido utilizar un DCA Modelo 1 o fijo paramétrico. 
Hay que verificar que se cumplan las condiciones para realizar una prueba no paramétrica de Kruskal 
Wallis: 
- Las observaciones de concentración de esculeno en cada alicuota son independientes, debido a que los 
cuatro tipos de aceites lo son y la muestra fue tomada aleatoriamente para cada uno de ellos 
- La variable concentración de esculeno en aceite es cuantitativa continua, por lo que es de una escala 
superior a la ordinal. 
- La variable concentración de esculeno en aceite, medida en mg/100 g de aceite; posee distribuciones 
similares para el factor tipo de aceite con niveles: maíz, maní, girasol y soja. Esta condición no la proba-
remos pero podríamos darnos una idea intuitiva a través de graficos de box plot. 
 
f) Realicemos la prueba correspondiente que sería la del DCA de libre distribución (no paramétrico): 
Kruskal Wallis: 
 
 
Hipótesis estadísticas 
H0 : θ1= θ2= θ3= θ4= θ 
 H1 : algún θi≠ θ i=1, 2, 3, 4 
 
Es decir que se quiere probar si la variable concentración de esculeno en aceite tiene la misma posición 
central para los cuatro vegetales: maíz, maní, girasol y soja. 
 
El estadístico de contraste es H que distribuye aproximadamente como una Chi cuadrado con I-1 grados 
de libertad siendo I la cantidad de tratamientos. 
2
2.
11
12
3( 1)
( 1)
I i
Ii
i
R
H N X
N N n 
   
  
Region critica: 
ᵡ2 ≥ᵡ23;0.95 =7.815 
 
Por lo tanto: 
Rechazo H0 si H ≥7,815 
No rechazo H0 si H <7,815 
 
A modo de ejemplo, se desarrolla el calculo del estadístico bajo H0: 
 
Rij Ri. Ri2 Ri2/8 
Maní 24 26 32 13,5 27,5 29 15,5 19,5 187,0 34969,00 4371,12500 
Maíz 31 22 15,5 30 24 21 17,5 27,5 188,5 35532,25 4441,53125 
Soja 5 11,5 24 6,5 19,5 4 2,5 10 83,0 6889,00 861,12500 
Girasol 1 11,5 8,5 13,5 6,5 8,5 17,5 2,5 69,5 4830,25 603,78125 
 total= 10277,56250 
 
2
.
1
12 12
3( 1) *10277,5625 3*33
( 1) 32*33
116,7905 99 17,7905
I i
i
i
R
H N
N N n
     

  

 
Se tomará la decisión correspondiente a partir de la salida de Info Stat: 
 
 
Nota: el valor de HH0 puede observarse en la salida de Kruskal Wallis. 
Tambien se observa el p-valor en esta tabla. Podria tomarse una decisión con elmismo, de la forma en la que se vio 
en la unidad anterior. 
 
Donde N= 32; 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 51 
 
Prueba de Kruskal Wallis 
Variable Aceite N Medias D.E. Medianas H p 
Esculeno Girasol 8 10,00 3,38 10,00 17,79 0,0005 
Esculeno Maíz 8 21,00 6,48 19,50 
Esculeno Maní 8 21,50 7,98 21,50 
Esculeno Soja 8 11,25 5,06 10,00 
 
Dado que H = 17,79 > 7,815 se rechaza la hipótesis nula 
 
Conclusión: Trabajando con un nivel de significación del 5%, hay evidencias suficientes para rechazar H0 
(θ1= θ2= θ3= θ4= θ) por lo que se puede suponer que al menos alguna de las medianas poblacionales de la 
concentración de esculeno en aceites vegetales difiere de las restantes en las poblaciones de aceites 
vegetales de maíz, maní, girasol y soja. 
PROBLEMAS PROPUESTOS 
 
EJERCICIO 1) Para comparar cinco dietas para porcinos se seleccionaron veinticinco cerdos al azar 
para ser usados en el experimento. Aleatoriamente se les asignó una dieta a cada grupo de 5 cerdos 
cada uno, midiéndose sobre cada animal el peso inicial y el peso al cabo de 30 días. 
Responder: 
a) La unidad experimental es ........................................................................................................... 
b) Los tratamientos son................................................................................................................... 
c) La observación es....................................................................................................................... 
d) El objetivo del trabajo es............................................................................................................ 
 
EJERCICIO 2) Se realizó un ensayo para estudiar el efecto de 5 raciones sobre la ganancia de peso de 
novillos. Para ello se emplearon 5 lotes de 6 animales cada uno seleccionados aleatoriamente, de la misma 
raza y edad. Los datos sobre las ganancias de peso por animal expresada en kg, para el período total del 
ensayo se expresan en la siguiente tabla: 
Tabla 1: 
Estadística descriptiva 
Trat Variable n Media D.E. Mín Máx Mediana 
1 Ganancia 6 43,50 3,56 39 49 43,00 
2 Ganancia 6 52,00 2,76 48 55 52,50 
3 Ganancia 6 58,17 2,64 55 62 58,00 
4 Ganancia 6 63,83 2,71 61 68 63,00 
5 Ganancia 6 86,50 3,67 82 91 87,00 
 Total 30 60,80 15,04 39 91 58,00 
 
Tabla 2 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
REGanancia 30 0.00 2,88 0.92 0.1103 
 
Tabla 3 
Análisis de la varianza – Test de Levene 
Variable N R² 
abs dif 30 0,06 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 4,03 4 1,01 0,41 0,8031 
Tratamientos 4,03 4 1,01 0,41 0,8031 
Error 62,21 252,49 
Total 66,24 29 
 
Tabla 4 
Análisis de la varianza 
Variable N R² R² Aj CV 
Ganancia 30 0,96 0,96 5,10 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F 
 
 
 
 
 
 
 
 
 
 
 
 
 
Tratamientos 
1 2 3 4 5 
43 54 62 61 85 
49 54 55 66 83 
39 50 59 62 89 
41 48 57 64 91 
43 51 60 68 89 
46 55 56 62 82 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 52 
Modelo 6320,13 4 1580,03 164,13 
Tratamientos 6320,13 4 1580,03 164,13 
Error 240,67 25 9,63 
Total 6560,80 29 
 
Tabla 5 
Prueba de Kruskal Wallis 
Variable Tratamientos N Medianas H p 
Ganancia 1 6 43,00 27,35 <0,0001 
Ganancia 2 6 52,50 
Ganancia 3 6 58,00 
Ganancia 4 6 63,00 
Ganancia 5 6 87,00 
 
 
 
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems: 
a) ¿Qué tipo de diseño se ha realizado? ¿Qué características tiene? 
b) Expresar el modelo teórico correspondiente a un DCA Paramétrico e interpretar los parámetros del 
diseño. 
c) Interpretar la observación resaltada en la tabla 1. 
d) Calcular e25 e interpretarlo. 
e) Verificar en forma completa si se cumplen las condiciones para un DCA modelo fijo paramétrico. En 
caso de realizar un test SOLO exprese las hipótesis estadísticas y decisión justificada. 
f) Teniendo en cuenta lo decidido en el punto anterior y que el nivel de significación es del 5%, realizar la 
prueba correspondiente. 
g) Los investigadores creen que las ganancias de peso de los novillos que recibieron la primera ración, 
en promedio, son significativamente menores a las ganancias de peso de los novillos que recibieron la 
cuarta ración. Pruebe estadísticamente al 10% la hipótesis de los investigadores. 
 
EJERCICIO 3) Un fisiólogo estudió la función pituitaria de las gallinas ponedoras asociada a cada etapa del 
régimen estándar para muda forzada de plumas que usan los productores de huevos con el fin de mantener 
a las aves en producción. Las etapas de la dieta son cinco: (A) premuda, previa al inicio del régimen; (B) 
ayuno de 8 días; (C) 60 gr de salvado durante 10 días; (D) 80 gr de salvado durante 10 días; y (E) mezcla de 
malta durante 42 días. En el estudio se utilizaron 25 gallinas elegidas aleatoriamente. Todas fueron puestas 
bajo la misma dieta en jaulas. Después de cada etapa, se seleccionaron aleatoriamente grupos de cinco y se 
las sacrificó. Interesa saber si las distintas etapas afectaban la concentración de T3 en suero. Se obtuvo co-
mo resultado el siguiente conjunto de observaciones: 
 
Etapas de Dieta Concentración de T3 (ng/dl) en suero 
Premuda (A) 94.09 90.45 99.38 91 98.00 
Ayuno (B) 117.9 115 115.23 129.06 117.61 
60 g de Salvado (C) 197.18 207.31 194 192.50 202.25 
80 g de Salvado (D) 112.47 117.51 119.92 112.01 110 
Mezcla de malta (E) 83.14 89.59 87.76 82.94 79.21 
 
Estadística descriptiva 
Etapas Variable n Media D.E. Mín Máx Mediana Q1 Q3 
a T3 5 94,58 4,03 90,45 99,38 94,09 91,00 98,00 
b T3 5 118,96 5,80 115,00 129,06 117,61 115,23 117,90 
c T3 5 198,65 6,11 192,50 207,31 197,18 194,00 202,25 
d T3 5 114,38 4,15 110,00 119,92 112,47 112,01 117,51 
e T3 5 84,53 4,15 79,21 89,59 83,14 82,94 87,76 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 53 
 
Tabla 1 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
RE_T3 25 -4,5E-03 1,03 0,90 0,0469 
 
Tabla 2 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
abs dif 25 0,04 0,00 97,95 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 8,66 4 2,17 0,19 0,9412 
Etapas 8,66 4 2,17 0,19 0,9412 
Error 228,87 20 11,44 
Total 237,53 24 
 
Tabla 3 
Análisis de la varianza 
Variable N R² R² Aj CV 
T3 25 0,99 0,99 4,04 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F,V, SC gl CM F p-valor 
Modelo 40488,68 4 10122,17 415,95 <0,0001 
Etapas 40488,68 4 10122,17 415,95 <0,0001 
Error 486,70 20 24,33 
Total 40975,38 24 
 
 
 
Tabla 4 
Prueba de Kruskal Wallis 
Variable Etapas N Medias D,E, Medianas H 
T3 a 5 94,58 4,03 94,09 22,24 
T3 b 5 118,96 5,80 117,61 
T3 c 5 198,65 6,11 197,18 
T3 d 5 114,38 4,15 112,47 
T3 e 5 84,53 4,15 83,14 
 
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems: 
a) Definir la variable respuesta en estudio 
b) Expresar el modelo teórico para un DCA Modelo fijo paramétrico e interpretar todas las variables que 
lo componen. 
c) Interpretar la observación destacada en la tabla y calcular su correspondiente residuo. 
d) Enunciar y verificar las condiciones para un DCA Modelo fijo paramétrico. 
e) Teniendo en cuenta lo decidido en el punto anterior y que el nivel es del 5%, realice la prueba 
correspondiente. 
f) Si lo investigadores quieren comparar la homogeneidad de varianzas entre las etapas premuda y ayuno 
al 1%, plantear las hipótesis estadísticas correspondientes, la variable pivotal y la región crítica. 
 
EJERCICIO 4) (Un experimento ilegal). Es un hecho muy conocido que casi todos los caballos que co-
rren carreras “cuadreras” o extraoficiales, reciben tratamientos medicamentosos que en las carreras ofi-
ciales no están permitidos. Todos los cuidadores afirman que de otro modo no es posible competir, pero 
la efectividad de esos tratamientos suele ser objeto de polémicas. A tal efecto se diseñó un experimento 
para comparar a tres de tales tratamientos, con 5 caballos elegidos al azar cada uno y un grupo testigo, 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 54 
sin medicar. Se utilizaron, en consecuencia, 20 caballos seleccionados al azar de características lo más 
similares posibles (en velocidad, edad, sanidad). Se registraron en cada caso los tiempos (en segundos) 
empleados en una corrida a fondo sobre la distancia clásica cuadrera de 300 metros en pista normal, con 
los siguientes resultados: 
Trat 1 Trat 2 Trat 3 Trat 4 (control) 
17,96 17,80 18,30 18,60 
17,62 17,90 18,50 18,80 
17,90 17,68 18,40 18,60 
17,70 17,72 18,22 18,90 
17,70 18,00 18,30 18,80 
 
 
Tabla 1 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
RE_Tiempo 20 0.01 1.06 0.87 0.0201 
 
Tabla 2 
Análisis de la varianza 
Variable N R² R² Aj CV 
abs dif 20 0,02 0,00 98,82 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 2,9E-03 3 9,6E-04 0,11 0,9550 
Trat 2,9E-03 3 9,6E-04 0,11 0,9550 
Error 0,14 16 0,01 
Total 0,15 19 
 
 
 
 
 
Tabla 3 
Análisis de la varianza 
Variable N R² R² Aj CV 
Tiempo 20 0,92 0,91 0,72 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F,V, SC gl CM F p-valor 
Modelo 3,16 3 1,05 61,90 <0,0001 
Tratamiento 3,16 3 1,05 61,90 <0,0001 
Error 0,27 16 0,02 
Total 3,44 19 
 
Tabla 4 
Prueba de Kruskal Wallis 
Variable Tratamiento N Medianas H p 
Tiempo 1 5 17,70 16,17 0,0010 
Tiempo 2 5 17,80 
Tiempo 3 5 18,30 
Tiempo 4 5 18,80 
 
 
A partir de los gráficos y las salidas correspondien-
tes, respondalos siguientes ítems: 
a) Expresar el modelo teórico correspondiente a un 
DCA paramétrico Modelo fijo e interpretar todos sus 
parámetros. 
b) Calcular el residuo de la observación destacada 
en la tabla e interpretarlo en el contexto del proble-
ma. 
c) Enunciar y verificar las condiciones necesarias 
para comparar la efectividad de los tratamientos. En 
caso de realizar un test de hipótesis NO CONCLUIR. 
d) Teniendo en cuenta lo decidido en el punto 
anterior y que el nivel es del 10%, realice la prueba 
correspondiente en forma completa. 
 
 
EJERCICIO 5) Interesa determinar si existen diferencias significativas entre las concentraciones medias de 
glucosa registradas luego de aplicar diferentes drogas a conejos de raza Angora. Para ello se empleó un 
conjunto de 18 conejos seleccionados al azar y se lo dividió aleatoriamente en tres grupos. Cada grupo reci-
bió una droga diferente. Al cabo de cierto tiempo se midió la concentración de glucosa en plasma, en mg/100 
ml, y se obtuvieron los siguientes datos: 
 
 Droga A: 94 97 84 92 95 107 
Droga B: 82 73 77 81 84 73 
 Droga C: 91 106 102 104 107 92 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 55 
Estadística descriptiva 
Droga Variable n Media D.E. 
A Concentración 6 94.83 7.47 
B Concentración 6 78.33 4.72 
C Concentración 6 100.33 7.06 
 
Tabla 1 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
RE_Concentración 18 0,00 1,03 0,96 0,7830 
 
Tabla 2 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
abs dif 18 0,02 0,00 91,27 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 5,44 2 2,72 0,15 0,8649 
Droga 5,44 2 2,72 0,15 0,8649 
Error 278,67 15 18,58 
Total 284,11 17 
Tabla 3 
Análisis de la varianza 
Variable N R² R² Aj CV 
Concentración 18 0,71 0,67 7,16 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F,V, SC gl CM F 
Modelo 1573,00 ….. ……. ….. 
Droga 1573,00 ….. ……. ….. 
Error …….. ….. ……. 
Total 2212,50 ….. 
 
Tabla 4 
Prueba de Kruskal Wallis 
Variable Droga N Medianas H p 
Concentración A 6 94,50 11,38 0,0033 
Concentración B 6 79,00 
Concentración C 6 103,00 
 
 
A partir de los gráficos y las salidas correspondien-
tes, responda los siguientes ítems: 
a) ¿Qué tipo de diseño se ha realizado? Justificar. 
b) Expresar el modelo teórico correspondiente. 
c) Especificar el factor en estudio y sus niveles. 
d) Interpretar la observación resaltada. 
e) Calcular e32 e interpretarlo en términos del pro-
blema. 
f) Verificar en forma completa si se cumplen las 
condiciones para un DCA modelo fijo paramétrico 
g) Teniendo en cuenta lo decidido en el punto ante-
rior y que el nivel de significación es del 5%, realice 
la prueba correspondiente. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 56 
CUESTIONARIO 
 
1.- ¿Cuáles son las condiciones necesarias para un D.C.A. paramétrico? ¿Cómo puede verificarlas y/o 
garantizarlas? 
 
2.- ¿Cuáles son las condiciones necesarias para un D.C.A. de libre distribución (no paramétrico)? ¿Cómo 
puede verificarlas y/o garantizarlas? 
 
3.- En los problemas propuestos 2) y 3) indique: 
Para el problema propuesto 2: 
a) Factor en estudio: .......................................................................................................................... 
b) Tratamientos: ................................................................................................................................ 
c) Unidad experimental: ..................................................................................................................... 
d) Observación: ................................................................................................................................. 
Para el problema propuesto 3: 
a) Factor en estudio: .......................................................................................................................... 
b) Tratamientos: ................................................................................................................................ 
c) Unidad experimental: ..................................................................................................................... 
d) Observación: ................................................................................................................................. 
 
4.- En un DCA paramétrico, ¿por qué la región crítica es unilateral derecha? 
 
5.- Indique el modelo teórico que se utilizan para el DCA paramétrico. Señale los parámetros del modelo 
y sus estimadores. 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
57 
PROBLEMAS COMPLEMENTARIOS 
 
 
01.- Para medir la dureza del agua en una ciudad hay dos analistas disponibles, los denominaremos X e 
Y. Para comparar si los resultados de las durezas a los que arriban X e Y son similares, se toman 
aleatoriamente muestras de agua de 10 regiones distintas de la Ciudad de Buenos Aires, haciendo que 
cada muestra sea estudiada por ambos analistas. 
a) ¿Se tratan de muestras independientes o apareadas? Justifique su respuesta. 
b) Defina a la/s variable/s aleatoria/s en estudio. 
c) Verifique las condiciones necesarias para analizar la media de las diferencias entre estos dos analistas. 
d) Estime mediante un intervalo de confianza del 95% la media de las diferencias entre estos dos 
analistas. 
e) Utilice la información que otorga el intervalo del inciso anterior para concluir el test correspondiente al 
objetivo de los investigadores. 
 
ix 0,46 0,62 0,37 0,40 0,44 0,58 0,48 0,53 0,59 0,68 
iy 0,72 0,61 0,73 0,51 0,33 0,48 0,43 0,35 0,67 0,78 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
X 10 0,52 0,10 0,94 0,7249 
Y 10 0,56 0,16 0,89 0,2978 
D(X-Y) 10 -0,05 0,17 0,94 0,6373 
 
02.- En un estudio comparativo sobre llamadas de apareamiento realizado en el sapo arbóreo (Hyla 
ewingi), se estimó en Tasmania, en una muestra aleatoria de 29 observaciones, que la duración de las 
llamadas tenía una media de 189 ms (milisegundos) y un desvío estándar de 42 ms; y en Bristbane, en 
una muestra de 31 observaciones, una media de 216 ms y un desvío estándar de 28 ms. 
 
Variable n Media D.E. W* p (una cola) 
DuracionT 29 189 42 0,91 0,7541 
DuracionB 31 216 28 0,82 0,3960 
 
a) ¿Se tratan de muestras independientes o apareadas? Justifique su respuesta. 
b) Defina a la/s población/es en estudio. 
c) Estime con un intervalo de confianza del 90% el cociente de varianzas para las variables en estudio. 
d) Utilizando la información otorgada por el intervalo del inciso anterior y la tabla precedente… 
d1) ...verificar las condiciones necesarias para realizar una prueba con la hipótesis de trabajo: “el 
tiempo medio de llamada del sapo arbóreo es mayor en Britsbane que en Tasmania”. En caso de 
necesitar una prueba de hipótesis, NO CONCLUYA. 
 d2) …realizar la prueba de hipótesis mencionada en el inciso d1. 
 
03.- Para realizar un experimento sobre engorde intensivo de novillos una estación experimental somete a 
24 novillos cruza de la misma edad al siguiente experimento: los individuos son asignados aleatoriamente 
a 3 grupos (1, 2 y 3) y antes de llevarlos a la pastura son inoculados con tres dosis de un novedoso anabó-
lico no esteroide. Luego de 45 días se pesan los animales obteniendo para cada uno de ellos el aumento 
promedio diario de peso (en kg). Los resultados son los siguientes: 
 
Grupo 1 Grupo 2 Grupo 3 
0,4 0,7 0,7 
0,5 0,7 0,8 
0,4 0,8 0,8 
0,2 0,6 0,9 
0,4 0,5 0,6 
0,6 0,7 0,8 
0,5 0,7 0,6 
0,5 0,70,7 
 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
58
 
 
Estadística descriptiva 
Dosis Variable n Media D.E. Mín Máx Mediana 
1 AumPeso 8 0,44 0,12 0,20 0,60 0,45 
2 AumPeso 8 0,68 0,09 0,50 0,80 0,70 
3 AumPeso 8 0,74 0,11 0,60 0,90 0,75 
 
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems: 
 
a) Explicite el modelo teórico de un DCA modelo 1 (fijo) paramétrico. 
b) ¿Cuál es el factor para el modelo empleado? Explicite sus niveles. 
c) Interprete en términos del problema Y24 y calcule e24 
d) Enuncie y verifique las condiciones necesarias para realizar un DCA paramétrico en términos del 
problema en estudio. 
e) Realice el test correspondiente en forma completa para probar la hipótesis de los investigadores al 
5%. 
f) Los investigadores creen que los aumentos medios de peso del grupo 1 son menores a los del gru-
po 3. Pruebe estadísticamente dicha hipótesis al 10%. NO CONCLUYA. 
 
Tabla 1 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
RDUO_AumPeso 24 0,00 0,10 0,93 0,2558 
 
Tabla 2 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
abs dif 24 0,07 0,00 90,85 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 0,01 2 3,8E-03 0,81 0,4593 
Dosis 0,01 2 3,8E-03 0,81 0,4593 
Error 0,10 21 4,6E-03 
Total 0,11 23 
 
Tabla 3 
Análisis de la varianza 
Variable N R² R² Aj CV 
AumPeso 24 0,63 0,60 17,06 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F 
Modelo ….. ... 0,20 ….. 
Dosis ….. ... 0,20 ….. 
Error ….. ... 0,01 
Total 0,63 … 
 
Tabla 4 
Prueba de Kruskal Wallis 
Variable Dosis N Medias D.E. Medianas H p 
AumPeso 1 8 0,44 0,12 0,45 14,16 0,0006 
AumPeso 2 8 0,68 0,09 0,70 
AumPeso 3 8 0,74 0,11 0,75 
 
 
 
 
 
 
 
04.- En un experimento, se estudiaron las propiedades hipnóticas de dos drogas A y B. Para ello se 
seleccionó al azar a un grupo de 10 sujetos, se midió la cantidad de horas ganadas en sueño en cada 
sujeto al utilizar las droga A y luego, dejando un tiempo prudencial, se efectuaron las respectivas 
mediciones al implementarse la droga B. Los investigadores suponen de la existencia de una aparente 
superioridad de la droga B en el promedio de horas. 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
59 
 
 
DROGA A 2,2 3,5 1,7 4,4 2,8 1,6 2,5 2,0 2,4 2,9 
DROGA B 5,3 1,2 5,9 2,3 6,7 5,0 6,1 1,3 4,9 6,0 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Droga A 10 2,60 0,85 0,92 0,5220 
Droga B 10 4,47 2,07 0,80 0,0190 
difAB 10 -1,87 2,54 0,75 0,0028 
 
Prueba de Wilcoxon (muestras apareadas) 
Obs(1) Obs(2) N Suma(R+) p(2 colas) 
Droga A Droga B 10 6,00 0,0540 
 
Prueba de Wilcoxon para muestras independientes 
Clasific Variable Grupo 1 Grupo 2 n(1) n(2) W p(2 colas) 
Droga Horas Droga A Droga B 10 10 81,00 0,0696 
 
a) ¿Se tratan de muestras independientes o apareadas? Justifique. 
Según su respuesta a la pregunta anterior, ¿Qué modificación debería realizarse en el diseño del 
experimento para que se presente el otro caso? 
b) Defina a la variable y parámetro en estudio 
c) Verifique las condiciones necesarias para seleccionar a la variable pivotal más indicada y exprésela con 
su distribución. En caso de realizar un test de hipótesis, SOLO se pide expresar las hipótesis estadísticas y 
decisión justificada. 
d) Probar la validez de la hipótesis de los investigadores (α=0,05). 
e) ¿Qué tipo de error se puso haber cometido al tomar la decisión? Expresarlo en términos del problema 
f) Suponiendo que el diseño de la investigación cambiara y se efectuaran las modificaciones propuestas 
por usted en el inciso a). Realizar los puntos b, c, d y e para el nuevo experimento. 
 
05.- Un epidemiólogo desea comparar la efectividad de dos vacunas antirrábicas. Con ese fin trabajó 
con 19 perros Beagles y los dividió aleatoriamente en 2 grupos. El grupo 1, de 10 perros, recibió una 
dosis de la vacuna tipo 1 y el grupo 2, de los 9 perros restantes, recibió una dosis de refuerzo de la 
vacuna tipo 2. Dos semanas después se registra el titulo de anticuerpos, en UI/ml, y se analiza la in-
formación arrojando los siguientes resultados: 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
vac1 10 4,38 2,81 0,97 0,8890 
vac2 9 3,22 2,25 0,90 0,3791 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
abs dif 10 2,00 2,36 0,94 0,6812 
 
Estadística descriptiva 
Variable n Media D.E. Mín Máx 
vac1 10 4,38 2,81 -0,68 8,40 
vac2 9 3,22 2,25 -0,15 6,10 
 
Prueba F para igualdad de varianzas 
Variable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p 
rta {vac1} {vac2} 10 9 7,88 5,06 1,56 0,5428 
 
Prueba T para muestras Independientes 
Variable Grupo(1) Grupo(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p 
rta {vac1} {vac2} 10 9 4,38 3,22 0,5428 0,99 0,3376 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
60
 
 
 
Prueba T (muestras apareadas) 
Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral 
vac1 vac2 9 1,19 3,23 1,10 0,3025 
 
a) Definir la unidad experimental y las variables en estudio. 
b) Especificar el parámetro en estudio y su correspondiente estimador e interpretarlos en contexto del 
problema. 
c) Enunciar y verificar las condiciones necesarias para seleccionar el estadístico más adecuado para 
realizar inferencias y/o estimaciones. 
d) Estimar el parámetro especificado en el inciso b con una confianza del 90%. 
e) ¿La estimación realizada resulta ser exacta o aproximada? Justifique. 
f) Utilizando la información que otorga el intervalo del inciso d, realice una conclusión para un test que 
ponga a prueba la hipótesis del investigador. 
 
06.- Un experimentador quiere probar si un nuevo probiótico reduce la mortandad en pollitos parrilleros. 
Para esto, de manera experimental, mantiene a 200 pollitos en jaulas individuales y les asigna 
aleatoriamente a la mitad el probiótico estándar y a la otra mitad el nuevo. A los 20 días, cuenta 85 
sobrevivientes con el probiótico estándar y 93 con el nuevo. 
a) Interpretar en términos del problema al parámetro en estudio. 
b) Calcular la estimación del parámetro expuesto en el inciso anterior. 
c) Enunciar las condiciones teóricas que deben cumplirse para realizar inferencias/estimaciones para este 
caso. 
d) Verifique la hipótesis de los investigadores (=0,05). 
e) ¿Qué tipo de error se puso haber cometido con la decisión tomada en el punto anterior? Interpretarlo en 
términos del problema y expresar su probabilidad. 
f) Estimar mediante un intervalo de confianza del 95% la diferencia de proporciones poblacionales de 
sobrevivientes de ambos grupos. 
 
07.- Se realizó un ensayo sobre el rendimiento (en kg/ha) de cultivares de papa utilizando cuarenta 
parcelas con plantas sanas y treinta y nueve con plantas enfermas por el mosaico deformante. Los datos 
obtenidos se resumen en la tabla. 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
SANAS 40 16042 25,21 0,32 0,0220 
ENFERMAS 39 12027 22,43 0,91 0,4303 
 
a) Definir la unidad experimental en estudio y la/s población/es. 
b) Verifique todas las condiciones necesarias para elegir la variable pivotal más conveniente para 
realizar una estimación. En caso de realizar un test de hipótesis, exprese SOLAMENTE las hipótesis 
estadísticas y decisión justificada y, en caso de necesitarlo, supongaque la distribución de la variable en 
estudio es simétrica y posee una única mediana. 
c) Exprese la variable pivotal y su distribución más indicada según lo trabajado en el inciso anterior. ¿Qué 
propiedad y/o teorema se utilizó? Enunciarlo. 
d) Estimar, con una confianza del 90%, la diferencia de los rendimientos medios poblacionales. 
 
08.- Se quiere comparar la eficiencia de dos test para detectar cierto tipo de enfermedad. Para ello se 
seleccionaron 200 pacientes con esa enfermedad, a 100 de ellos se les aplicó el test 1 y a los otros 100 el 
test 2. En el primer caso el test dio positivo en 65 pacientes y en el segundo en 83. 
a) Definir las variables en estudio. 
b) Enunciar todas las condiciones necesarias para elegir la variable pivotal más conveniente para 
realizar una estimación. 
c) Exprese la variable pivotal y su distribución más indicada según lo trabajado en el inciso anterior. ¿Qué 
propiedad y/o teorema se utilizó? Enunciarlo. 
d) Estimar, con una confianza del 95%, la diferencia de proporciones poblacionales de positivos. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
61 
 
09.- En un estudio comparativo sobre el sexo de los clientes de dos negocios en competencia se 
selecciona una muestra de cada local. Una muestra de 150 compradores tomada en forma aleatoria en el 
comercio de la empresa A tenía un 96% de mujeres y una muestra de 100 compradores tomada en el 
local de su mejor competidor resultó contener 88% de mujeres. 
a) Definir el estimador que utilizará para realizar inferencias sobre el parámetro en estudio. 
b) Analizar el cumplimiento de todas las condiciones necesarias para elegir la variable pivotal más 
conveniente para realizar estimaciones y exprese el correspondiente estadístico de contraste y su 
distribución. 
c) Exprese las hipótesis estadísticas sobre la comparación de proporciones de compradores femeninos. 
d) Indicar en forma analítica la región crítica y la regla de decisión al 10%. 
e) Decidir acerca de las hipótesis expresadas en el inciso c y concluir. 
 
10.- La composición del gas amoníaco en un laboratorio varía notablemente de un día para otro por lo que 
resulta de importancia medirla con precisión. Por ende, unos investigadores hicieron análisis para 
determinar el porcentaje de dicho gas durante 9 días consecutivos mediante dos métodos diferentes para 
determinar si existen diferencias significativas entre los resultados obtenidos por ellos. Con ese fin, se 
determina el porcentaje de amoníaco en un mismo día por ambos métodos obteniendo los siguientes 
datos para los 9 días en estudio: 
 
Método A 14 37 35 43 34 36 48 33 33 
Método B 18 37 38 36 47 38 57 28 42 
 
a) ¿Se tratan de muestras independientes o apareadas? Justifique su respuesta. 
b) Defina a la variable aleatoria y el parámetro en estudio. 
c) Verifique las condiciones necesarias para analizar la hipótesis de los investigadores. En caso de realizar 
un test de hipótesis, NO CONCLUYA. 
d) Determinar si hay diferencias entre los dos métodos al nivel del 5% 
e) ¿Cree usted que una estimación mediante un intervalo de confianza para el parámetro en estudio 
aportaría información a la investigación? Justifique su respuesta. 
 
Estadística descriptiva 
Variable n Media D.E. Var(n-1) Mediana 
Método A 9 34,78 9,27 85,94 35,00 
Método B 9 37,89 10,97 120,36 38,00 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Método A 9 34,78 9,27 0,88 0,2575 
Método B 9 37,89 10,97 0,97 0,9367 
Dif A-B 9 -3,11 6,58 0,95 0,7470 
 
11.- Se ha demostrado que un alto contenido de nitrato en la composición de los alimentos da origen a 
numerosos efectos nocivos, entre ellos, unos investigadores desean probar que una dosis de nitrato 
disminuye la ganancia de peso en ratas. Para ello diseñan un experimento en el que se tomaron 16 ratas 
al azar de una línea alimentadas con una dieta estándar. A 9 de ellas, elegidas al azar, se les dio de beber 
agua con 2000 ppm de nitrato (dieta A), a las restantes se las mantuvo con agua libre de nitratos (dieta B). 
Luego se midió la ganancia de peso y se expresó en porcentaje arrojando los siguientes resultados: 
 
A 12,7 19,3 20,5 10,5 14,0 10,8 16,6 14,0 17,2 
B 18,2 22,9 10,1 14,3 10,2 17,1 15,7 
 
a) ¿Se tratan de muestras independientes o apareadas? Justifique su respuesta. 
b) Comente brevemente acerca del cumplimiento de las condiciones para elegir la variable pivotal en las 
que se basa para realizar un test de hipótesis para este caso. 
c) ¿Qué puede concluir acerca de la hipótesis de los investigadores? Justifique su respuesta 
estadísticamente en forma completa (= 0,05). 
 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
62
 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Dieta A 9 15,07 3,56 0,92 0,4897 
Dieta B 7 15,50 4,53 0,93 0,6560 
 
Prueba F para igualdad de varianzas 
Variable Gr(1) Gr(2) n(1) n(2) Var(1) Var(2) F 
GANANCIA {A} {B} 9 7 12,66 20,56 0,62 
 
12.- Para realizar un ensayo sobre la actividad estrogénica se compararon varias soluciones que habían 
sido sometidas a una técnica de inactivación in vitro. Se inyectaron ratones hembra y como medida de la 
actividad estrogénica se utilizó el peso del útero. Los siguientes datos de los pesos de úteros, en mg, de 
diez ratones hembra para cada uno de los tratamientos control (solución 0) y dos soluciones diferentes 
son: 
 
Control 89,8 93,8 112,6 101,6 97,2 106,5 98,1 94,4 105,3 95,7 
Solución 1 64,4 79,8 69,4 76,3 67,1 71,5 78,2 68,6 70,4 71,9 
Solución 2 75,2 62,4 73,8 71,8 65,1 74,6 66,8 70,1 64,7 69,3 
 
Estadística descriptiva 
Soluciones Variable n Media D.E. Mín Máx Mediana 
0 Peso 10 99,50 6,94 89,80 112,60 97,65 
1 Peso 10 71,76 4,95 64,40 79,80 70,95 
2 Peso 10 69,38 4,50 62,40 75,20 69,70 
 Total 30 80,21 
 
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems: 
a) Explicite el modelo teórico de un DCA modelo 1 (fijo) paramétrico. 
b) ¿Cuántos y cuáles son los tratamientos del experimento empleado? 
c) Verificar las condiciones de un DCA paramétrico en forma completa 
d) Realice el test correspondiente al 5% en forma completa para probar la hipótesis de los investiga-
dores. 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
63 
 
13.- Una cooperativa agropecuaria dedicada a la producción de una oleaginosa desea estudiar la 
influencia de un nuevo fertilizante sobre el rendimiento de dicha planta. Como se desea estudiar el 
comportamiento del fertilizante bajo distintas condiciones climáticas, se eligieron 8 estaciones 
experimentales ubicadas estratégicamente en una región y en cada estación se tomó una parcela. En una 
mitad, elegida aleatoriamente, se adicionó fertilizante y la otra mitad de la parcela no recibió fertilizante. 
Se han obtenido los siguientes resultados expresados en kg de producción por ha: 
 
Estación número: 1 2 3 4 5 6 7 8 
Con fertilizante 810 540 930 690 710 720 840 740 
Control 610 405 805 560 570 620 730 620 
 
En función del costo del fertilizante, los productores no estarían dispuestos a invertir en fertilizante si el 
aumento debido al uso es de a lo sumo 140 kg/ha. 
a) Defina al parámetro en estudio y su estimador. 
b) Verifique las condiciones para seleccionar el estadístico más adecuado para realizar inferencias en 
este caso. 
c) ¿Con un nivel de significación del 10%, cree que los productores invertirán en fertilizante? Justifique su 
respuesta estadísticamente en forma completa. 
 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p (una cola) 
confertil 8 747,50 116,10 0,98 0,9469 
sinfertil 8 615,00 118,65 0,96 0,8351 
Dif (conf - sinf) 8 132,50 30,24 0,85 0,1412 
 
14.- Los datos expuestos indican el aumento de peso, en g, de 20 ratas elegidas al azar de las cuales la 
mitadrecibió proteína de maní crudo y la otra mitad de maní tostado. Tome en cuenta que se sospecha 
que el tostado aumenta el valor proteico del maní y que a mayor nivel proteico mayor aumento de peso. 
 
Crudo 61 61 56 63 56 63 59 56 44 61 
Tabla 1 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
RE_Peso 30 0.00 1.06 0.96 0.6534 
 
Tabla 2 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
abs dif 30 0,05 0,00 79,70 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F 
Modelo 16,45 2 8,23 0,71 
Trat 16,45 2 8,23 0,71 
Error 313,20 27 11,60 
Total 329,65 29 
 
Tabla 3 
Análisis de la varianza 
Variable N R² R² Aj CV 
Peso 30 0.87 0.86 6.94 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F 
Modelo …… 2 ……… ..….. 
Solucion ….. 2 2803.98 ……. 
Error 835,68 …. 30.95 
Total 6443,63 …. 
 
 
 
 
Tabla 4 
Prueba de Kruskal Wallis 
Variable Soluciones N Medianas H p 
Peso 0 10 97,65 19.79 0.0001 
Peso 1 10 70,95 
Peso 2 10 69,70 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
64
 
Tostado 55 54 47 59 51 61 57 54 62 58 
 
Shapiro-Wilks (modificado) 
 Dieta Variable n Media D.E. W* p (una cola) 
Crudo peso 10 58,00 5,64 0,80 0,0140 
Tostado peso 10 55,80 4,59 0,96 0,8156 
Crud-Tost peso 10 2,2 1,23 0,82 0,0149 
 
Prueba de Wilcoxon (muestras apareadas) 
Obs(1) Obs(2) N Suma(R+) p(2 colas) 
Crudo Tostado 10 45,00 0,5404 
 
Prueba de Wilcoxon para muestras independientes 
Clasific Variable Grupo 1 Grupo 2 n(1) n(2) W p(2 colas) 
Mani Aumento Crudo Tostado 10 10 123,00 0,1708 
 
a) Definir las variables en estudio. 
b) Comente brevemente acerca del cumplimiento de las condiciones para realizar inferencias para el 
problema en estudio. 
c) Suponiendo homogeneidad de varianzas y distribuciones similares entre las variables en estudio, 
probar si el tostado del maní ha tenido el efecto esperado por los investigadores sobre su valor proteico 
medio (=0,05). 
d) ¿Qué tipo de error se puso haber cometido al tomar la decisión en la prueba de hipótesis realizada en el 
inciso anterior? Interpretarlo en términos del problema 
e) El test realizado ¿es paramétrico o de libre distribución? Justificar la respuesta 
 
 
 
15.- En una investigación sobre anguilas se estudian características en sangre de anguilas marinas y de 
agua dulce. Entre los datos recabados, la desviación estándar de la concentración de sodio en la sangre 
de una muestra de 10 anguilas marinas, tomada al azar, fue de 40,5 mg%; mientras que para una muestra 
de 10 anguilas de agua dulce, también tomada al azar, resultó 32,1 mg%. Se sospecha que la 
concentración de sodio en las anguilas marinas es menos homogénea que en anguilas de agua dulce. 
 
a) Describir a las poblaciones en estudio. 
b) Interpretar al parámetro en estudio. 
c) ¿En qué condiciones se deben basar los investigadores para elegir la variable pivotal para realizar la 
prueba de hipótesis sugerida bajo su hipótesis? Enunciarlas en contexto del problema. 
d) Suponiendo el cumplimiento de las condiciones explicitadas en el inciso anterior, realice la prueba de 
hipótesis correspondiente (=0,01). 
e) ¿Cree usted que un intervalo de confianza para el parámetro en estudio aportaría nueva información? 
Justifique su respuesta. 
 
16.- Con el fin de probar si un tratamiento especial sobre tubos de ensayo modifica la resistencia al calor, 
se realizó un pequeño experimento. De un lote de tubos se tomaron dos muestras y solo a una de ellas se 
le aplicó el tratamiento. Luego fueron probados y registradas las resistencias al calor, obteniéndose: 
 
 X S² n p-valor de Shapiro Wilks 
TRATADOS 81,4 UC 37,3 UC2 15 0,30 
NO TRATADOS 91,8 UC 40,7 UC2 15 0,82 
 
a) Estimar el cociente de varianzas de las resistencias de calor de los tubos no tratados y tratados 
mediante un intervalo de confianza del 95%. 
b) Utilizando la información que otorga el intervalo realizado en el inciso anterior y los datos propiciados en 
el enunciado del problema, comente brevemente acerca del cumplimiento de las condiciones necesarias 
para seleccionar la variable pivotal más indicada para realizar inferencias sobre la diferencias de 
resistencia medias. 
c) Estimar la diferencia entre las medias poblacionales de las resistencias al calor de los tubos tratados y 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
65 
no tratados mediante un intervalo de confianza del 95%. 
d) Si se desea tomar una decisión de una prueba de hipótesis utilizando la información que otorga el 
intervalo realizado en el inciso c. 
 d1) ¿Qué condiciones se le deben exigir al test? 
 d2) Expresar las hipótesis estadísticas y la región crítica. 
 d3) Tomar la decisión y concluir. 
 
17.- En un experimento se cruzaron conejos gigantes polacos y conejos flamencos en dos criaderos 
obteniéndose 10 conejos de esa cruza en el criadero 1, y 61 en el criadero 2. Los siguientes datos 
corresponden a longitudes del fémur (en mm) de los conejos resultantes de la cruza. 
 
 n X S p-valor Shapiro-Wilks 
Criadero 1 10 83,30 1,65 0,1365 
Criadero 2 61 80,50 3,81 0,5198 
 
Con la sospecha de que las longitudes del fémur de los conejos del criadero 2 son significativamente 
menos homogéneos con respecto a los del criadero 1... 
a) Seleccionar al estimador correspondiente y calcular la estimación puntual. 
b) Enunciar las condiciones para elegir la variable pivotal para realizar la prueba de hipótesis. 
c) Verificar el cumplimiento de las condiciones expuestas en el inciso anterior ( = 0,05). 
d) Realizar el test que ponga a prueba la hipótesis de los investigadores. 
e) ¿Qué tipo de error se puso haber cometido? Interpretarlo en términos del problema y especificar su 
probabilidad. 
 
18.- En un estudio comparativo sobre métodos de sembrado, dos establecimientos dedicados al cultivo de 
maíz híbrido siembran en quince parcelas diferentes, midiendo con posterioridad los rendimientos (en 
Kg/parcela). Con el objetivo de estudiar la homogeneidad del rendimiento entre métodos… 
a) …interpretar en términos del problema al/los parámetro/s en estudio. 
b) …Verificar las condiciones necesarias para seleccionar la variable pivotal más indicada para realizar 
estimaciones en este caso y expresarla con su correspondiente distribución. En caso de necesitar realizar 
un test de hipótesis, SÓLO expresar las hipótesis estadísticas y decisión justificada. 
c) … Construir un intervalo del 99% de confianza para el cociente de las varianzas de los rendimientos de 
maíz híbrido entre los establecimientos. 
d) La estimación realizada en el inciso anterior ¿es exacta o asintótica? Justificar. 
 
ESTABLECIMIENTO 1: 114 - 86 - 93 - 75 - 102 - 89 - 83 - 89 - 92 - 96 – 100 - 98 - 87 - 80 - 86 
ESTABLECIMIENTO 2: 107 - 94 - 86 - 70 - 78 - 90 - 82 - 77 - 95 - 84 - 100 - 89 - 92 - 99 - 85 
 
Estadística descriptiva 
Variable n Media D.E. Mín Máx Suma Cuad. 
Estab 1 15 91,33 9,72 75,00 114,00 126450,00 
Estab 2 15 88,53 9,78 70,00 107,00 118910,00 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Estab 1 15 91,33 9,72 0,98 0,9449 
Estab 2 15 88,53 9,78 0,99 0,9940 
 
Prueba F para igualdad de varianzas 
Variable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba 
Rend Estab 1 Estab 2 15 15 94,52 95,55 0,99 0,9841 Bilateral 
 
Prueba T para muestras Independientes 
Variable Gr(1) Gr(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T p prueba 
Rend Estab1 Estab2 15 15 91,3388,53 0,9841 0,79 0,4381 Bilateral 
 
19.- Se desean comparar dos tratamientos A y B en cuanto a la variabilidad de las correspondientes 
respuestas en bovinos de raza Hereford. Para ello, se seleccionan aleatoriamente dos lotes de 11 y 10 
animales y fueron asignados al azar a cada uno de los tratamientos. La respuesta registrada fue el 
aumento de peso, en kg, durante el período experimental. 
 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
66
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Tratam 1 11 1,57 0,39 0,91 0,7372 
Tratam 2 10 1,89 0,35 0,89 0,6911 
 
a.1) ¿Cuál es el objetivo de la investigación? 
a.2) Especificar el estimador más indicado para el parámetro en estudio y la estimación puntual 
correspondiente. 
b) Enunciar las condiciones necesarias para seleccionar la variable pivotal más indicada para realizar 
inferencias/estimaciones en este caso y expresarla con su correspondiente distribución. 
c) Comentar brevemente acerca del cumplimiento de las condiciones explicitadas en el inciso anterior. 
d) Construir un intervalo del 95% para el cociente de varianzas de los rendimientos de los tratamientos. 
e) Utilizando la información que otorga el intervalo realizado en el inciso anterior concluya acerca de la 
comparación de variabilidades de los aumentos de peso con ambos tratamientos. 
f) ¿Qué tipo de error se puso haber cometido? Interpretarlo en términos del problema. 
 
20.- Dos floricultores comparan sus métodos de trabajo sobre determinadas plantas con flor. Con dicho fin, 
en un área de 30 m x 10 m tomada al azar del establecimiento del productor 1 sembrada con plantas de 
una determinada especie, se observaron 296 plantas con flor y 987 sin flor, mientras que, en otra área al 
azar del mismo tamaño sembrada con 1000 plantas de la misma especie en el establecimiento del 
productor 2, se observaron sólo 200 con flor. 
a) Defina a las variables en estudio. 
b) Verifique las condiciones para realizar estimaciones/inferencias con el estadístico de contraste más 
indicado para esta situación. 
c) ¿Puede suponerse a un nivel del 1% que la proporción de plantas florecidas es la misma en ambas 
áreas? 
d) ¿Aporta información adicional el realizar una estimación por intervalo de confianza? En caso de ser 
afirmativa la respuesta, realícela con el nivel correspondiente, en caso de ser negativa, justifique. 
 
21.- Con el fin de comparar la efectividad de tres fármacos se seleccionaron al azar doce peces con cierta 
infección viral de una población, y se los dividió aleatoriamente en tres grupos, a cada grupo se lo medicó 
con un fármaco diferente, se midió la carga viral al final del tratamiento para cada animal. Responder: 
a) La unidad experimental es ................................................................................................... 
b) Los tratamientos son ........................................................................................................... 
c) La observación es ................................................................................................................ 
d) El objetivo del trabajo es ..................................................................................................... 
 
22.- Se realiza un experimento para comparar la absorción media de garrapaticida por unidad de tejido 
muscular, registrándose la concentración sanguínea del principio activo. Para ello se seleccionan al azar 
dieciséis perros y se los subdivide en cuatro grupos aleatoriamente. A cada uno de los subgrupos se le 
asigna un producto diferente: A, B, C y D. Responder: 
a) La unidad experimental es .................................................................................................. 
b) Factor/es y nivel/es: .......................................................................................................... 
c) La observación es ............................................................................................................... 
d) El objetivo del trabajo es .................................................................................................... 
 
23.- Con el objeto de medir el efecto del ejercicio en enfermedades coronarias, un grupo de investiga-
dores decidió comparar el índice de enfermedad en dos grandes grupos de personas que trabajan en 
los colectivos de Buenos Aires: choferes e inspectores. Los inspectores realizan más ejercicio, ya que 
su actividad requiere que estén caminando gran parte del día, mientras que la tarea de los choferes es 
más sedentaria. Se consideraron aquellas personas que realizaron el mismo trabajo durante los últi-
mos 8 años y además la distribución de las edades en ambos grupos es similar. Se observó que el 
índice de enfermedades coronarias entre los conductores era sustancialmente mayor. 
a) Este experimento ¿es observacional o experimental? Justificar. 
b) ¿Por qué cree usted que los investigadores le dan importancia a la distribución de las edades? 
c) ¿Cree que puede haber efectos confundidos no mencionados en el experimento que expliquen el 
resultado obtenido? 
d) Identificar la unidad experimental. 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
67 
24.- Los registros de 3000 historias clínicas muestran que los fumadores están más propensos a de-
primirse que los no fumadores. 
a) ¿De qué tipo de estudio se trata? 
b) ¿Considera que están controlados todos los factores? 
 
25.- Se desea saber si cuatro tratamientos antiinflamatorios utilizados en patologías articulares difieren 
en cuanto a su efectividad. Se eligieron al azar 24 caballos con dicho signo clínico y se los repartió en 
4 grupos de igual tamaño y a cada uno se le asigna un tratamiento distinto. Al final de un período de-
terminado, cada grupo es revisado clínicamente para cuantificar la efectividad del tratamiento y se 
asigna un puntaje del 0 al 100 según la reducción del área inflamada. Los datos obtenidos son: 
 
Estadística descriptiva 
Trat Variable n Media D.E. Mín Máx Mediana 
1 Puntaje 6 73,50 5,89 64,00 80,00 73,50 
2 Puntaje 6 83,50 5,47 76,00 90,00 83,00 
3 Puntaje 6 68,67 7,89 58,00 76,00 71,50 
4 Puntaje 6 87,67 5,05 80,00 95,00 88,00 
 Total 24 78,09 
 
 
Tabla 1 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p (una cola) 
RE_Puntaje 24 0.02 1.05 0.88 0.0224 
 
 
Tabla 2 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
abs dif 24 0,08 0,00 74,08 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 22,83 3 7,61 0,61 0,6135 
Trat 22,83 3 7,61 0,61 0,6135 
Error 247,67 20 12,38 
Total 270,50 23 
 
Tabla 3 
Análisis de la varianza 
 Variable N R² R² Aj CV 
Puntaje 24 0.64 0.59 7.88 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 1383,67 3 461.22 12.11 0.0001 
Trat 1383,67 3 461.22 12.11 0.0001 
Error 761,67 20 38.08 
Total 2145,33 23 
 
Tabla 4 
Prueba de Kruskal Wallis 
 Variable Tratamientos N Medianas H 
Puntaje 1 6 73,50 16,50 
Puntaje 2 6 83,00 
Puntaje 3 6 71,50 
Puntaje 4 6 88,00 
 
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems: 
a) Explicitar el modelo teórico de un DCA modelo 1 (fijo) paramétrico e interpretar los parámetros del 
diseño. 
b) ¿Cuántos y cuáles son los factores del experimento empleado? 
c) ¿Se trata de un diseño balanceado? Justificar. 
d) Verificar el cumplimiento de las condiciones de un DCA paramétrico al 5%. SOLO se solicita hipó-
tesis estadística y decisión justificada. 
e) Realice el test correspondiente al 5% en forma completa para probarla hipótesis de los investigado-
res. 
 
 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
68
 
26.- Se desean comparar 5 métodos diferentes de almacenamientos en cuanto al contenido promedio 
de humedad (en %) en alimentos balanceados para caninos. Para ello se seleccionan al azar 25 mues-
tras de características similares, las cuales son asignadas de forma aleatoria a los diferentes métodos 
de almacenamiento, obteniendo los siguientes resultados: 
 
Método 
A B C D E 
8,30 7,90 8,10 7,40 7,60 
8,10 7,10 8,50 8,50 7,70 
8,40 7,90 7,82 8,50 7,90 
8,30 7,80 8,30 8,50 7,98 
8,40 7,68 8,15 8,22 8,10 
 
 
Tabla 1 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
RE_Hidratación 25 0,00 1,02 0,87 0,0078 
 
 
 
Tabla 2 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
abs dif 25 0,07 0,00 148,73 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 0,10 4 0,03 0,36 0,8329 
Método 0,10 4 0,03 0,36 0,8329 
Error 1,41 20 0,07 
Total 1,51 24 
 
Tabla 3 
Análisis de la varianza 
Variable N R² R² Aj CV 
Hidratación 25 0,44 0,33 3,76 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo 1,43 4 0,36 3,89 0,0170 
Método 1,43 4 0,36 3,89 0,0170 
Error 1,84 20 0,09 
Total 3,26 24 
 
Tabla 4 
Prueba de Kruskal Wallis 
Variable Método N Medianas H 
Hidratación A 5 8,30 11,75 
Hidratación B 5 7,80 
Hidratación C 5 8,15 
Hidratación D 5 8,50 
Hidratación E 5 7,90 
A partir de los gráficos y las salidas correspondientes, responda los siguientes ítems: 
a) Explicitar el modelo teórico de un DCA modelo 1 (fijo) paramétrico e interpretar todas sus compo-
nentes. 
b) ¿Cuántos y cuáles son los tratamientos del experimento empleado? 
c) Especificar la unidad experimental en estudio. 
d) Enunciar y verificar las condiciones necesarias para probar la hipótesis de los investigadores 
e) Realizar el test correspondiente al 5% en forma completa para probar la hipótesis de los investiga-
dores. 
 
27.- La flebitis es una inflamación de las venas que altera el equilibrio hemodinámico en el individuo 
que la padece y generalmente presenta otros signos cardiológicos. El interés por detectar la aparición 
de flebitis es de particular importancia, ya que se pueden prevenir complicaciones cardíacas. 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
69 
Se trabajó con 24 conejos del bioterio y se eligió como droga a la amiodarona que, como efecto colate-
ral, produce flebitis en el lugar de la aplicación. 
Se propusieron tres tratamientos: 
- amiodarona en una solución excipiente 
- sólo la solución excipiente 
- una solución salina (control) 
Los conejos utilizados como animales de prueba se asignaron al azar a los tres grupos de tratamientos 
y se les administró las soluciones vía endovenosa, a través de la vena de una de las orejas. 
 Un incremento en la temperatura de la oreja tratada se consideró como posible indicador temprano 
de flebitis. La diferencia en la temperatura de las orejas (tratada menos no tratada) se usó como varia-
ble respuesta. 
 El incremento medio estimado en la temperatura de las orejas de conejos tratados con amiodarona 
con la solución excipiente fue de 1,20ºC, que es un valor con significado clínico, mientras que las esti-
maciones medias respectivas para las soluciones excipiente y salina fueron de 0,13ºC y 0,000ºC, que 
no son significativas en el sentido clínico. 
 
Identificar en este diseño: 
a) ¿Cuál es la variable respuesta a analizar? 
b) ¿Qué factores se controlaron mediante el diseño experimental? 
c) ¿Qué hipótesis se planteó el investigador? (Suponer que falla el supuesto de normalidad de los erro-
res) 
d) ¿Qué tipo de diseño se realizó? 
e) ¿Considera que se han respetado los principios básicos del diseño experimental (repetición, aleatoriza-
ción y control local)? 
 
28.- La vida útil de las carnes refrigeradas sin cocción es el tiempo en que, un corte previamente em-
paquetado, es sano, nutritivo y vendible. Un paquete de estos expuesto al aire ambiental tiene una vida 
útil aproximada de 48 hs, después de la cual la carne comienza a deteriorarse por contaminación de 
microbios, degradación del color y encogimiento. El empaque al vacío es efectivo para suprimir el 
desarrollo de microbios; sin embargo, continúan siendo un problema los otros aspectos. 
Algunos estudios recientes sugieren las atmósferas controladas de gas, como alternativa a los empa-
ques actuales. Dos atmósferas que prometen combinar la capacidad de suprimir el desarrollo de mi-
crobios con la conservación de las cualidades de la carne son: 
 1) dióxido de carbono puro (CO2) y 
 2) mezclas de monóxido de carbono(CO), oxígeno (O2) y nitrógeno (N2). 
 Se cree que alguna forma de atmósfera controlada proporcionará un entorno más efectivo de em-
paque para el almacenamiento de carne. 
El investigador diseña un experimento, incluyendo carne envasada con un empaque comercial de plás-
tico, con: 
1) aire del ambiente 
2) al vacío 
3) una mezcla de gases con 1% de CO, 40% de O2 y 59% de N2 
4) 100% de CO2 
Los empaques al vacío sirven como tratamientos de control. 
A cada conjunto de empaque se le asignaron al azar tres cortes del mismo tamaño (75 g). Cada corte 
se empacó por separado en las condiciones asignadas. 
Se desea, en este caso, estudiar la efectividad de cada tratamiento para suprimir el desarrollo bacte-
rial. Después de nueve días de almacenamiento a 4ºC en una instalación normal, se midió el número 
de bacterias psicrófilas en la carne. Éstas se encuentran en la superficie de la carne y se asocian con 
el deterioro de la misma. Se pide: 
a) Indicar el tratamiento o factor que se analiza con sus niveles. 
b) Expresar la hipótesis del investigador 
c) Explicar si es un diseño experimental u observacional justificando adecuadamente. 
 
29.- En un estudio se analiza la hipótesis de que el ancho del escudo, o placa dorsal, medida en m, de 
ninfas de garrapata del conejo, Haemaphysalis leporispalustris, es mayor en regiones cálidas que en tem-
pladas. Para poner a prueba esta suposición se toma una muestra aleatoria de 10 garrapatas que perte-
necen a granjas de clima cálido (Región 1), y lo mismo se hace en granjas de clima templado (Región 2), 
seleccionándose, también 10 garrapatas. Los datos obtenidos son: 
Estadística Analítica 2006 Fac. Cs. Veterinarias(U.B.A) 
 
 
 
70
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Shapiro-Wilks (modificado) 
Región Variable n Media D.E. W* p (una cola) 
1 Ancho 10 209,50 50,14 0,89 0,2657 
2 Ancho 10 177,30 61,58 0,81 0,0290 
 
Prueba de Wilcoxon para muestras independientes (Mann Whitney) 
Grupos Media 
Desvío es-
tándar 
Mediana 
Media del 
rango 
Estadístico p-valor 
Región 1 209,50 50,14 222,50 12,20 
122,00 0,1984 
Región 2 117,30 61,58 199,00 8,80 
 
a) Explicitar el parámetro en estudio y su interpretación biológica. 
b) Enunciar las condiciones para realizar inferencias con el estadístico de contraste más indicado en este 
caso y expresarlo con su correspondiente distribución. 
c) Realizar la prueba de interés al 10%. 
d) La prueba realizada en el inciso anterior ¿es paramétrica o de libre distribución? Justifique su respues-
ta. 
 
30.- En un estudio farmacológico se compararon los tiempos de recuperación, en días, de pacientes 
que fueron tratados con un principio activo, y los tiempos de recuperación de los que fueron considera-
dos como grupo control, a los que se les aplicó un placebo. Para el primer grupo se seleccionaron 
aleatoriamente 20 pacientes que recibieron el principio activo. El segundo grupo, formado por 20 pa-cientes, también seleccionados de manera aleatoria, recibió un placebo. ¿Se puede suponer, al 5%, 
que los tiempos de recuperación son diferentes? ¿Cuál es el objetivo del experimento?. 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
Principio activo 20 10,86 2,16 0,964 0,6262 
Placebo 20 12,30 3,54 0,9697 0,7482 
Al realizar la Prueba de homogeneidad de varianzas se obtuvo que F=0,3738, p-valor=0,0378 
 
31.- Sobre un grupo de pacientes hipertensos, se registró la presión sistólica (mmHg) registrada en 
decúbito dorsal en 31 individuos elegidos aleatoriamente antes (A) y durante (T) el tratamiento con la 
planta Rauwolfia. 
a) Definir la variable y parámetro en estudio. 
b) ¿Cuántos parámetros se encuentran en análisis? Interpretarlo/s en términos del problema. 
c) Verificar las condiciones necesarias para seleccionar la variable pivotal más indicada para realizar 
inferencias en este caso. 
d) Probar al 1% si la droga en estudio posee acción hipotensora. 
e) Clasificar a la prueba realizada en el inciso anterior según: exacta – asintótica - paramétrica – de 
libre distribución. Puede seleccionar más de una opción. 
f) ¿Resulta un intervalo de confianza para el parámetro en estudio un medio para obtener más infor-
Región 1 Región 2 
225 220 
220 190 
240 250 
145 80 
260 100 
255 95 
270 200 
185 215 
130 225 
165 198 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
71 
mación? Justificar la respuesta 
 
Estadística descriptiva 
Variable n Media D.E. Mín Máx 
A 31 205,00 22,61 160,00 230,00 
T 31 180,50 16,57 160,00 205,00 
DIF A-T 31 24,50 15,89 0,00 50,00 
 
Shapiro-Wilks (modificado) 
Variable n Media D.E. W* p (una cola) 
A 31 205,00 22,61 0,71 0,0172 
T 31 180,50 16,57 0,76 0,0350 
DIF A-T 31 24,50 15,89 0,63 0,0697 
 
Prueba T para muestras Independientes 
Clasific Variable Grupo(1) Grupo(2) n(1) n(2) media(1) media(2) p(Var.Hom.) T 
T A {1,00} {2,00} 31 31 205,00 180,50 0,3687 2,76 
Prueba T para un parámetro 
Valor del parámetro probado: 0 
Variable n Media DE T p(Unilateral I) 
DIF A-T 31 24,50 15,89 4,88 0,9996 
 
Prueba de Wilcoxon para muestras independientes 
Clasific Variable Grupo 1 Grupo 2 n(1) n(2) Media(1) Media(2) W p(2 colas) 
T A 1,00 2,00 31 31 205,00 180,50 136,00 0,0183 
 
Prueba F para igualdad de varianzas 
Variable Grupo(1) Grupo(2) n(1) n(2) Var(1) Var(2) F p prueba 
A {1,00} {2,00} 10 10 511,11 274,72 1,86 0,3687 Bilateral 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
72
 
RESULTADOS 
 
EJERCICIOS PROPUESTOS 
INFERENCIA PARA DOS POBLACIONES 
1) b) VP: 
   
 1 2
2 2
1 2
1 2
~ 0;1
X Y
Z N
n n
 
 
  


 
c) 
0 1 2
1 1 2
:
:
H
H
 
 

 
 RC: z -1,96 U 1,96z 
0H
z = 4,72 RECHAZO Ho 
d) Si, [123,88;300,20] kg/ha 
 
2) b) E=S 
 c) VP: t=
(x̄E-x̄S)- μE-μS
sa
1
nE
+
1
nS
~t18 
d) estimación puntual: -1.49 ; Int. de confianza: IC [-1,72;-1,26] 
e) exacta 
f) 
H0:σE
2≥σS
2
H1:σE
2<σS
2 RC: F0,314 0HF = 0,29 RECHAZO Ho 
3) b) p1-p2 
c) 
   
 
 1 2 1 2
1 2
ˆ ˆ
0;1
1 1
ˆ ˆ1
dp p p pZ N
p p
n n
  
 
 
  
 
 
d) 
0 1 2
1 1 2
: 0
: 0
H p p
H p p
 
  
 RC: z ≥ 1,64 
0H
z = 2,96 RECHAZO Ho 
4) a) t=
d - μD
sD
√n
~t11 con D:A-B 
b) 
0
1
: 0
: 0
D
D
H
H



 
 RC: t-2,201 y t≥2,201 
0H
t = 0,74 NO RECHAZO Ho 
c) error de tipo II 
e) No. 
 
5) b) Parámetro: 1 2  Estimador: X Y 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
73
 
c) 
   1 2 1 2
2 2
1 2
1 2
~
x x
t t
s s
n n

   


 con w=14 (14,43) 
d) Puntualmente: 2,048 IC: [-0,8413;4,9373] 
e) Si. 
0 1 2
1 1 2
:
:
H
H
 
 

 
 NO RECHAZO Ho 
 
6) a) No. Pares de carpas gemelas. 
c) 
 1 1
1 10;10
1
- ~
2
n n
U T U

 
d) H0: 1  2 = 0 p-valor=0,5703 NO RECHAZO Ho 
 H1: 1  2 ≠ 0 
e) exacto-no paramétrico 
 
ANOVA 
2) d) e36 = 7 - 11,25= -4,25kg/100g de aceite. 
La sexta muestra de aceite de soja tiene una concentración de 4,25 mg/100 g por debajo del promedio 
de su grupo. 
e) i) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) = 0,1103 NO RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,8031 NO RECHAZO H0 
f) ANOVA del DCA paramétrico; FH0:164.13 VC: F4;25;0.95=2.76 Rechazo H0 
g) 
0 1 2
1 1 2
:
:
H
H
 
 

 
 VP: 
   
10~
1 1
B A B A
a
A B
x x
t t
s
n n
   


 RC: t  - 1,37 tH0=-11,13 RECHAZO Ho 
3) d) i) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) = 0,0469 RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,9412 NO RECHAZO H0 
e) DCA no paramétrico; RC: 9,4882 HH0=22,24 RECHAZO H0 
f) 
2
1
0 2
2
2
1
1 2
2
: 1
: 1
H
H








 
 VP: 
2
1
2
2
2
1
2
2
s
s
F


 F4;4 RC: F0,043 U F≥23,15 
4) b) e42=0,06 seg 
c) i) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) =0.0201 RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,9550 NO RECHAZO H0 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
74
 
d) DCA no paramétrico RC: 6,252 HH0=16,17 RECHAZO H0 
 
5) a) DCA 
c) Tratamiento: Droga , Niveles: A, B, C 
d) y15=95 mg/100ml 
e) e32=5,67 mg/100ml 
f) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) =0.7830 NO RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,8649 NO RECHAZO H0 
g) DCA paramétrico FH0:18.45 VC: F2;15;0.95=3,68 RC: F≥3,68 RECHAZO H0 
 
PROBLEMAS COMPLEMENTARIOS 
INFERENCIA PARA DOS POBLACIONES 
01) a) Apareadas 
c) 9~
D
D
d
t t
s
n

 
d) [-0,1679; 0,0759] 
e) No rechazo H0 ( D =0) 
 
02) a) Independientes 
c) [1,15 ; 4,41] 
d) d1) 
   1 2 1 2
2 2
1 2
1 2
~
x x
t t
s s
n n

   


 W=48 
 d2) 
0 1 2
1 1 2
:
:
H
H
 
 

 
 RC: t  -1,299 
0H
t = -2,91 RECHAZO Ho 
 
04) a) Apareadas. 
c) T+ ~ T10 
d) D :A-B 
0
1
: 0
: 0
D
D
H
H



 
 RC: T+ 11 
0
6HT
  RECHAZO Ho 
e) Error de tipo I 
f) Considerando muestra 1 como sujetos tratados con droga A. 
 H0: 1  2  0 
 1 1
1 10;10
1
- ~
2
n n
U T U

 RC: 73  U 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
75
 
 H1: 1  2 > 0 T1 = 81 UH0=26 RECHAZO Ho 
 
05) b) Parámetro 1 2  
 Estimador 1 2X X 
 c) 
   1 2 1 2
17
1 2
~
1 1
a
x x
t t
s
n n
   


 
d) [-0,88;3,208] 
e) exacta. 
f) No rechazo H0 ( 1 2  =0) 
 
06) a) p1-p2 
b) 1 2
85 93
ˆ ˆ 0,08
100 100
p p     
d) 
0 1 2
1 1 2
: 0
: 0
H p p
H p p
 
  
 VP: RC: z  -1,64 
0H
z = -1,81 RECHAZO Ho 
e) [-0,166 ; 0,006] 
 
07) c) TCL: 
   1 2 1 2
2 2
1 2
1 2
(0,1)
x x
z N
s s
n n
   
 

 
d) [4006,15 ; 4023,85] kg/ha 
 
08) c) Corolario TCL: 
   
   
 1 2 1 2
1 1 2 2
1 2
ˆ ˆ
0;1
ˆ ˆ ˆ ˆ1 1
dp p p pZ N
p p p p
n n
  
 
 

 
d) [-0,3 ; -0,061] 
 
09) a) 1 2ˆ ˆp p 
b) 
   
 
 1 2 1 2
1 2
ˆ ˆ
0;1
1 1
ˆ ˆ1
dp p p pZ N
p p
n n
  
 
 
  
 
 
  
 
 1 2 1 2
1 2
ˆ ˆ
0;1
1 1
ˆ ˆ1
dp p p pZ N
p p
n n
  
 
 
  
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
76
 
c) 0 1 2
1 1 2
: 0
: 0
H p p
H p p
 
  
 
d) RC: z -1,64 U 1,64 z rechazo H0 si zH0 -1,64 U 1,64 zH0 ; no rech H0 si -1,64 zH0 1,64 
e) zH0=2,28 RECHAZO Ho 
 
10) a) Apareadas 
b) D 
c) 8~
D
D
d
t t
s
n

 
d) 0
1
: 0
: 0
D
D
H
H



 
 RC: t-2,30 U 2,30t 
0H
t = -1,42 NO RECHAZO Ho 
11) a) Independientes. 
b) VP: 
   1 2 1 2
14
1 2
~
1 1
a
x x
t t
s
n n
   


 
c) 
0 1 2
1 1 2
:
:
H
H
 
 

 
 RC: t  - 1,76 tH0= -0,21 NO RECHAZO Ho 
 
13) a) D 
c) 7~
D
D
d
t t
s
n

 
d) 0
1
: 140
: 140
D
D
H
H



 
 RC: 1,415  t 
0H
t = -0,70 NO RECHAZO Ho NO INVIERTEN 
 
14) b) Condiciones de Mann-Whitney 
c) H0: 1  2  0 
 1 1
1 10;10
1
- ~
2
n n
U T U

 RC: U27 
 H1: 1  2 < 0 T1 = 87 UH0=32 NO RECHAZO Ho 
 
15) b) 
2
1
2
2


 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
77
 
d) 
2
1
0 2
2
2
1
1 2
2
: 1
: 1
H
H








 
 RC: 5,3511 F 
0H
F = 1,59 NO RECHAZO Ho 
 
16) a) [0,376;2,286] 
b) t=
(x̄1-x̄2)- μ1-μ2
sa
1
n1
+
1
n2
~ t28 
c) [-15,066 ; -5,734] UC 
d) d2) 
0 1 2
1 1 2
:
:
H
H
 
 

 
 RC: t-2,048 U 2,048t 
 d3) RECHAZO Ho 
 
17) a) 
2
1
2
2
0,177
S
S
 
d) 
2
1
0 2
2
2
1
1 2
2
: 1
: 1
H
H








 
 RC: F 0,3588 
0H
F = 0,177 RECHAZO Ho 
e) Error de tipo I 
18) b) 
2
1
2
1
14;142
2
2
2
~
s
F F
s


 
c) [0,23;4,24] 
d) exacta 
 
19) a) 
2
1
2
2
1,241
S
S
 
b) 
2
1
2
1
10;92
2
2
2
~
s
F F
s


 
d) [ 0,313 ; 4,775 ] 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
78
 
e) No rechazo H0 (
2
1
2
2
1


 ) 
f) Error tipo II 
20) b) 
   
 
 1 2 1 2
1 2
ˆ ˆ
0;1
1 1
ˆ ˆ1
dp p p pZ N
p p
n n
  
 
 
  
 
 
c) 0 1 2
1 1 2
: 0
: 0
H p p
H p p
 
  
 RC: z -2,58 U 2,58 z 
0H
z = 1,716 NO RECHAZO H0 
d) No 
 
29) a)  
b) 
 1 1
1 10;10
1
- ~
2
n n
U T U

 
c) H0: 1  2  0 RC: U32 Uobs=33 
 H1: 1  2 > 0 p-valor=0,1984 NO RECHAZO Ho 
d) No paramétrica 
30) 
0 1 2
1 1 2
:
:
H
H
 
 

 
 
   1 2 1 2
2 2
1 2
1 2
~
x x
t t
s s
n n

   


 con w=32 RC: t -2,042 U 2,042t 
31) b) D 
c) (0,1)D
D
d
z N
s
n

  
d) 
H0:μD≤0
H1:μD>0
 RC: z ≥ 2,33 
0H
z = 8,58 RECHAZO Ho 
e) Asintótico – No paramétrico 
f) Si 
 
 
 
 
 
 
 
 
 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
79
 
ANOVA 
3.- a) i) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) =0,2558 NO RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,4593 NO RECHAZO H0 
 b) ANOVA del DCA paramétrico; RECHAZO H0 
 FH0:20 VC: F2;21;0.95=3.49 (GL: 2;20) RECHAZO H0 
12.-c) i) Los errores son independientes. 
 ii) normalidad: p -valor (Shapiro – Wilks) = 0,65 NO RECHAZO H0 
 iii) homocedasticidad: FH0:0,71 NO RECHAZO H0 
 d) ANOVA del DCA paramétrico; p-valor=0,0001 RECHAZO H0 
 FH0:90,59 VC: F2;27;0.95=3,39 (GL: 2;25) Rechazo H0 
25.-b) Factor: tratamiento antiinflamatorio Niveles: trat 1, trat 2, trat 3, trat 4 (4 Tratamientos) 
d) i) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) = 0,0224 RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,6135 NO RECHAZO H0 
 e) Kruskal Wallis; p-valor=0,0009 RECHAZO H0 
 HH0: 16,50 VC: X23;0.95=7,815 Rechazo H0 
26.-b) Factor: método de almacenamiento Niveles: mét A, mét B, mét C, mét d, mét E (5 Trat) 
c) UE: Una muestra de cierto producto 
d) i) Los errores son independientes. 
 ii) normalidad: p-valor (Shapiro – Wilks) = 0,0078 RECHAZO H0 
 iii) homocedasticidad: p-valor (Levene) = 0,8329 NO RECHAZO H0 
e) Kruskal Wallis; p-valor=0,0185 RECHAZO H0 
 HH0: 11,75 VC: X24;0.95=9,488 Rechazo H0 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
80
 
MODELO DE 1ER. PARCIAL 
 
1er. Parcial de ESTADÍSTICA ANALÍTICA Tema 2401 FECHA: … /…/…. 
APELLIDO Y NOM-
BRE:.......................................................................................... 
COMISIÓN NRO:………………… Cantidad de Hojas (sin incluir éstas):…… 
 
Problema 1 
El dueño de dos establecimientos ganaderos de la provincia del Chubut (A y B) puso en marcha un plan 
de mejoramiento de la calidad de la lana basado en la incorporación de machos productores de una 
reconocida cabaña en el establecimiento A. Luego de unos años tomó 8 animales al azar de cada esta-
blecimiento y midió la longitud (en mm) de la lana del vellón resultando: 
 
A 80,9 80 80,7 82,3 81,8 78,1 81,1 79,5 
B 77,6 77,2 76,8 78,5 78 78,1 76,2 72,9 
 
Shapiro-Wilks (modificado) 
Establecim n Media D.E. W* p(Unilateral D) 
A 8 80,55 1,34 0,96 0,8696 
B 8 76,91 1,78 0,81 0,0554 
 
Prueba F para igualdad de varianzas 
Variable Gr(1) Gr(2) n(1) n(2) Var(1) Var(2) F p prueba 
Long {A} {B} 8 8 1,78 3,18 0,56 0,4620 Bilateral 
 
a) (4p) Definir la o las variables de interés. 
b) (6p) Analizar las condiciones aplicadas al problema para decidir qué variable pivotal utilizará 
para realizar inferencias. (No es necesario que redacte la conclusión). Indicar la distribución de la va-
riable pivotal elegida. 
c) (10p) ¿Se observa mayor longitud del vellón en el establecimiento A, al nivel de significación del 
5%? Realizar el test completo. 
d) (4p) ¿Cuándo utiliza la prueba de Welch? Detalle: las condiciones necesarias e hipótesis a plantear. 
e) (6p) ¿Cuándo cree conveniente utilizar una prueba para la media de las diferencias apareadas? 
Ejemplifique brevemente, indicando variable pivotal, y condiciones necesarias para seleccionar la co-
rrespondiente variable pivotal. 
 
Problema 2 
Interesa comparar la preferencia por la marca XXX de vacuna contra el moquillo canino en dos locali-
dades. 
En una localidad se seleccionaron 35 veterinarios y se halló que 21 prefieren utilizar en la marca XXX 
mientras que en la otra localidad se seleccionaron 55 veterinarios y resultó que sólo 28 la prefieren 
para vacunar contra el moquillo. 
¿Al 5% se puede afirmar que la proporción de veterinarios que eligen la marca XXX de vacuna es supe-
rior en la segunda localidad? 
a) (3p) Definir una variable de interés e indicar estimador puntual. 
b) (7p) Probar al 5% la sospecha de los investigadores. 
c) (3p) ¿Considera adecuado realizar un intervalo de confianza, a partir de la decisión tomada? Justifi-
car 
d) (5p) ¿Cuándo realiza un test de nivel asintótico? Justificar. Comentar el o los casos que conoce 
cuando las poblaciones no son independientes indicando los correspondientes estadísticos de prueba. 
 
Problema 3 
En el bioterio de una empresa farmacológica, están evaluando la ganancia de peso en ratas Wistar en 
crecimiento. Por problemas económicos, deben seleccionar el alimento balanceado más económico, sin 
Estadística Analítica 2021 Fac. Cs. Veterinarias (U. B. A.) 
 
 
 
 
81
 
provocar deterioro en la salud de las ratas. 
En la actualidad se presentan tres proveedores de balanceados, cada uno con susformulaciones, que, 
dicen, provocan un buen aumento de peso en ratas en crecimiento. Uno de los balanceados está for-
mulado a base de carne de vaca; el otro, a base de carne de cerdo; y el último, a base de cereales. 
Para probar si los aumentos de peso producidos por los balanceados difieren, seleccionan aleatoria-
mente 15 ratas Wistar en crecimiento, y las colocan en jaulas individuales. A cada rata se le asigna uno 
de los balanceados de manera aleatoria que consumen durante 10 días. Los datos obtenidos son los 
siguientes: 
 
Vaca 79 107 102 100 87 
Cereal 107 67 74 98 58 
Cerdo 94 91 98 96 79 
 
a) (6p) ¿Cuáles son los principios básicos de un diseño de experimentos? Explicar brevemente cada 
uno y su importancia 
b) (5p) Indicar Factor/es, nivel/es, unidad experimental y cantidad de repeticiones por tratamiento 
c) (12p) Escribir el modelo correspondiente al diseño paramétrico e interpretar el o los parámetros, en 
términos del problema 
d) (8p) ¿Qué puede decir acerca de la validez del DCA Paramétrico? Establecer hipótesis nula y alter-
nativa cuando corresponda hacerlo y decidir, justificando la decisión. 
e) (1p) Definir residuo. Calcular el residuo e23 e interpretar en términos del problema 
f) (5p) Explicar brevemente en que se basa la prueba de Levene, para probar homogeneidad de Va-
rianzas. 
g) (10p) A partir de los resultados obtenidos en el inciso “d”, elegir la salida adecuada de InfoStat, 
para probar, con un nivel 0,05, si los aumentos de peso difieren en las ratas alimentadas con los balan-
ceados seleccionados. 
 
Shapiro-Wilks (modificado) 
 Variable n Media D.E. W* p(Unilateral D) 
RE_aumPeso 15 0,00 1,04 0,97 0,8942 
 
Análisis de la varianza – Test de Levene 
Variable N R² R² Aj CV 
AbsDif 15 0,22 0,09 98,67 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F p-valor 
Modelo. 324,40 2 162,20 1,73 0,2179 
Dieta 324,40 2 162,20 1,73 0,2179 
Error 1122,00 12 93,50 
Total 1446,40 14 
Análisis de la varianza 
Variable N R² R² Aj CV 
aumPeso 15 0,18 0,04 16,20 
 
Cuadro de Análisis de la Varianza (SC tipo III) 
 F.V. SC gl CM F 
Modelo. 549,73 …… 274,87 …………….. 
Dieta 549,73 …… 274,87 …………….. 
Error 2502,00 12 ………… 
Total 3051,73 14 
Prueba de Kruskal Wallis 
Variable Dieta N D.E. Medianas H 
aumPeso Cerdo 5 7,50 94,00 1,82 
aumPeso Cereal 5 20,85 74,00 
aumPeso Vaca 5 11,60 100,00 
 
 
 
 
 
……………….. 
Firma