Prévia do material em texto
Medidas de tendencia central Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la cantidad de datos en partes iguales. Las más usuales son la media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles. . Medidas de tendencia central medias de los diferentes conjuntos. 3) Es posible hallar la media de La idea de media o promedio (también llamada media aritmética) formaliza el concepto intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto medio del recorrido de la variable según la cantidad de valores obtenidos. Ese valor tiene varias propiedades importantes. 1) Si se suma la distancia de todos los valores respecto de la media, esa suma da cero. 2) Si se toman una cantidad cualesquiera de conjuntos de valores, cada uno con su respectiva media, la media del conjunto general es igual a la suma de cada una de las un conjunto de valores de una variable a partir de tomar la distancia de las observaciones a un valor cualquiera (pertenezca o no al recorrido de la variable) 4) si a un conjunto de observaciones de una variable se le realiza una operación matemática usando un valor constante, entonces la media del nuevo grupo de valores así obtenidos es igual a la aplicación de la misma operación matemática usando ese valor constante sobre la media original. La Media El cálculo de la Media Dado un conjunto de observaciones la media se representa mediante y se obtiene dividiendo la suma de todos los datos por el número de ellos, es decir: La interpretación de la media como centro (o punto de equilibrio) de los datos se apoya en una propiedad que afirma que la suma de las desviaciones de un conjunto de observaciones a su media es igual a cero; es decir, puede probarse que La media aritmética de un conjunto de datos es el cociente entre la suma de todos los datos y el número de estos. Ejemplo: las notas de Juan en escala universitaria el año pasado fueron: 50, 60, 40, 70, 80, 40, 60 La nota media de Juan es: Nota media = que suman 400 Hay 7 datos Media aritmética (I) 5 PROPIEDADES DE LA MEDIA Si a cada uno de los datos se aumenta o disminuye en una constante K, la media aumenta o disminuye en K unidades. Si a cada uno de los datos se multiplica o se divide por una constante K, la media se multiplica o divide por k unidades. Cálculo de la media aritmética cuando los datos se repiten. Ejemplo. Las notas de un grupo de alumnos fueron: Datos por frecuencias Total de datos 1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y se suman. 2º. El resultado se divide por el total de datos. Media aritmética (II) 7 Mediana La mediana, es el dato que divide a los datos en dos partes iguales. Debemos considerar cuando los datos son pares o impares. en caso que N sea impar En caso en que N es par, promediamos el dato obtenido y el siguiente. La mediana de un conjunto de datos es un valor del mismo tal que el número de datos menores que él es igual al número de datos mayores que él. Los pesos, en kilogramos, de 7 jugadores de un equipo de fútbol son: Ejemplo: 72, 65, 71, 56, 59, 63, 72 1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72 2º. El dato que queda en el centro es 65. La mediana vale 65. Si el número de datos fuese par, la mediana es la media aritmética de los dos valores centrales. Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: Caso: La mediana 9 Moda La moda, es aquel dato, aquel valor de la variable que más se repite; es decir, aquel valor de la variable (que puede no ser un único valor) con una frecuencia mayor. La moda de un conjunto de datos es el dato que más se repite. Una zapatería ha vendido en una semana los zapatos que se reflejan en la tabla: Ejemplo. La moda es 41. El número de zapato más vendido, el dato con mayor frecuencia absoluta, es el 41. Lo compran 35 personas La moda 11 MEDIDAS DE POSICION Cuartil, Quintiles, Deciles, Percentiles Los cuartiles, deciles, percentiles son los números que dividen un numero de datos en partes iguales. Por esta razón los cuartiles (Q) dividen los datos en 4 partes iguales, los quintiles (quintil) dividen los datos en 5 partes iguales, los deciles (D) lo dividen en 10 partes iguales y los percentiles (P) en 100. En datos no agrupados para calcular cada uno de ellos utilizados las siguientes expresiones. PROMEDIOS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS. JUAN JOSÉ VENEGAS MORENO Diferenciar los diversos tipos de medidas de resumen que se pueden aplicar a un conjunto de datos agrupados. Calcular e interpretar las principales medidas de tendencia central para datos agrupados. Al finalizar la Tema, el alumno será capaz de: OBJETIVOS CONTENIDO Principales medidas de tendencia central para datos agrupados. Medias Mediana Moda La Media aritmética Cálculo a partir de datos agrupados. El cálculo de la media aritmética, cuando los datos disponibles se encuentran en tablas de distribución de frecuencias, se realiza utilizando la formula siguiente donde: :media :frecuencia absoluta de la clase i :marca de la clase i Ejemplo: La distribución de frecuencias siguiente, representa los puntajes obtenidos en una evaluación del desempeño, aplicado al personal técnico de un Centro de Salud. El puntaje máximo en la prueba es 50. Calcule e interprete en media. Primero se calcularán las marcas de clase ( ); es decir, el valor intermedio de cada clase Marca de Frecuencia clase ( ) absoluta(fi) 12 - 16 14 4 17 - 21 19 8 22 - 26 24 15 27 - 31 29 23 32 - 36 34 10 Total 60 14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) 4 + 8 + 15 + 23 + 10 clase 1575 60 26.25 Interpretación: Si se elige al azar a un trabajador técnico de este hospital, se espera que tenga un puntaje de 26,25 en su evaluación de desempeño. Para realizar cálculos de Mediana, Moda, se deben considerar limites reales de los intervalos. Estos limites están dados por el promedio entre el limite aparente superior de un intervalo y el limite aparente inferior del intervalo superior. En este caso el limite real superior del primer intervalo seria el promedio entre 16 y 17, lo que nos da un valor de 16,5. El limite inferior se considera 11,5 ya que en este intervalo van valores que pueden partir desde 11,5 hasta el 16,5. El limite real superior del segundo intervalo es el promedio entre 21 y 22 , lo que da el valor de 21,5. d) Cálculo de la Mediana a partir de datos agrupados. donde: : mediana : limite real (o frontera) inferior de la clase mediana.(Intervalo donde la frecuencia acumulada es mayor o igual que n/2) : número total de datos. : Frecuencia acumulada anterior al intervalo de la mediana. : frecuencia absoluta de la clase mediana : amplitud de clase Ejemplo: La tabla siguiente muestra la experiencia laboral (años) del personal de seguridad que labora en un gran hospital. Calcule e interprete la mediana. Lugar de la mediana: Mediana = 10,5 años Interpretación: La mitad del personal de seguridad que labora en este hospital tienen una experiencia laboral igual o menor a 10 años 6 meses. La otra mitad de este personal tiene una experiencia laboral igual o mayor a 10 años y 6 meses. Ventajas y desventajas Ventajas: Los valores extremos no afectan a la mediana como en el caso de la media aritmética. Es fácil de calcular, interpretar y entender. Se puede determinar para datos cualitativos, registrados bajo una escala ordinal.Desventajas: Como valor central, se debe ordenar primero la serie de datos. La Moda Cálculo a partir de datos agrupados donde: : moda : limite real (o frontera) inferior de la clase modal (Intervalo que posee la mayor frecuencia) : frecuencia de la clase modal menos la frecuencia de la clase anterior : frecuencia de la clase modal menos la frecuencia de la clase siguiente : amplitud de clase Las clases mediana y modal pueden coincidir pero conceptualmente son diferentes. Ejemplo: La tabla siguiente muestra los errores de facturación durante un mes, en una Clínica. Calcule e interprete la moda. Interpretación: Durante un mes, el número más frecuente de errores de facturación en esta clínica es 6. Clase moda : (4 - 7) Mo = 5,9 Ventajas y desventajas de la moda. Ventajas: Se puede utilizar tanto para datos cualitativos como cuantitativos. No se ve afectada por los valores extremos. Se puede calcular, a pesar de que existan una o más clases abiertas. Desventajas: No tiene un uso tan frecuente como la media. Muchas veces no existe moda (distribución amodal). En otros casos la distribución tiene varias modas, lo que dificulta su interpretación. Medidas de Posición. Cuartiles, quintiles, deciles, percentiles. Recordemos que estas medidas de posición separan los datos en partes iguales, Cuartil es la división de los en 4 partes iguales (1 cuartil es percentil 25%) Quintil es la división de los datos en 5 partes iguales.(primer quintil es el percentil 20% y así sucesivamente) Decil es la división de los datos en 10 partes iguales. Percentil es la división de los datos en 100 partes iguales. Para calcular las distintas medidas de posición se utiliza la expresión ) [a,b[ : intervalo que tiene la frecuencia acumulada F, de al menos datos. Puntaje Frecuencia Absoluta Frecuencia acumulada 350----------399 4 400----------449 6 450-----------499 9 500-----------549 20 550-----------599 31 600------------649 80 650------------699 42 700-----------749 10 750------------799 8 800-----------849 2 a) Determine media, mediana y moda de los datos del puntaje de PSU obtenidos en una generación de un Colegio. b) Determina el cuartil 3 de los datos e interprétalo. c) Determina el decil 9 de los datos e interpreta su valor. d) Determina el cuartil 2 Intervalo frecuencia 1,65-----1,69 6 1,70-----1,74 12 1,75-----1,79 33 1,80------1,84 22 1,85------1,89 8 1,90------1,94 2 a) Determine media, mediana y moda de los datos del puntaje de PSU obtenidos en una generación de un Colegio. b) Determina el cuartil 2 de los datos e interprétalo. c) Determina el decil 8 de los datos e interpreta su valor. Cantidad de abdominales Cantidad de estudiantes [20, 28[ 3 [28, 36[ 9 [36, 44[ 15 [44, 52[ 18 [52, 60[ 8 [60, 68[ 5 ¿Cuantos abdominales como máximo logro hacer el 25% del total de los estudiantes con rendimiento mas bajo? ¿Cuantos abdominales como mínimo realizaron el 50% de los estudiantes con mejor rendimiento? ¿Cuantos abdominales como mínimo hicieron los estudiantes que se encuentran en el 10% con mejor rendimiento? Masa corporal f F [50-60[ 18 18 [60,70[ 32 50 [70, 80[ 45 95 [80, 90[ 17 112 [90, 100[ 8 120 a) Calcular image5.jpeg image6.png image7.png image8.png image9.png image10.png image11.wmf 57 7 400 7 60 40 80 70 40 60 50 = = + + + + + + audio1.wav audio2.wav audio3.wav oleObject1.bin image12.wmf Notas Frecuencia absoluta Notas x F. absoluta 3 5 15 5 8 40 6 10 60 7 2 14 Total 25 129 image13.wmf 1 , 5 25 129 Media = = oleObject2.bin Notas Frecuencia absoluta Notas x F. absoluta 3 5 15 5 8 40 6 10 60 7 2 14 Total 25 129 oleObject3.bin image14.png image15.png image16.wmf 64 2 65 63 = + audio4.wav oleObject4.bin image17.jpeg image18.wmf Nº de calzado 38 39 40 41 42 43 44 45 Nº de personas 16 21 30 35 29 18 10 7 oleObject5.bin Nº de calzado 38 39 40 41 42 43 44 45 Nº de personas 16 21 30 35 29 18 10 7 image150.png audio5.wav image19.wmf å å = = = n f n f i i i i i x 1 1 X image20.wmf x image21.wmf i f image22.wmf i X oleObject6.bin oleObject7.bin oleObject8.bin oleObject9.bin image23.emf DesempeñoNúmero de (puntos)técnicos 12 - 164 17 - 218 22 - 2615 27 - 3123 32 - 3610 TOTAL60 oleObject10.bin Sheet: 潈慪� 4.0 8.0 15.0 23.0 10.0 60.0 image24.wmf i X image25.wmf i x image26.wmf = x oleObject15.bin oleObject11.bin oleObject12.bin oleObject13.bin oleObject14.bin oleObject16.bin Sheet: 潈慪� 4.0 8.0 15.0 23.0 10.0 60.0 image27.wmf ( ) c Md f F n Md i ú ú ú û ù ê ê ê ë é - + = 2 L image28.wmf Md image29.wmf i L image30.wmf n image31.wmf F image32.wmf Md f image33.wmf c oleObject21.bin oleObject22.bin oleObject23.bin oleObject17.bin oleObject18.bin oleObject19.bin oleObject20.bin image34.emf ExperienciaNúmero de laboraltrabajadores (años)de seguridad 0 - 34 4 - 712 Clase Mediana 8 - 1124 12 - 1516 16 - 1910 20 - 233 69 image35.wmf 4 24 ) 16 ( 2 69 5 , 7 ú ú ú û ù ê ê ê ë é - + = d M image36.wmf 4 24 16 5 , 34 5 , 7 ú û ù ê ë é - + = image37.wmf 5 , 34 2 69 2 = = n oleObject24.bin Hoja1 Experiencia Número de laboral trabajadores (años) de seguridad 0 - 3 4 4 - 7 12 Clase Mediana 8 - 11 24 12 - 15 16 16 - 19 10 20 - 23 3 69 oleObject25.bin oleObject26.bin oleObject27.bin image38.png image39.wmf c i ú û ù ê ë é D + D D + = 2 1 1 L o M image40.wmf o M image41.wmf i L image42.wmf 1 D image43.wmf 2 D image44.wmf c oleObject32.bin oleObject33.bin oleObject28.bin oleObject29.bin oleObject30.bin oleObject31.bin image45.emf Errores de facturaciónDías 0 - 36 4 - 712 Clase Modal 8 - 118 12 - 153 16 - 191 Total30 image46.wmf 6 1 = D image47.wmf 4 2 = D image48.wmf 4 4 6 6 5 . 3 Mo ÷ ø ö ç è æ + + = oleObject34.bin Hoja1 Errores de facturación Días 0 - 3 6 4 - 7 12 Clase Modal 8 - 11 8 12 - 15 3 16 - 19 1 Total 30 oleObject35.bin oleObject36.bin oleObject37.bin image49.png image50.png image3.jpeg image51.png