Vista previa del material en texto
1-2 Tipos de datos 7 Nivel de medición nominal son los datos consistentes exclusivamente en nombres, etiquetas o categorías que no pueden acomodarse según un esquema de orden (por ejemplo, de bajo a alto). D e f i n i c i ó n EJEMPLOS Los ejemplos siguientes ilustran datos muestrales en el nivel de medición nominal. 1. Sí/no/indeciso: Respuestas de sí, no e indeciso en una encuesta. 2. Colores: Los colores de automóviles conducidos por estudiantes univer- sitarios (rojo, negro, azul, blanco y otros). Puesto que los datos nominales carecen de un orden o de un significado nu- mérico, no pueden utilizarse para realizar cálculos. A veces se asignan números a las diferentes categorías (en especial cuando los datos se codifican para el uso de sistemas de cómputo), pero tales números no tienen significado computacional y cualquier promedio que se calcule carece de sentido. 2. Datos continuos: Las cantidades de leche que las vacas producen son datos continuos porque son mediciones que pueden tomar cualquier valor dentro de un intervalo continuo. Durante un intervalo de tiempo dado, una vaca producirá una cantidad de leche que puede ser cualquier valor entre 0 y 5 galones. Es posible obtener 2.343115 galones, ya que la vaca no está restringida a producir cantidades discretas de 0, 1, 2, 3, 4, o 5 galones. Otra forma común de clasificación de los datos es el uso de cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales, el nivel de medición de los datos es un factor impor- tante para determinar el procedimiento a usar. (Véase la figura 14.1 en la pági- na 727.) En este libro encontraremos algunas referencias a estos niveles de medi- ción; sin embargo, lo importante aquí es sustentarse en el sentido común: no hay que hacer cálculos ni usar métodos estadísticos con datos que no sean apropiados. Por ejemplo, no tendría sentido calcular un promedio de números del seguro social, ya que estos números son datos que se usan como identificación, y no representan mediciones ni conteos de algo. Por la misma razón, no tendría sen- tido calcular un promedio de los números que aparecen en las camisetas de los jugadores de básquetbol. Medición de la desobediencia ¿De qué manera se recolectan datos que parecen imposibles de medir, como el nivel de desobedien- cia de las personas? El psicólogo Stanley Milgram ideó el siguiente experimento: un investigador enseñó a un sujeto voluntario a operar un tablero de control que administraba “choques eléctricos” cada vez más dolorosos a una ter- cera persona. En realidad no se daban tales choques y la tercera persona era un actor. El voluntario iniciaba con 15 volts y fue instrui- do para incrementar los choques en aumentos de 15 volts. El ni- vel de desobediencia fue el punto donde el sujeto se negaba a incre- mentar el voltaje. Resultó sorpren- dente que dos terceras partes de los sujetos obedecieran las órdenes aun cuando el actor gritaba y fin- gía sufrir un ataque cardiaco. 8 CAPÍTULO 1 Introducción a la estadística Los datos están en el nivel de medición ordinal cuando pueden acomodarse en algún orden, aunque no es posible determinar diferencias entre los valores de los datos o tales diferencias carecen de significado. D e f i n i c i ó n El nivel de medición de intervalo se parece al nivel ordinal, pero con la propie- dad adicional de que la diferencia entre dos valores de datos cualesquiera tiene un significado. Sin embargo, los datos en este nivel no tienen un punto de partida inherente (natural) desde cero (donde nada de la cantidad esté presente). D e f i n i c i ó n EJEMPLOS Los siguientes son ejemplos de datos muestrales en el nivel de medición ordinal. 1. Las calificaciones de un curso: Un profesor universitario asigna calificaciones de A, B, C, D, o E, las cuales pueden acomodarse en orden; sin embargo, no es posible determinar diferencias entre ellas. Por ejemplo, sabemos que A es más alto que B (por lo tanto, existe un orden), pero no podemos restar B de A (por lo tanto, no se calcula la diferencia). 2. Rangos ordenados: Con fundamento en varios criterios, una revista cla- sificó las ciudades de acuerdo con su “calidad de vida”. Tales rangos (primero, segundo, tercero, etcétera) determinan un orden; sin embargo, las diferencias entre los rangos ordenados no tienen significado alguno. Por ejemplo, una diferencia de “segundo menos primero” puede sugerir 2 – 1 = 1, pero este resultado de 1 no tiene significado porque no es una cantidad exacta que pueda compararse con otras diferencias del mismo tipo. La diferencia entre la primera ciudad y la segunda no es la misma que la diferencia entre la se- gunda y la tercera. Utilizando los rangos ordenados de la revista, la diferencia entre las ciudades de Nueva York y Boston no puede compararse cuantitati- vamente con la diferencia entre las ciudades de San Luis y Filadelfia. Los datos ordinales ofrecen información sobre comparaciones relativas, aun- que no sobre las magnitudes de las diferencias. Por lo general, los datos ordina- les no se usan para cálculos como un promedio, pero esta norma se quebranta en ocasiones (como cuando se usan calificaciones con letras para calcular el punto promedio de calificación). EJEMPLOS Los siguientes ejemplos ilustran el nivel de medición de inter- valo. 1. Temperaturas: Las temperaturas corporales de 98.2°F y 98.6°F son ejemplos de datos en este nivel de medición. Tales valores están ordenados, y podemos determinar su diferencia de 0.4°F. Sin embargo, no existe un punto de partida natural. El valor de 0°F quizá parezca un punto de partida, pero es arbitrario y no representa la ausencia total de calor. Como 0°F no es Apuesta por la ciencia En ocasiones los datos se recolec- tan de maneras muy ingeniosas y de fuentes muy extrañas. Un ejem- plo es el de ciertos investigadores que estudiaron los cambios climá- ticos. Ellos se dieron cuenta de que cada primavera, desde 1917, en la pequeña ciudad de Nenana, Alaska, hacían un juego de lotería, en el cual las personas apostaban sobre la hora exacta en que la capa de hielo del río Tanana se rompería (el último premio fue de cerca de 300,000 dólares). Se colocó un tripié en el río congelado y éste se conectó a un reloj. El reloj se detendría cuando el hielo, al que- brarse, moviera el tripié. De esta forma los investigadores supieron el momento preciso en que ocurría la rotura cada año desde 1917, y los datos resultaron muy útiles en el estudio de las tendencias climáticas. 1-2 Tipos de datos 9 El nivel de medición de razón se parece al nivel de intervalo, aunque tiene la propiedad adicional de que sí tiene un punto de partida o cero inherente (donde cero indica que nada de la cantidad está presente). Para valores en este nivel, tanto las diferencias como las proporciones tienen significado. D e f i n i c i ó n EJEMPLOS Los siguientes son ejemplos de datos en el nivel de medición de razón. Observe la presencia del valor cero natural y el uso de proporciones que significan “dos veces” y “tres veces”. 1. Pesos: Los pesos (en quilates) de anillos engastados con diamante (0 efec- tivamente representa ausencia de peso y 4 quilates es dos veces el peso de 2 quilates). 2. Precios: Los precios de los libros de texto universitarios ($0 efectiva- mente representa ningún costo y un libro de $90 es tres veces más costoso que un libro de $30). Este nivel de medición se denomina “de razón” porque el punto de partida cero hace que las razones o cocientes tengan significado. Entre los cuatro niveles de medición, la mayoría de las dificultades surgen con la distinción entre los niveles de intervalo y de razón. Sugerencia: Para hacer más fácil esta distinción, utilice una sencilla “prueba de razón”: considere dos cantidades en las cuales un número es dos veces el otro y pregúntese si “dos veces” se puede usar para describir correctamente las cantida- des. Puesto que un peso de 200 libras es dos veces más pesado que unpeso de 100 libras, pero 50°F no es dos veces más caliente que 25°F, los pesos están en el nivel de razón, mientras que las temperaturas Fahrenheit están en el nivel de intervalo. Para una comparación y un repaso concisos, estudie la tabla 1-1 en la página si- guiente, que señala las diferencias entre los cuatro niveles de medición. 1-2 Destrezas y conceptos básicos En los ejercicios 1 a 4, determine si el valor dado es un estadístico o un parámetro. 1. El Senado actual de Estados Unidos consta de 87 hombres y 13 mujeres. 2. Se selecciona una muestra de estudiantes y el número promedio (media) de libros de texto comprados este semestre es 4.2. 3. Se toma una muestra de estudiantes y el promedio (media) de la cantidad de tiempo de espera en la fila para comprar libros de texto este semestre es 0.65 horas. 4. En un estudio de los 2223 pasajeros del Titanic, se encontró que 706 sobrevivieron cuando se hundió. un punto de partida desde cero natural, es erróneo decir que 50°F es dos ve- ces más caliente que 25°F. 2. Años: Los años 1000, 2000, 1776 y 1492. (El tiempo no inició en el año 0, así que el año 0 es arbitrario en vez de ser un punto de partida de cero na- tural, que representaría “ausencia de tiempo”). 10 CAPÍTULO 1 Introducción a la estadística Tabla 1-1 Niveles de medición de datos Nivel Resumen Ejemplo Nominal Sólo rangos de orden. Origen de estudiantes: Los datos no pueden 5 californianos acomodarse en un 20 texanos r esquema de orden. 40 neoyorquinos Ordinal Rangos de orden que Automóviles de Orden deter- pueden acomodarse, estudiantes: minado por pero no hay 5 compactos “compacto, diferencias o 20 medianos r mediano, carecen de 40 grandes grande”. significado. De Las diferencias Temperaturas intervalo son significativas, del campus: 0°F no es pero no hay punto 5°F “sin calor”. 40°F de partida natural 20°F r no es dos veces y las razones no 40°F más caliente tienen significado. que 20°F. De razón Hay un punto de Distancias de viaje partida natural de estudiantes: y las razones 5 km tienen significado. 20 km r 40 km En los ejercicios 5 a 8, determine si los valores dados provienen de un conjunto de datos discreto o continuo. 5. El salario presidencial de George Washington era de 25,000 dólares anuales y el sa- lario presidencial actual es de 400,000 anuales. 6. Un estudiante de estadística obtiene datos muestrales y encuentra que la media del pe- so de automóviles en la muestra es 3126 libras. 7. En una encuesta de 1059 adultos, se encontró que el 39% de ellos tienen pistolas en sus casas (de acuerdo con una encuesta de Gallup). 8. Cuando se probaron 19,218 máscaras antigás de divisiones de la milicia de Estados Unidos, se encontró que 10,322 estaban defectuosas (de acuerdo con datos de la revista Time). En los ejercicios 9 a 16, determine cuál de los cuatro niveles de medición (nominal, ordinal, de intervalo, de razón) es el más apropiado. 9. Las estaturas de las mujeres que juegan básquetbol en la WNBA. 10. Las calificaciones de fantástico, bueno, promedio, pobre o inaceptable en citas a ciegas. 11. Las temperaturas actuales en los salones de clase en su universidad. 12. Los números en las camisetas de las mujeres que juegan básquetbol en la WNBA. Sólo rangos de orden o nombres. 40 km es dos veces más lejos que 20 km. 13. Las calificaciones de la revista Consumer Reports de “mejor compra, recomendado, no recomendado”. 14. Los números del seguro social. 15. El número de respuestas “sí” recibidas cuando se les preguntó a 1250 conductores si habían usado alguna vez un teléfono celular mientras conducían. 16. Los códigos postales de la ciudad en que vive. En los ejercicios 17 a 20, identifique a) la muestra y b) la población. También determine si la muestra parece ser representativa de la población. 17. Un reportero de Newsweek se para en una esquina y pregunta a 10 adultos si creen que el presidente actual está haciendo un buen trabajo. 18. Nielsen Media Research encuesta a 5000 amas de casa seleccionadas al azar y en- cuentra que el 19% de los televisores encendidos están sintonizados en 60 minutos (de acuerdo con datos de USA Today). 19. En una encuesta de Gallup aplicada a 1059 adultos seleccionados aleatoriamente, el 39% respondió “sí” cuando se le preguntó: “¿Tiene usted una pistola en su casa?”. 20. Una estudiante graduada de la Universidad de Newport realizó un proyecto de inves- tigación acerca de cómo se comunican los adultos estadounidenses. Empezó por una encuesta que envió por correo a 500 de los adultos que ella conocía. Les pidió que le enviaran por correo la respuesta a esta pregunta: “¿Prefiere usted usar el correo elec- trónico o el correo tortuga (el servicio postal estadounidense)?”. Ella recibió a vuelta de correo 65 respuestas y 42 de ellas indicaron una preferencia por el correo tortuga. 1-2 Más allá de lo básico 21. Interpretación de los incrementos de temperatura En la tira cómica “Born Loser” de Art Sansom, Brutus se alegra por un incremento en la temperatura de 1° a 2°. Cuando alguien le pregunta qué tiene de bueno estar a 2°, él responde que “hace dos veces más calor que en la mañana”. Explique por qué Brutus está equivocado una vez más. 22. Interpretación de encuesta política Un encuestador aplica una encuesta a 200 perso- nas y les pregunta por el partido político de su preferencia: él codifica las respuestas como 0 (para demócrata), 1 (para republicano), 2 (para independiente) y 3 (para otras respuestas cualesquiera). Entonces calcula el promedio (media) de los números y ob- tiene 0.95. ¿Cómo se interpreta este valor? 23. Escala para calificar comida Un grupo de estudiantes desarrolló una escala para ca- lificar la calidad de la comida de la cafetería de su escuela, donde 0 representaba “neutral: ni buena ni mala”. Se asignaron números negativos a las comidas malas y números positivos a las comidas buenas; la magnitud del número correspondía a la se- veridad de lo bueno o lo malo. Las primeras tres comidas se calificaron con 2, 4 y �5. ¿Cuál es el nivel de medición de calificaciones como éstas? Explique su respuesta. 1-3 Pensamiento crítico El éxito en el curso introductorio de estadística por lo regular requiere de más sen- tido común que destreza matemática (a pesar de la advertencia de Voltaire de que “el sentido común no es muy común”). Ya que ahora tenemos acceso a calculado- ras y a computadoras, las aplicaciones modernas de la estadística ya no requieren 1-3 Pensamiento crít ico 11