Ir al contenido principal

Algunos ejercicios de estadística descriptiva (tabla de frecuencias)

 


En los módulos anteriores se revisaron los elementos básicos de una in- vestigación estadística en derechos humanos, los conceptos de pobla- ción y muestra, el tipo de escalas de medición de las variables, así como

la forma como se construye una base de datos a partir de las quejas recibidas en la Cdhdf.

El objetivo de este módulo es explicar y ejemplificar algunas técnicas utiliza- das en estadística descriptiva, por lo que se centrará en las tablas de frecuen- cias y en las representaciones gráficas. En el próximo apartado se abordarán algunas medidas de resumen, como la media, mediana, moda, desviación estándar y varianza. Nuestra fuente de información será la base de datos que contiene 47 238 gestiones recabadas en las cinco unidades de la Cdhdf, proporcionada por la Subdirección de Estadística de la Comisión.

Las tablas de frecuencias y la representación gráfica de los datos

La tabla de frecuencias, llamada también distribución de frecuencias, es un arreglo sistemático que organiza y resume la información de una variable. Además ayuda a identificar las veces que aparece cada categoría o modalidad en la muestra o población, también es el primer paso en la descripción de los datos recogidos.

La manera de obtener una tabla de frecuencias no es la misma para una va- riable cualitativa que para una variable cuantitativa.

Tablas de frecuencias para variables cualitativas

Las tablas de frecuencias para las variables cualitativas tienen los siguientes elementos:

  • Clase: característica o variable que se mide. Hay tantas clases como número de categorías en las que se pueden clasificar los datos.

  • Frecuencia absoluta o de clase: cantidad de datos que se presentan en una clase determinada. Su símbolo es fi. El total de casos (n) es igual a la suma de estas frecuencias.

  • Frecuencia relativa: datos que corresponden en la clase. Puede interpre- tarse como un porcentaje y se obtiene al dividir la frecuencia absoluta (fi) entre el número total de casos (n). Usualmente, se multiplica por 100 y su símbolo es pi. Además, la suma de frecuencias relativas es igual a 1 (o a 100%).

    Ejemplo 7

    Con el archivo de Excel llamado “Tabla de servicios.xls” y con la variable Inves- tigación indagaremos si la mayoría de las investigaciones, del total presenta- do en 2011 ante la Cdhdf, son directas. La manera más sencilla de averiguarlo es mediante una tabla de frecuencias. En este caso, la variable de interés Investigación es cualitativa nominal, y tiene tres categorías o clases: de oficio, de reserva y directas, además de que el total de casos es n = 47 238. Por lo tanto, debemos obtener una tabla de frecuencias para variables cualitativas mediante los siguientes pasos:

    1. 1)  Abrir el archivo “Tabla de servicios.xls” en Excel.

    2. 2)  En la hoja de gestiones y con ayuda del mouse, seleccionamos el

      conjunto de datos, incluido el nombre de las variables.

    3. 3)  Después, en el menú Insertar, oprimir el ícono de Tabla dinámica (véase la figura 5a). Aparecerá la ventana Crear tabla dinámica (véa- se la figura 5b). En el recuadro Tabla o rango aparece el rango de

      datos que se seleccionó previamente.

    4. 4)  Dejar activada la opción de Nueva hoja de cálculo y oprimir Aceptar

      (véase la figura 5).

    5. 5)  Automáticamente aparecerá una nueva hoja que contiene la tabla di-

      námica con la cual se trabajará en los módulos iii, iv y v. Esta tabla tiene

      la misma estructura que la mostrada en la primera parte de la figura 6.

    6. 6)  Selecciona la variable Investigación del menú, luego campos para agre-

      gar al informe y, automáticamente, aparecerá como campo de fila.

    7. 7) En el recuadro ∑ Valores arrastra con el mouse la variable Investi- gación. Esto da como resultado la frecuencia absoluta o de clase (fi) para las clases De oficio, De reserva y Directa, tal como se muestra en el segundo panel de la figura 6. 




Para manipular los valores de la tabla dinámica es necesario realizar la con- versión de los valores obtenidos. Primero se seleccionan las celdas de la tabla dinámica. Posteriormente se realiza un pegado especial en el que se seleccio- nan sólo valores en una celda diferente, por ejemplo D4. Esto pega todos los valores sin referencia a la tabla dinámica.

Para obtener la frecuencia relativa (pi) se realiza el siguiente procedimiento:

  1. 1)  Seleccionar la celda de la derecha del primer total y teclear, por ejem- plo, =E5/$E$8 (véase la figura 7). Esto divide el valor de la celda E5 entre el valor de la celda E8, que es la suma de todas las categorías.21

  2. 2)  Oprimir Enter para obtener el valor de la pi de la clase De oficio.

  3. 3)  Copiar la fórmula en las celdas F6 a F8 arrastrando el cursor de la esquina inferior derecha, para obtener la pi de las dos categorías res-

    tantes.

  4. 4)  Realizar la suma total de las tres frecuencias absolutas. Esto se hace

    colocando el cursor en la celda F8 y escribiendo la siguiente fórmula: = suma(F5,F7). Al oprimir Enter, aparecerá como resultado un nú- mero 1. Es posible hacer lo anterior posicionándose en la celda F8 y dando clic en el ícono ∑ Autosuma.

  5. 5)  Para obtener el porcentaje del total de investigaciones que correspon- de a cada categoría, se debe obtener pi en porcentaje: dar clic en el ícono de porcentaje después de seleccionar las celdas de F5 a F8 para desplegar el resultado en términos de 100% en lugar de 1. El resul- tado se muestra en el cuadro 6. De ser necesario, dar clic en el botón Aumentar decimales, para una mejor visualización de los resultados.

  6. 6)  Finalmente, se recomienda asignar un título a la tabla, así como a cada columna, tal y como se observa en el cuadro 6.



  7. Ahora debemos interpretar la tabla de frecuencias y responder a la pregunta planteada anteriormente. Una forma de hacerlo es la siguiente: del total de investigaciones presentadas durante 2011 ante la Cdhdf, 98.49% son de tipo directa; poco más de 1%, de oficio, y el resto (0.49%), de reserva. Por lo tanto, la mayoría de las investigaciones presentadas en las cinco unidades son de tipo directa.

    Otra manera de responder a la pregunta del ejemplo 7 es utilizando una re- presentación gráfica.

    La representación gráfica de un conjunto de datos resulta muy eficaz para facilitar la comprensión y extraer conclusiones acerca del comportamiento real de las variables. Es necesario que el impacto visual de la representación gráfica resuma la información en forma clara, concisa y atractiva.22 Si bien es similar a la tabla de frecuencias, es distinta para las variables cuantitativas y cualitativas; en el último tipo, las representaciones gráficas más usadas son la gráfica circular o de sectores y las gráficas de barras.

    Gráfica circular o de sectores

    Este método gráfico es uno de los más simples y usuales, además de un va- lioso instrumento auxiliar de análisis y presentación de la información. Este diagrama en forma de círculo es particularmente útil para visualizar las dife- rencias de frecuencia entre algunas categorías de nivel nominal,23 además de que el ángulo del sector será proporcional a la frecuencia absoluta o relativa de cada una de las clases de la variable.

  8. Ejemplo 8

    Con los datos del ejemplo 7 se obtendrá la gráfica de sectores. Para realizarla en Excel, se parte de la tabla de frecuencias. Los pasos a seguir son:

    1. 1)  Seleccionar las celdas que contienen el nombre de las categorías y la de los valores de las frecuencias relativas (pi).24 En la opción Insertar, seleccionar la opción de gráfica Circular. Aparecerá un menú; hay que escoger la primera opción: Gráfico 2D. Automáticamente, apare- cerá la gráfica que se muestra en la parte derecha de la figura 8.

    2. 2)  Sólo resta añadir un título y la fuente de donde se obtuvieron los datos. Esto se hace con la opción Herramientas de gráficos, submenú Título de gráficos. Ahí seleccionamos Título superpuesto centrado y, en la parte el cuadro donde aparece la leyenda Texto del gráfico, se escribe el título (véase la figura 9).

    3. 3)  Para poner la fuente de donde se obtuvieron los datos, en el menú Insertar oprimir el ícono Cuadro de texto y, al final del cuerpo de la gráfica, arrastrar el mouse para hacer un cuadro, que aparecerá mar- cado en azul con líneas discontinuas (véase la figura 9) y se escribe el siguiente texto: Fuente: elaboración propia con base en la informa- ción proporcionada por la Subdirección de Estadística de la Cdhdf.

    4. 4)  También puede añadirse el porcentaje que corresponde a cada área al seleccionar el menú Herramientas de gráficos y oprimir el submenú Etiquetas de gráficos, y luego la opción Ajuste perfecto. La gráfica resultante se muestra en la figura 10. 









Comentarios

Entradas populares de este blog

EJERCICIO: Diferencia entre dos medias de poblaciones independientes

Una operación de ensamblaje de una planta industrial requiere que un empleado nuevo se someta a un período de entrenamiento para alcanzar su máxima eficacia. Se sugirió un nuevo método de entrenamiento y se llevó a cabo de una prueba para comparar los métodos. Dos grupos de nueve empleados nuevos se entrenaron durante un período de tres semanas, un grupo usando el nuevo método y el otro siguiendo el procedimiento de entrenamiento estándar. Al final del período de tres semanas se observó el tiempo en minutos que le tomó a cada empleado ensamblar el dispositivo. ¿Presentan los datos suficiente evidencia que indique que el tiempo medio de ensamblaje al final del período de entrenamiento de tres semanas es menor para el nuevo método? Procedimiento estándar Procedimiento nuevo 32 35 37 31 35 29 28 25 41 34 44 40 35 27 31 32 34 31 Dentro de Excel los datos para su análisis han sido ordenados en columnas, como se muestra a continuación. El procedimiento para solicitar en Excel la prueba de me...

¿Cuáles son los componentes básicos de una investigación estadística?

  Datos, variables y escalas de medición en estadística Una vez delimitada la población y la unidad de observación, para responder a preguntas de interés se debe recolectar la información de cada uno de los elementos que la conforman. A estas características les denomina variables . Las variables son cada una de las características que se observan en los ele- mentos de la nuestra población o muestra de estudio, las cuales son suscepti- bles de ser cuantificadas o registradas. No necesariamente tienen un carácter numérico. En cada elemento se pueden observar y registrar una o más varia- bles; a los posibles valores que toman se les llama datos . 7 A la información recabada de toda la población se le llama censo o información censal; o si derivan de una muestra, información muestral. Las variables se clasifican en cualitativas y cuantitativas ( véase el cuadro 4).  Cuadro 4. Tipos de variables usadas e...

PRUEBAS

Prueba t de Student para muestras independientes Supongamos que tenemos dos muestras aleatorias e independientes con medias de  ¯ x 1 x 1 ¯  y  ¯ x 2 x 2 ¯  y que queremos saber si estas dos medias son signifacativamente distintas a un nivel de  p ⩽ 0 , 05 p ⩽ 0 , 05 . Esto es lo mismo que decir que si afirmamos que hay una diferencia entre las muestras tenemos un 95% de probabilidad de tener razón. Lo que tenemos que calcular, entonces, es la probabilidad de que las dos muestras pueder provenir de la misma distribución y que la diferencia que vemos es por varianza en esa población. En otras palabras: queremos saber si dos muestras con la diferencia observada ( ¯ x 1 − ¯ x 2 x 1 ¯ − x 2 ¯ ) podrían tener provenir de la misma población. Si sacamos un número significativo de muestras de una misma población la media de estas muestra va a tener una diferencia con la media de la población, en algunos casos más altos y en otros más bajos. Usamos este conocimiento para...