Datos, variables y escalas de medición en estadística
Una vez delimitada la población y la unidad de observación, para responder a preguntas de interés se debe recolectar la información de cada uno de los elementos que la conforman. A estas características les denomina variables.
Las variables son cada una de las características que se observan en los ele- mentos de la nuestra población o muestra de estudio, las cuales son suscepti- bles de ser cuantificadas o registradas. No necesariamente tienen un carácter numérico. En cada elemento se pueden observar y registrar una o más varia- bles; a los posibles valores que toman se les llama datos.7 A la información recabada de toda la población se le llama censo o información censal; o si derivan de una muestra, información muestral.
Las variables se clasifican en cualitativas y cuantitativas (véase el cuadro 4).
Cuadro 4. Tipos de variables usadas en estadística, sus características y ejemplos
Además de ser cuantitativa o cualitativa, una variable también se puede cla- sificar en una escala de medición. Dichas escalas se dividen en nominales, ordinales y de intervalo o razón.
Las variables cualitativas sólo pueden tener atributos de escalas nominales y ordinales; una variable cuantitativa puede ser de intervalo o de razón. A conti- nuación mencionamos algunas características y ejemplos de cada tipo de escala.
Escala nominal: son datos que sólo pueden ser clasificados en categorías. No es posible establecer una relación de orden entre ellas, solamente se puede decir si el elemento pertenece a la categoría o no, o si tiene o no el atributo. Además, todos y cada uno de los elementos deben ser clasificados en una y sólo una categoría.
Ejemplos:
-
1) Sexo.
-
2) Estado conyugal.
-
3) Color de ojos.
-
4) Si tiene o no hijos.
-
5) Carácter de la gestión.
-
6) Nacionalidad.
-
7) Tipo de servicio de la gestión.
-
8) Vía de entrada de la gestión.
Escala ordinal: los valores de la variable se agrupan en categorías que permi- ten establecer una relación de orden entre ellas, según el grado de posesión del atributo que tengan, si la cantidad que posee un elemento es mayor o menor que la cantidad que posee otro. Con las variables de este tipo de escala no es posible hacer ninguna de las operaciones aritméticas básicas: suma, resta, multiplicación y división.
Ejemplos:
-
1) Nivel socioeconómico.
-
2) Orden de llamadas en un día.
-
3) Identificador de gestión.
-
4) Identificador de persona.
Escala de intervalo: cuando un elemento posee mayor o menor cantidad de una variable que otro, también es posible determinar la diferencia de magni- tud entre dos elementos medidos. Para hacerlo, es necesario tener una me- dida origen o cero, establecida a conveniencia por el investigador u otra ya definida. Este tipo de variables permiten las operaciones de suma o resta.
Ejemplos:
-
1) Temperatura en oC.
-
2) El resultado de la suma de las caras al lanzar dos dados.
-
3) Edad en años cumplidos.
-
4) El tiempo.
Escala de razón: entre este tipo de variables sí existe el cero e indica la ausen- cia total de la variable. Además, el cero no es un punto arbitrario de la escala, sino que está fijo. Estas variables permiten las cuatro operaciones aritméticas básicas y, además, realizar comparaciones entre las proporciones o razones.
Ejemplos:
-
1) Peso.
-
2) Talla (estatura).
-
3) Ingreso.
-
4) Edad.
-
5) Número de hijos.
-
6) Tiempo de espera en una sala de urgencia.
Debemos destacar que las diferentes escalas de medición son acumulativas, es de- cir, la escala ordinal posee las propiedades de una nominal, además del orden entre categorías; por lo tanto, la escala ordinal es más fuerte que la nominal, ya que sus datos poseen más información. Asimismo, la escala de intervalo es a su vez nominal y ordinal, mientras que la escala de razón tiene todas las propiedades de la escala de intervalo. Siempre es posible transformar datos que se encuentran en cierta escala a una más débil, simplemente ignorando la información extra que contiene.8
En la figura 3 se observa la relación entre las diferentes escalas de medición.
Una variable puede ser transformada en otro tipo de escala siempre que sea de rango inferior a la utilizada inicialmente. Como se observa en la figura 3, una variable de razón se puede convertir en una de intervalo, ordinal o nominal; y una de intervalo, en ordinal o nominal. De la misma manera, una variable ordinal se puede transformar en una nominal. Esto se hace mediante la agrupación de categorías.
Ejemplo 5
La variable “número de hijos de una persona” es de razón y toma valores de 0, 1, 2, 3, etc. Formamos dos grupos: las personas que no tienen hijos las ponemos en el grupo A; las que sí tienen hijos, en el grupo B. También les podríamos asignar un valor numérico. Por ejemplo, al grupo A le adjudica- mos el valor 1, y a los del B, el 2. De esta manera, la nueva variable, formada por los dos grupos, es una variable nominal, ya que no le podemos asignar valor numérico al hecho de tener o no hijos, simplemente son categorías que clasifican (véase el cuadro 5).
Este proceso de transformación de las variables es práctico; sin embargo, se pierde información. En el ejemplo 5, al observar el registro de una persona con el valor 2 o la letra B de la nueva variable, es decir, la transformada, sólo sabemos que sí tiene hijos, pero no cuántos. Por lo tanto, se recomienda reu- nir siempre la información de las variables con la mayor precisión y detalle y, en la medida de lo posible, en escala de razón, ya que después —si fuera necesario— será más fácil transformarlas a la escala que nos convenga para el tipo de análisis estadístico que deseemos realizar.
La estadística descriptiva y la estadística inferencial dentro de la investigación estadística
Una vez delimitadas la población, la muestra, la unidad de observación, las variables que se utilizarán, así como la manera de medirlas, el siguiente paso es analizar e interpretar los datos. Clasificar de manera correcta las variables de la investigación servirá para determinar los diferentes modelos matemáti- cos y el tratamiento que se les dará.10
Analizar e interpretar los datos requiere de técnicas de la estadística descrip- tiva y de la estadística inferencial:
-
Las técnicas de la estadística descriptiva, que se verán con detalle en los módulos iv y v, se utilizan para el análisis descriptivo de la informa- ción con el objetivo de recabar, clasificar, resumir y analizar las carac- terísticas de la población o muestra para luego deducir conclusiones sobre su estructura y composición.11
-
Siseusainformacióndeunamuestraaleatoria,habráqueutilizarhe- rramientas estadísticas para sacar conclusiones acerca de la población a partir de dicha muestra; a esto se le conoce como inferencia estadís- tica. La inferencia estadística12 atribuye a la población las característi- cas más significativas obtenidas en la muestra.13 Existen dos métodos de inferencia estadística:
-
- Estimación puntual y por intervalos: se proponen estimaciones de los valores de la característica de la población que deseamos investigar14 usando la información de la muestra. Siempre están sujetas a error (la diferencia entre el valor del parámetro de la población y el valor estadístico de la muestra). La probabilidad de cometer este error es
calculable.
-
- Pruebas de hipótesis: en este método hay que establecer una hi-
pótesis estadística respecto al valor que esperamos de la caracte- rística de la población que investigamos, la cual se evaluará con información generada a partir de la muestra.15
Por lo tanto, una hipótesis estadística es una sentencia sobre la naturaleza de una población y, por lo general, se formula a partir de determinada característica de la población. Para contrastar una hipótesis estadística se decide si parece congruente con los datos de la muestra. A esta hipótesis se le conoce como hipótesis nula y se indica con H0. Para contrastar la hipótesis nula se recurre a la hipótesis alternativa y se denota como H1. Así pues, la H0 se recha- zará si parece incongruente con los datos de la muestra; en caso contrario, se acepta como válida.16
La diferencia entre el contraste de hipótesis y la estimación puntual y por in- tervalos consiste en que la primera establece una hipótesis acerca del paráme- tro antes de realizar el estudio; con fundamento en el resultado del estadístico muestral, se rechaza o no dicha hipótesis. En cambio, en la estimación por inter- valo se consideran todos los posibles valores del parámetro.17
Ejemplo 6
Un político mexicano comenta a los medios de comunicación que la edad promedio de las mujeres asesinadas en Ciudad de Juárez entre 2009 y 2010 es de 30 años. Las personas de la Comisión Estatal de Derechos Humanos consideran que la afirmación no es correcta y, con base en una muestra alea- toria de la información disponible en sus registros de los años correspondien- tes, desean refutar la aseveración. Por lo tanto, las hipótesis estadísticas que plantean las personas de la Comisión son:
H0: el promedio de edad de las mujeres asesinadas entre 2009 y 2010 en Ciudad Juárez es de 30 años.
H1: el promedio de edad de las mujeres asesinadas entre 2009 y 2010 en Ciu- dad Juárez es distinto de 30 años.
El análisis de la población o muestra seleccionada mediante la estadística descriptiva es un paso indispensable y necesario en cualquier investigación cuantitativa, independientemente de que se utilicen o no técnicas de esta- dística inferencial.
La selección y aplicación de técnicas estadísticas debe ser parte de la planea- ción de la investigación. Por lo tanto, antes de emplearlas, se deben llevar a cabo los pasos mencionados en la fase de inducción, curso iii, módulo iii, don- de se exponen, entre otros temas, la formulación de objetivos y la elaboración de hipótesis de investigación.
-
Comentarios
Publicar un comentario