SEGUNDA PARTE: LOS NUMEROS Y SU INTERPRETACION



Video introductorio


1. ¿De dónde salen los  números?

Imagine a un investigador en Psicología, Sociología, Pedagogía, Ciencias Económicas, Medicina... en su oficina o salon de clase. Ha recogido los protocolos de un cuestionario de opinión sobre sus respectivos objetos de estudio: actitudes hacia los inmigrantes, opiniones políticas, motivación, niveles de renta, incidencia de un virus... que se acumulan sobre su mesa de trabajo. Puede tener 100, 200, 1000 o más cuestionarios.

Cuestionario para la mejora de la Educación en el Estado XX

A continuación encontrará una serie de enunciados relacionados con la calidad de la educación, seguidos de un espacio destinado a recoger el grado de importancia que, a su juicio, reciben de hecho en el centro educativo en el que presta sus servicios. Su valoración se expresa entre 1, la mínima, y 4, la máxima. En la siguiente columna deberá marcar si, a su juicio, es manifiestamente necesario introducir mejoras en tal aspecto.

ITEMS
Importancia que se le concede en su centro:
Necesidad de mejora
1 -
2
3
4 +
SI
NO
I. UN PROYECTO EDUCATIVO DEL CENTRO:
1. Que incorpore los valores morales y sociales de consenso
2. Que integre el carácter propio en el caso de los centros concertados y privados

3. Que analice y tome en consideración las necesidades,demandas y expectativas de la sociedad actual y, en particular, de su propio contexto
4. Que tenga en cuenta las características de nuestro tiempo: globalización, migraciones, interculturalidad, nuevas tecnologías...
5. Que sea conocido por las familias
6. Que sea asumido por las familias, comprometidas con sus valores
7. Que cuente con un sistema de revisión periódica y de puesta al día
Cuadro 1: Parte de un cuestionario 

¿Cómo pasamos de esos protocolos a los números con los que trabaja la Estadística*?

Esos cuestionarios pueden contener 10, 20, 50... preguntas o ítems que los sujetos pueden valorar, por ejemplo, asignando un 1 si responde SI, y un 0 cuando marca el NO. Sumando los valores marcados llegamos a una puntuación* con el número de “sí es” y de “no es”. Del mismo modo, dado que es posible marcar entre 1 y 4 la valoración de cada ítem, según la importancia concedida a cada uno de los enunciados, podremos obtener la puntuación* total de cada persona consultada y hasta la tendencia del grupo, merced a una medida tan conocida como es la media aritmética.*

Al final, cada uno de tales protocolos se ha convertido en un número, número con el que trabajará la Estadística. Este número se denomina puntuación directa* y suele representarse por Xi, esto es: puntuación directa o bruta del sujeto i.

Los números que manejamos nacen de pesar, medir o contar los “objetos” más diversos. Objetos como la talla, el peso, la edad, la inteligencia, la asertividad, la renta “per cápita”, la autoestima, el rendimiento académico, la masa muscular, el “ranking” de un país en los Juegos Olímpicos (o en las pruebas PISA)... son objetos de medida y, mediante los instrumentos adecuados, dan lugar a números.


1.1. Diferentes tipos de números

Parece claro, no obstante, que, por encima de la apariencia externa de los números -todos son iguales en su apariencia- en realidad son muy diferentes unos de otros. Los 80 cm. de talla de un niño poco tienen que ver con los 80 puntos en una prueba de inglés, o los 80 Kg de peso, o el puesto 80 al llegar a meta, o el número de sujetos -80- que son admitidos a un concurso, o los 80o centígrados alcanzados por un horno, o los 80 puntos obtenidos en una prueba de autoestima, o...

Cuando hablamos de talla, o de peso, estamos ante los números plenos, además de fiables y válidos si han sido medidos con cuidado y utilizando un metro y una balanza fiables. Y ello se debe a que contamos con unidades de la misma naturaleza que el objeto a medir: el centímetro para la talla o el kg. para el peso, y damos por hecho que quien mide lo hace con seriedad.

Recuerde: la puntuación directa* de un sujeto cualquiera -también llamada “bruta”- en un instrumento de recogida de datos, se representa por Xi y se lee: puntuación directa del sujeto i.

Aparentemente, los 80o centígrados del horno son de la misma naturaleza que los anteriores, pero no es así, por una sencilla razón: si antes el 0 significaba que no tenemos delante a nadie (porque nadie pesa 0 gr. ni mide 0 cm.), ahora, como todos sabemos, por debajo de 0o sigue habiendo temperatura: -3o, -15o, etc.
También se puede asignar ese número a un corredor de maratón que ha llegado a meta en el puesto 80. Pero aquí no medimos la distancia recorrida sino el orden de llegada; y puede haber diferencias notables en minutos o segundos entre las llegadas de los diferentes atletas. Puede ocurrir que entre el primero y el segundo apenas haya un par de segundos pero que entre este y el tercero haya más de un minuto, y que, más adelante, entre un grupo de corredores prácticamente en el mismo tiempo pero distanciados del anterior en 15 o 20 minutos. Pero eso no importa si lo que medimos es el orden en que entran.
Y, obviamente, el número de 80 de admitidos a un determinado concurso, 35 varones y 45 mujeres por ejemplo, solo nos indica las veces que personas varones y personas mujeres han sido seleccionadas, sin más.

1.2. Escalas de medida

Pues bien: cada uno de esos 80 representa un tipo diferente de número, propios de diferentes niveles o escalas de medida: los de razón o cociente, en el primer caso (talla, peso), permiten todo tipo de operaciones aritméticas; los de intervalo, en el segundo (grados centígrados), con los que podemos establecer ciertas operaciones pero no otras (no conviene entrar aquí en detalles); los de orden (puesto ocupado al llegar a meta) nos indican solo lo que es mayor o menor, anterior o posterior, más o menos intenso..., pero no podemos operar con ellos de otra manera; o de tipo nominal, que solo nos indican que algo es igual o diferente que otro algo, pero no podemos hacer operaciones con ellos: asignar un 1 a los varones y un 2 a las mujeres no significa que estas sean más o aquellos, menos- que los varones, sino, simplemente, diferentes. No tendría sentido, por lo tanto, sumar el número de unos y el doses e intentar calcular la media.
Ahora bien: observe el lector algo importante: hay objetos fácilmente medibles, porque están abiertos a nuestros sentidos (talla, peso, edad...) y porque tenemos unidades de medida de la misma naturaleza: cm, gr., año...

Pero hay otros que son, en realidad, objetos cuya misma naturaleza no conocemos y, por ello, tenemos que definirlos previamente. Pensemos en la inteligencia, en la asertividad, en la autoestima, en la opinión... y hasta en el rendimiento académico. Nadie ha visto la inteligencia, pero sí a personas inteligentes, o asertivas, o con baja autoestima, o con rendimiento adecuado...

Para “medirlas” debemos, en primer lugar, definirlas. A Binet se debe una famosa frase cuando se le preguntó ¿qué es la inteligencia? Su respuesta fue tan contundente y clara como discutible: Inteligencia dijo- es lo que mide mi test. Podríamos decir que, a partir de otros autores de tests la inteligencia, llegaríamos a diferentes medidas de este rasgo humano (Y así es, por cierto). Y lo mismo pasará con el rendimiento académico: diferentes exámenes darán lugar a diferentes resultados, diferentes medidas. Y nada digamos si hablamos de asertividad, de autoestima, de
Un mismo valor numérico puede representar objetos reales o empíricos muy diferentes; según sean estos objetos, al número que los representa se les podrán aplicar unas u otras propiedades de los números y sus correspondientes operaciones matemáticas.

esquizofrenia, etc. Una vez definido el objeto, debemos encontrar manifestaciones acordes con la definición o elaborar reactivos que se consideren evidencias del mismo. Estos reactivos o estas manifestaciones se convierten en ítems del instrumento de medida. Por lo general, a esta traducción de la definición a ítems se la llama definición operativa u operacional.

Aquí nos encontramos con serios problemas para encontrar una regla de medida y su correspondiente unidad de medida y, por tanto, para asignar valores numéricos a la realidad medida. He aquí un problema que tendrán que conocer en su estudio de la asignatura.
Nosotros dejamos constancia de tal problema, señalando las limitaciones que ello representa para los números que utilizamos, en particular:

1.3. Variables y escalas de medida

Ciertos “objetos” no presentan manifestaciones diferentes. Se les denomina constantes. Sin embargo, otros si las tienen, tales y se les denomina variables*; tal es el caso del sexo, masculino o femenino; del estado civil: soltero, casado, divorciado o viudo; de los grados universitarios: Pedagogía, Psicología, Sociología, Económicas...; junto a estos, en otros casos los objetos a medir admiten valores que difieren en cantidad. A las primeras, las denominamos variables cualitativas*, y se miden con números propios de escalas nominales mientras las segundas se conocen como cuantitativas*, y admiten números ordinales, de intervalo o de razón. Las cualitativas pueden presentar dos categorías dicotómicas*, como en el caso del sexo- o más, en cuyo caso hablamos de cualitativas politómicas*, como ocurre con el estado civil.

Algunos autores hablan de variables cuasi-cuantitativas*, en las que la cantidad solo puede apreciarse en términos de orden, por lo que son propias de escalas ordinales. Una variable de este tipo es la escala de dureza de los cuerpos en la que cada cuerpo está por delante o detrás de otro según que le raye o sea rayado por él (A Friedrich Mohs se debe una escala de 10 niveles de dureza que van del talco, el más blando, al diamante, al que solo puede rayar otro diamante).

A su vez, estas variables cuantitativas se dividen en discretas* (variables continuas que solo admiten valores enteros, como número de hijos o de alumnos) y continuas*, como es la edad, el peso, la talla...donde podemos asignar todos los valores intermedios si disponemos de los instrumentos adecuados (una balanza de precisión, por ejemplo; o un cronómetro, como el utilizado en las pruebas olímpicas de atletismo). 

En el cuadro 2 aparece una clasificación de las variables.

a) Para las operaciones matemáticas que están justificadas con tales números.

b) Para su fiabilidad: los números obtenidos en una ocasión pueden variar en otra

c) Para su validez: podemos estar midiendo una cosa que no es por completo la cosa deseada.

Medir determinados objetos de los ámbitos en que trabajamos Educación, Economía, Medicina, Psicología, Sociología...- implica definir el objeto a medir, encontrar manifestaciones de tal objeto o reactivos adecuados y decidir la regla de medida, la regla que nos permitirá atribuir un valor a cada manifestación o reactivo unidad de medida).

TIPOS DE VARIABLES
ESCALA DE MEDIDA
Cualitativas
Nominales
Dicotómicas: sexo
Politómicas: estado civil, clase social,
grado universitario...
Cuasi-cuantitativas
Ordinales:
  •   Escala de dureza
  •   Rangos o puestos
  •   Clasificación de los terremotos
Cuantitativas
Continuas: edad, talla, peso Discretas: número de alumnos
Cuadro 2: Clasificación de la variables


En algunos de estos casos caben transformaciones; así, una variable cuantitativa continua puede ser “tratada” como discreta, prescindiendo de algunos de los valores posibles; por ejemplo: podemos tomar valores de edad de los alumnos quedándonos con los años y obviando los meses, o tomando años y meses, obviando semanas, días...
Una dificultad añadida se da en el caso de datos cualitativos, como los surgidos de entrevistas, que se desea tratar tanto cualitativa como cuantitativamente. Por ejemplo, en el citado Informe Ábaco, utilizamos el siguiente guión para las entrevistas a personalidades representativas de la sociedad andaluza, tanto en general como del ámbito educativo en particular (Cuadro 3):

Guión para las entrevistas 
¿QUÉ PRETENDEMOS?

Recoger información subjetiva de los encuestados que nos permita conocer:
  •   Una valoración global y genérica sobre la calidad del sistema educativo .
  •   Los aspectos en que fundamenta su valoración (en definitiva: qué entiende por calidad 
    del sistema educativo) 
  •   En qué lugar sitúan el sistema educativo del Estado XX en el contexto de su pais : por debajo, en la media o por encima 
  •   Los aspectos en que, a su juicio, el sistema de su Estado  está mejor y peor que la media
  •   Cuáles son los aspectos, a su juicio, que necesitan una acción de mejora más urgente. 
    Cuáles son, a su juicio, los más difíciles de afrontar 
  •   Las medidas que tomaría en el supuesto de tener plena autoridad, y autoridad efectiva, 
    para mejorar el sistema 
PREGUNTAS A FORMULAR
  1. ¿Cuál es, a su juicio, la valoración global de la calidad de la educación de su Estado ? Trate de calificarla como MUY BUENA, BUENA, ACEPTABLE, REGULAR, MALA
  2. Cuando ha emitido tal valoración, ¿en qué aspectos concretos ha pensado o ha tenido en cuenta? 

2. Los números nos informan, los números dicen cosas

Cuando un sociólogo hace una encuesta sobre intención de voto, obtiene determinados valores que suele traducir a porcentajes para su interpretación.

Cuando un psicólogo aplica un test de autoestima a un grupo de alumnos, asigna a cada uno una puntuación*; esta puntuación oscila entre un suelo y un techo (mínima y máxima), cuyos valores dependen de la regla de medida y de su correspondiente unidad de medida (por ejemplo: un punto por cada respuesta positiva).
Cuando un profesor propone a sus alumnos un examen, asigna a cada uno de ellos una calificación que, del mismo modo, depende del número de ítems o preguntas y de la regla de medida: por ejemplo: número de respuestas acertadas menos número de errores, partido por el número de alternativas ofrecidas menos 1, fórmula habitual para la calificación de las pruebas objetivas (ecuación 1):

  1. Si pone en relación la calidad de la educación en el Estado XX, en general, ¿dónde la sitúa: por encima, por debajo o en la media?
  2. Tal vez haya aspectos en los que la educación en Andalucía pueda situarse de forma diferente en relación con lo de su pais Según su juicio, ¿hay aspectos en los que la Educación en el Estado XX está por encima de la media? ¿Cuáles?. ¿Y por debajo de la media? ¿Cuáles?
  3. ¿Cuáles son los aspectos más necesitados de una mejora urgente? ¿Por qué?¿Cuáles son los aspectos más difíciles de mejorar? ¿Por qué?
  4. Póngase en el supuesto de que tiene autoridad efectiva para cambiar las cosas a mejor. ¿Qué medidas tomaría en primer lugar?¿Cuáles encontrarían una mayor resistencia? ¿Cuáles exigirían una mayor prudencia?
El tratamiento de datos cualitativos es mucho más complejo que el que se da a instrumentos de recogida de datos en los que los sujetos consultados pueden atribuir valor a sus respuestas de acuerdo con determinadas reglas de medida. No es objeto de este curso 0 abordar este punto.


Obviamente, “medir” el rendimiento con un examen de desarrollo multiplica los problemas para decidir cuál es la unidad y, en consecuencia, cuál es el valor a asignar a cada examen.
Veamos algunos casos:
  •   Un cuestionario de 40 preguntas (ítems) en que el encuestado puede marcar SI, NO, NO SÉ.
  •   Una prueba objetiva en la que el profesor decide valorar solo las preguntas bien resueltas.
  •   Otra prueba objetiva en la que el profesor aplica la fórmula anterior, restando los errores teniendo en cuenta que las alternativas ofrecidas son 4.
  •   Una escala de actitud en que para cada ítem el consultado debe marcar su posición entre 1 (mínimo) y 7 (máximo). 
    Parece evidente que si en cada una de esas situaciones una persona obtiene 25 puntos, tal valor no puede interpretarse del mismo modo ni puede significar lo mismo. 
2.1. ¿Cómo interpretar esos valores? El caso de las puntuaciones individuales

Si nos interesa una puntuación individual* (representada por Xi: puntuación directa* del sujeto i) solo nos hacemos una idea de dos maneras: conociendo los valores extremos o poniendo su puntuación en relación con el grupo. Por ejemplo, 9 puntos es un sobresaliente si la prueba se puntúa sobre 10, pero es una puntuación muy baja si lo es sobre 50. Y también es una puntuación baja si la mayoría de las puntuaciones obtenidas por los sujetos del grupo están por encima de los 30 puntos.

Otra forma de interpretar las puntuaciones es a través de determinadas transformaciones de las puntuaciones individuales directas, a ciertas medidas, como puede ser un cuantil. Entre los cuantiles, los más usados son el cuartil, el decil y el centil o percentil; estas medidas nos indican la posición de un sujeto cuando el grupo se ordena en cuatro, diez o cien partes. Así, estar en el cuartil 1 (Q1) es encontrase entre el 25 % inferior del grupo; hallarse en el decil 7 (D7) equivale a superar al 70 % del grupo, y obtener una puntuación equivalente al centil o percentil 78 (C78) viene a ser superar al 78 % del grupo.

Medidas individuales son, también, la puntuación de desviación puntuación diferencial*- representada por x, que no es sino su separación negativa o positiva- en relación con la media del grupo (xi = Xi Media).
Debemos tomar conciencia de la importancia que cobra la regla de medida; con ella atribuimos valor números- a la información recogida con los diferentes instrumentos. Ahora bien: conviene reflexionar sobre el carácter arbitrario que, en muchas ocasiones, tiene la decisión sobre tal regla, y lo que ello representa para el trabajo con tales números.

Así, un sujeto cuya xi = -2 nos indica, de entrada, que puntúa por debajo de la media aritmética* (signo negativo) y, en concreto, que se aparta dos puntos de la misma.

La Edad Mental (EM) es, también una puntuación individual*, y su cociente con la edad cronológica (EC) otra diferente, el Cociente Intelectual (CI): CI = EM / EC.

La EM indica que una persona tiene una inteligencia propia de una determina edad. Por ejemplo, si un niño tiene EM = 9, estamos diciendo que su desarrollo intelectual equivale al de un niño ideal de 9 años; claro está: si tal niño tiene en realidad 12, estamos afirmando que tiene retraso mental, pero si tuviera 8, la interpretación es que es un niño con desarrollo intelectual por encima del propio de su edad. Para una mejor interpretación se ha desarrollado el CI, por lo general multiplicado por 100. De esta forma, un niño de 6 años y EM de 6, tiene un CI = 1, o de 100, si lo multiplicamos por 100. Tanto ese 1 como el 100 nos informan de un niño cuyo desarrollo intelectual es normal, apropiado a su edad cronológica.

Otra medida, que exige previamente el cálculo de medidas de grupo (a las que nos referiremos en seguida), es la puntuación zi; esta puntuación individual es el cociente entre la puntuación diferencial (xi)* de cada persona (puntuación directa menos la media del grupo) y la desviación típica* de este. En resumen, la zi indica en cuántas desviaciones típicas del grupo se aparta un sujeto cualquiera de la media del mismo (ecuación 2). Para entendernos: lo mismo que hablando de distancias utilizamos como unidad el Km., en este caso tomamos con unidad el valor de la desviación típica*.
Entenderemos mejor esto al hablar en su momento de la curva normal de probabilidades*. En efecto: con ella presente sabremos que zi = 0 representa a un sujeto normal, en la media; que zi = -1 es propia de un sujeto que supera al 34 %, mientras que zi = + 1 lo hace con el 84 % aproximadamente.Clarificaremos estos conceptos más adelante.


Medidas individuales son aquellas que se refieren a un solo sujeto; como se ha indicado, su puntuación directa* se representa por Xi. Para interpretar este valor podemos acudir a xi o puntuación diferencial * con respecto a la media; a zi, que indica en cuántas desviaciones típicas se aparta el sujeto de la media aritmética* del grupo; o a los diversos cuantiles (Q, D o P). Existen otras medidas, como la EM o el CI.

2.2. El caso de las puntuaciones en grupo

Si nuestro interés es interpretar las puntuaciones del grupo, y este es pequeño, no resulta difícil hacernos una idea de cómo es ese grupo; sin embargo, cuando es grande, ver las puntuaciones tal y como van apareciendo al ser calificados los exámenes o valorado un test, o recogidas las puntuaciones de un cuestionario... se convierte en algo complejo: los números parecen una realidad confusa e informe, como se aprecia en el siguiente conjunto de datos:

Serie de datos 1:

72, 87, 95, 88, 79, 69, 55, 54, 69, 77, 88, 60, 64, 60, 88, 77, 67, 75, 75, 52, 52, 67, 77, 95, 87, 60, 95, 86, 77, 67, 85, 51, 51, 67, 77, 85, 94, 64, 64, 50,94, 93, 85, 76, 64, 75, 91, 82, 85, 62, 62, 77, 82, 91, 90, 80, 85, 82, 110, 75, 62, 62, 75, 72, 80, 62, 94, 90, 67, 85, 54, 60, 90, 72, 80, 22, 79, 89, 57, 89, 79, 8, 57, 77, 71, 76, 89, 91, 54, 70, 94, 79, 57, 55, 70, 89, 70, 88, 26, 10 N = 100

Ante estos hechos, la Estadística* nos ayuda mediante la organización de los datos, en particular a través de su ordenación y reducción o simplificación

3. Organización de los datos

La primera operación que suele realizarse es la de ordenar los números, las puntuaciones. Una operación tan sencilla como esa nos permite conocer:
Veamos varios casos en una sencilla escala entre 0 y 10: Caso a): 8, 6, 6, 6, 5, 3, 3, 3, 2, 2.
  •   Aquí apreciamos que no aparecen las puntuaciones extremas (9 y 10, 0 y 1)
  •   Que hay valores vacíos: 7 y 4
  •   Que se da una doble acumulación de puntuaciones, una en la parte superior y otra 
    en la inferior (6 y 3, repetidos en tres ocasiones). 
    Caso b): 9, 8, 7, 6, 5, 5, 5, 4, 3, 2 
    En esta ocasión tampoco el grupo presenta puntuaciones a lo largo de todo el recorrido (falta el 10, el 1 y el 0), pero no hay huecos (hay mayor continuidad que en el caso anterior), se da una acumulación en el centro (valor 5) y una notable simetría en torno a la puntuación central. 
    Caso c)
    1, 1, 1, 1, 1, 1, 1, 1, 1, 1 5,5,5,5,5,5,5,5,5,5 9,9,9,9,9,9,9,9,9,9 
    En estos tres ejemplos la distribución es uniforme: todos los sujetos alcanzan la misma puntuación, pero en el primero todas son bajas y en el tercero todas elevadas, frente a al segundo, de puntuaciones medias. 
    Comparemos ahora estas dos: 
    5, 5, 5, 5, 5,5,5,5,5,5 10,10,10,10,10,0,0,0,0,0 

o Las puntuaciones extremas; puestas las puntuaciones individuales en relación con las extremas posibles del cuestionario, de la prueba objetiva,... ya nos ofrecen una información interesante.
o La continuidad o no de las mismas, apreciando si se dan o no valores vacíos, huecos.
o La acumulación o no y en qué parte superior, central o inferior- de la distribución de valores ordenados.

Como vemos, estamos ante la máxima homogeneidad y la máxima heterogeneidad respectivamente. Cuando calculemos las medias aritméticas, veremos que en ambos grupos la media es la misma (5), pero un profesor que tuviera que trabajar con uno u otro grupo debería actuar claramente de formas bien distintas.

Los casos anteriores nos ilustran sobre el valor de una operación tan simple como es la ordenación creciente o decreciente- de las puntuaciones. Fácilmente se comprenderá que esa utilidad es mucho mayor si, en lugar de los 10 casos, tuviéramos ante nosotros 100, 400, 1000...

Pero en ciertos casos, cuando el tamaño es elevado pongamos 100 o más casos- la ordenación es laboriosa y su utilidad queda limitada, como fácilmente se desprende de los datos anteriores que utilizaremos más adelante.

3.1. La reducción. Distribución de frecuencias.

Cuando el conjunto de casos es elevado, como en la anterior serie 1 (el valor de N es de 100) una forma de facilitar la interpretación es mediante la reducción del conjunto a otro menor. El caso más sencillo se da cuando se evita la repetición de las puntuaciones. Estamos hablando de una distribución de frecuencias en la que, por un lado, tenemos las puntuaciones obtenidas (Xi) y, por otra, las veces que cada puntuación aparece en el conjunto de casos (fi).
Así, con los casos a y b del apartado anterior podríamos reducirlos, quedando del siguiente modo 






La forma más sencilla de hacernos cargo de ciertas características de un grupo consiste en ordenarlos de forma creciente o decreciente. Esta sencilla acción nos permite apreciar su recorrido (diferencia entre las puntuaciones extremas), si se da o no continuidad a lo largo del mismo, su dispersión* o variabilidad o la forma* y el lugar en que se agrupan las puntuaciones.

Caso a)
Caso b)
Xi
fi
Xi
fi
8
1
9
1
6
3
8
1
5
1
7
1
3
3
6
1
2
2
5
3
4
1
3
1
2
1
Cuadro 4. Reducción de datos originales a una distribución de frecuencias

Supongamos que hemos realizado un examen, consistente en una prueba objetiva, a un total de 30 alumnos. Las calificaciones, a fin de que sean fácilmente comprensibles, las hemos reducido a la escala 0 - 10, habitual en el ámbito académico. Cabe pensar que estas calificaciones se puedan considerar ordinales e, incluso, de intervalo, dado que disponemos de una unidad de medida razonablemente precisa. 
He aquí los datos (Serie 2):
Xi: 9, 7, 7, 4, 5, 6, 7, 3, 1, 8, 8, 9, 3, 4, 10, 6, 3, 4, 8, 7, 1, 3, 2, 5, 7, 5, 4, 5, 8, 2
Podemos hacer la ordenación de mayor a menor, que ya nos informará de las características de este grupo de alumnos:
Xi: 10, 9, 9, 8, 8, 8, 8, 7, 7,7, 7, 7, 6, 6, 5, 5, 5, 5, 4, 4, 4, 4, 3, 3, 3, 3, 2, 2, 1, 1
Como vemos:
  •   Únicamente nos falta la puntuación 0
  •   Se da continuidad de las puntuaciones

  •   Apreciamos una mayor concentración de puntuaciones elevadas 
    Si reducimos el conjunto de datos, podemos apreciarlo más claramente. Para ello basta construir una distribución de frecuencias. Nótese que entre la serie anterior y la siguiente no se dan sino diferencias de forma pero no de contenido: 
    Tabla 1: Distribución de frecuencias correspondiente a la serie 2 
    Como vemos, las 30 puntuaciones han quedado reducidas a 10 diferentes y la acumulación de las puntuaciones repetidas, tomadas como frecuencias, nos permite una mayor y más fácil comprensión de las características del grupo: 
  1. a)  Heterogéneo
  2. b)  Continuo: no se aprecia discontinuidad entre las puntuaciones
  3. c)  Con tendencia hacia las puntuaciones más elevadas: si tomamos el 5 como suficiente o 
    aprobado, 18 de las 30 lo alcanzan y lo superan. 
  4. d)  Además, en lugar de concentrarse el mayor número de casos en lo que podríamos 
    llamar lo “normal”, esto es: en torno al 5, comprobamos que, además de los de puntuación muy alta (el 9 y el 10), lo que predomina son las puntuaciones elevadas (los notables). 
Estas características son de gran relevancia para un profesor que deba atender las diferencias entre sus alumnos, o para un orientador que tenga que trabajar la autoestima de los mismos.
Los datos anteriores pueden presentarse de forma intuitiva mediante una representación gráfica conocida como histograma* (figura 3) consistente en un eje de coordenadas, con los diferentes valores en el eje de abscisas y con las frecuencias en el de ordenadas.

Figura 3. Histograma correspondiente a los datos de la tabla 1

Sin embargo, todavía es posible una reducción mayor de los datos, algo necesario cuando el rango o recorrido de las puntuaciones (diferencia entre los valores extremos, representado por R) es mayor, como ocurre con los siguientes datos, ya aludidos previamente (serie 1), en donde estamos ante 100 sujetos (N = 100) con puntuaciones que pueden ir de 0 a 130, presentados primero de forma “natural”, desordenada, y luego ordenados en forma decreciente:

Serie desordenada, con las puntuaciones Xi según aparecen al investigador (Serie 1):
72, 87, 95, 88, 79, 69, 55, 54, 69, 77, 88, 60, 64, 60, 88, 77, 67, 75, 75, 52, 52, 67, 77, 95, 87, 60, 95, 86, 77, 67, 85, 51, 51, 67, 77, 85, 94, 64, 64, 50, 94, 93, 85, 76, 64, 75, 91, 82, 85, 62, 62, 77, 82, 91, 90, 80, 85, 82, 110, 75, 62, 62, 75, 72, 80, 62, 94, 90, 67, 85, 54, 60, 90, 72, 80, 22, 79, 89, 57, 89, 79, 8, 57, 77, 71, 76, 89, 91, 54, 70, 94, 79, 57, 55, 70, 89, 70, 88, 26, 10 N = 100

Serie ordenada en forma decreciente, correspondiente a los datos anteriores:
110, 95, 95, 95, 94, 94, 94, 94, 93, 91, 91, 91, 90, 90, 90, 89, 89, 89, 89, 88, 88, 88, 88, 87, 87, 86, 85, 85, 85, 85, 85, 85, 82, 82, 82, 80, 80, 80, 79, 79, 79, 79, 77, 77, 77, 77, 77, 77, 77, 76, 76, 75, 75, 75, 75, 75, 72, 72, 72, 71, 70, 70, 70, 69, 69, 67, 67, 67, 67, 67, 64, 64, 64, 64, 62, 62, 62, 62, 62, 60, 60, 60, 60, 57, 57, 57, 55, 55, 54, 54, 54, 52, 52, 51, 51, 50, 26, 22, 10, 8. N = 100

El rango, en este caso es: R = 110 8 + 1 = 103 puntuaciones diferentes posibles. La mera ordenación ya nos permite ver el amplio recorrido de las mismas, con valores que, por una parte,se acercan a las puntuaciones más extremas (8, cerca del 0, y 110, próximo a la puntuación máxima de 130).



Una distribución original de datos, ordenada o no, puede reducirse por medio de una distribución de frecuencias; en ella se presenta una columna -o una fila- con las diversas puntuaciones, representadas por Xi, y otra con las frecuencias -fi- o veces que cada puntuación se repite.
La representación gráfica adecuada es el histograma.

se acercan a las puntuaciones más extremas (8, cerca del 0, y 110, próximo a la puntuación máxima de 130)
Pero, por otra parte, si reducimos la serie a las puntuaciones directas (Xi) con sus correspondientes frecuencias (fi), como hemos hecho en el caso anterior, podemos apreciar que estamos ante una distribución todavía muy amplia todavía de no fácil apreciación de una forma global e intuitiva: nada menos que 35 valores:







Tabla 2. Distribucion de frecuencias (Amplitud del intervalo = 1) correspondiente a los datos de la serie 1


Por ello es frecuente que la distribución tome la modalidad de intervalos, esto es: se trata de una distribución que nos indica cuantos casos (frecuencias: fi) hay para un conjunto de puntuaciones que denominamos intervalos (I). Lógicamente, las frecuencias serán tanto más elevadas cuanto menor sea el número de intervalos. Por ello hay que decidir con prudencia cuántos intervalos teniendo en cuenta el recorrido del conjunto y la amplitud que queremos dar a cada uno.

A tales efectos, debemos pensar que siempre que hagamos una distribución de intervalos vamos a “deformar” la distribución original en mayor o menor grado, ya que a todas las puntuaciones del intervalo las vamos a representar por una, la que ocupe el lugar central de cada intervalo (marca de clase, representada por Xi, al igual que la puntuación directa). Sin embargo, cabe pensar que las deformaciones en un intervalo en un sentido tenderán a compensarse con las de otros intervalos en sentido contrario. Veamos.

En nuestro caso, la distribución oscila entre 8 y 110 puntuaciones; por tanto, hay (110 8) + 1 puntuaciones posibles; podemos hacer una distribución por intervalos; si tomamos la decisión de que su amplitud sea de 10 puntos, la distribución podría ser la siguiente (Tabla 3):








Tabla 3: Distribución de frecuencias (amplitud del intervalo = 10) correspondiente a los datos de la serie 1.
Como se puede apreciar, esta distribución es mucho más manejable y hasta intuitiva; a simple vista apreciamos:
           Su gran heterogeneida
  •   Su discontinuidad en la parte inferior, con dos grandes huecos de puntuaciones carentes de sujetos (a partir de la puntuación 20 hasta la 40, ambas inclusive). Cabe pensar que los cuatro sujetos inferiores de los dos primeros intervalos de la distribución podrían considerarse ajenos al grueso de grupo.
  •   La tendencia a valores elevados, no solo por el caso que se encuentra en el intervalo superior sino porque las mayores frecuencias se sitúan claramente a la derecha de la misma
  •   Debemos reconocer cierta distorsión. La más clara está en la puntuación superior, 110, que queda disminuida al ser representada por la marca de clase (105.5), al igual que la inferior, 8, que quedará representada por 5.5. Sin embargo, se acepta que en otros casos ocurrirá al contrario y que, en conjunto se compensan. En efecto, la puntuación 22 será representada por 25,5 y la 94 por 95.5.
  •   Además, no debemos olvidar que, en general, estamos trabajando con números que no son totalmente fiables, que su fiabilidad no es total, por lo que la aparente pérdida de precisión no es tal si reconocemos esas limitaciones de los números que utilizamos. 
    Una representación gráfica de estos datos es el histograma*, con una base proporcional a la amplitud del intervalo y una altura relaciona con su frecuencia (fig. 4a): 





Cuando el recorrido de la variable* es muy amplio, es preferible acudir a una distribución por intervalos. En este caso, utilizamos una fila, o una columna para los intervalos y otra para las frecuencias. En teste caso, las frecuencias son las correspondientes a la amplitud de cada intervalo (que comienza medio punto antes de su puntuación inferior y acaba medio punto después de la puntuación superior). Cuando se opera con este tipo de distribuciones, cada intervalo se representa por su marca de clase, Xi, igual que la puntuación directa en el caso de datos no agrupados.
En el caso en que las frecuencias correspondieran a una distribución de frecuencias de variables cualitativas, como pueden ser los diferentes estados civiles o los grados universitarios, la representación se denomina diagrama de barras* (figuras 4.b y 4c).







%
Soltero Casado Separado Viudo
Figura 4b: Diagrama de barras correspondiente a los % de estudiantes según su estado civil
%
Pedagogía Psicología Sociología Ingeniería Económicas Medidina Ciencias Magisterio
Figura 4c: Diagrama de barras correspondiente a los % de estudiantes según el grado

No hay comentarios.:

Publicar un comentario