Video introductorio
1. ¿De dónde salen los números?
Imagine a un investigador en Psicología, Sociología, Pedagogía, Ciencias Económicas,
Medicina... en su oficina o salon de clase. Ha recogido los protocolos de un cuestionario de opinión sobre sus
respectivos objetos de estudio: actitudes hacia los inmigrantes, opiniones políticas, motivación,
niveles de renta, incidencia de un virus... que se acumulan sobre su mesa de trabajo. Puede
tener 100, 200, 1000 o más cuestionarios.
Cuestionario para la mejora de la Educación en el Estado XX
A continuación encontrará una serie de enunciados relacionados con la calidad de la
educación, seguidos de un espacio destinado a recoger el grado de importancia que, a su juicio,
reciben de hecho en el centro educativo en el que presta sus servicios. Su valoración se
expresa entre 1, la mínima, y 4, la máxima. En la siguiente columna deberá marcar si, a su juicio,
es manifiestamente necesario introducir mejoras en tal aspecto.
ITEMS
|
Importancia que
se le concede en
su centro:
|
Necesidad
de mejora
|
||||
1
-
|
2
|
3
|
4
+
|
SI
|
NO
|
|
I. UN PROYECTO EDUCATIVO DEL CENTRO:
|
||||||
1. Que incorpore los valores morales y sociales de consenso
|
||||||
2. Que integre el carácter propio en el caso de los centros
concertados y privados
|
||||||
3. Que analice y tome en consideración las necesidades,demandas y
expectativas de la sociedad actual y, en particular, de su propio
contexto
|
||||||
4. Que tenga en cuenta las características de nuestro tiempo:
globalización, migraciones, interculturalidad, nuevas tecnologías...
|
||||||
5. Que sea conocido por las familias
|
||||||
6. Que sea asumido por las familias, comprometidas con sus valores
|
||||||
7. Que cuente con un sistema de revisión periódica y de puesta al día
|
Cuadro 1: Parte de un cuestionario
¿Cómo pasamos de esos protocolos a los números con los que trabaja la Estadística*?
Esos cuestionarios pueden contener 10, 20, 50... preguntas o ítems que los sujetos pueden
valorar, por ejemplo, asignando un 1 si responde SI, y un 0 cuando marca el NO. Sumando los
valores marcados llegamos a una puntuación* con el número de “sí es” y de “no es”. Del mismo
modo, dado que es posible marcar entre 1 y 4 la valoración de cada ítem, según la importancia
concedida a cada uno de los enunciados, podremos obtener la puntuación* total de cada
persona consultada y hasta la tendencia del grupo, merced a una medida tan conocida como es
la media aritmética.*
Al final, cada uno de tales protocolos se ha convertido en un número, número con el que
trabajará la Estadística. Este número se denomina puntuación directa* y suele representarse por
Xi, esto es: puntuación directa o bruta del sujeto i.
Los números que manejamos nacen de pesar, medir o contar los “objetos” más diversos. Objetos
como la talla, el peso, la edad, la inteligencia, la asertividad, la renta “per cápita”, la autoestima,
el rendimiento académico, la masa muscular, el “ranking” de un país en los Juegos Olímpicos (o
en las pruebas PISA)... son objetos de medida y, mediante los instrumentos adecuados, dan
lugar a números.
1.1. Diferentes tipos de números
Parece claro, no obstante, que, por encima de la apariencia externa de los números -todos son
iguales en su apariencia- en realidad son muy diferentes unos de otros. Los 80 cm. de talla de
un niño poco tienen que ver con los 80 puntos en una prueba de inglés, o los 80 Kg de peso, o el
puesto 80 al llegar a meta, o el número de sujetos -80- que son admitidos a un concurso, o los
80o centígrados alcanzados por un horno, o los 80 puntos obtenidos en una prueba de
autoestima, o...
Cuando hablamos de talla, o de peso, estamos ante los números plenos, además de fiables y
válidos si han sido medidos con cuidado y utilizando un metro y una balanza fiables. Y ello se
debe a que contamos con unidades de la misma naturaleza que el objeto a medir: el centímetro
para la talla o el kg. para el peso, y damos por hecho que quien mide lo hace con seriedad.
Recuerde: la puntuación directa* de un sujeto cualquiera -también llamada “bruta”- en un
instrumento de recogida de datos, se representa por Xi y se lee: puntuación directa del sujeto i.
Aparentemente, los 80o centígrados del horno son de la misma naturaleza que los anteriores,
pero no es así, por una sencilla razón: si antes el 0 significaba que no tenemos delante a nadie
(porque nadie pesa 0 gr. ni mide 0 cm.), ahora, como todos sabemos, por debajo de 0o sigue
habiendo temperatura: -3o, -15o, etc.
También se puede asignar ese número a un corredor de maratón que ha llegado a meta en el
puesto 80. Pero aquí no medimos la distancia recorrida sino el orden de llegada; y puede haber
diferencias notables en minutos o segundos entre las llegadas de los diferentes atletas. Puede
ocurrir que entre el primero y el segundo apenas haya un par de segundos pero que entre este y
el tercero haya más de un minuto, y que, más adelante, entre un grupo de corredores
prácticamente en el mismo tiempo pero distanciados del anterior en 15 o 20 minutos. Pero eso
no importa si lo que medimos es el orden en que entran.
Y, obviamente, el número de 80 de admitidos a un determinado concurso, 35 varones y 45
mujeres por ejemplo, solo nos indica las veces que personas varones y personas mujeres han
sido seleccionadas, sin más.
1.2. Escalas de medida
Pues bien: cada uno de esos 80 representa un tipo diferente de número, propios de diferentes
niveles o escalas de medida: los de razón o cociente, en el primer caso (talla, peso), permiten
todo tipo de operaciones aritméticas; los de intervalo, en el segundo (grados centígrados), con
los que podemos establecer ciertas operaciones pero no otras (no conviene entrar aquí en
detalles); los de orden (puesto ocupado al llegar a meta) nos indican solo lo que es mayor o
menor, anterior o posterior, más o menos intenso..., pero no podemos operar con ellos de otra
manera; o de tipo nominal, que solo nos indican que algo es igual o diferente que otro algo, pero
no podemos hacer operaciones con ellos: asignar un 1 a los varones y un 2 a las mujeres no
significa que estas sean más –o aquellos, menos- que los varones, sino, simplemente,
diferentes. No tendría sentido, por lo tanto, sumar el número de unos y el doses e intentar
calcular la media.
Ahora bien: observe el lector algo importante: hay objetos fácilmente medibles, porque están
abiertos a nuestros sentidos (talla, peso, edad...) y porque tenemos unidades de medida de la
misma naturaleza: cm, gr., año...
Pero hay otros que son, en realidad, objetos cuya misma naturaleza no conocemos y, por ello,
tenemos que definirlos previamente. Pensemos en la inteligencia, en la asertividad, en la
autoestima, en la opinión... y hasta en el rendimiento académico. Nadie ha visto la inteligencia,
pero sí a personas inteligentes, o asertivas, o con baja autoestima, o con rendimiento
adecuado...
Para “medirlas” debemos, en primer lugar, definirlas. A Binet se debe una famosa frase cuando
se le preguntó ¿qué es la inteligencia? Su respuesta fue tan contundente y clara como discutible:
Inteligencia –dijo- es lo que mide mi test. Podríamos decir que, a partir de otros autores de tests
la inteligencia, llegaríamos a diferentes medidas de este rasgo humano (Y así es, por cierto). Y lo
mismo pasará con el rendimiento académico: diferentes exámenes darán lugar a diferentes
resultados, diferentes medidas. Y nada digamos si hablamos de asertividad, de autoestima, de
Un mismo valor numérico puede representar objetos reales o empíricos muy diferentes; según
sean estos objetos, al número que los representa se les podrán aplicar unas u otras propiedades
de los números y sus correspondientes operaciones matemáticas.
esquizofrenia, etc. Una vez definido el objeto, debemos encontrar manifestaciones acordes con
la definición o elaborar reactivos que se consideren evidencias del mismo. Estos reactivos o
estas manifestaciones se convierten en ítems del instrumento de medida. Por lo general, a esta
traducción de la definición a ítems se la llama definición operativa u operacional.
Aquí nos encontramos con serios problemas para encontrar una regla de medida y su
correspondiente unidad de medida y, por tanto, para asignar valores numéricos a la realidad
medida. He aquí un problema que tendrán que conocer en su estudio de la asignatura.
Nosotros dejamos constancia de tal problema, señalando las limitaciones que ello representa
para los números que utilizamos, en particular:
1.3. Variables y escalas de medida
Ciertos “objetos” no presentan manifestaciones diferentes. Se les denomina constantes. Sin
embargo, otros si las tienen, tales y se les denomina variables*; tal es el caso del sexo,
masculino o femenino; del estado civil: soltero, casado, divorciado o viudo; de los grados
universitarios: Pedagogía, Psicología, Sociología, Económicas...; junto a estos, en otros casos
los objetos a medir admiten valores que difieren en cantidad. A las primeras, las denominamos
variables cualitativas*, y se miden con números propios de escalas nominales mientras las
segundas se conocen como cuantitativas*, y admiten números ordinales, de intervalo o de razón.
Las cualitativas pueden presentar dos categorías –dicotómicas*, como en el caso del sexo- o
más, en cuyo caso hablamos de cualitativas politómicas*, como ocurre con el estado civil.
Algunos autores hablan de variables cuasi-cuantitativas*, en las que la cantidad solo puede
apreciarse en términos de orden, por lo que son propias de escalas ordinales. Una variable de
este tipo es la escala de dureza de los cuerpos en la que cada cuerpo está por delante o detrás
de otro según que le raye o sea rayado por él (A Friedrich Mohs se debe una escala de 10
niveles de dureza que van del talco, el más blando, al diamante, al que solo puede rayar otro
diamante).
A su vez, estas variables cuantitativas se dividen en discretas* (variables continuas que solo
admiten valores enteros, como número de hijos o de alumnos) y continuas*, como es la edad, el
peso, la talla...donde podemos asignar todos los valores intermedios si disponemos de los
instrumentos adecuados (una balanza de precisión, por ejemplo; o un cronómetro, como el
utilizado en las pruebas olímpicas de atletismo).
En el cuadro 2 aparece una clasificación de las
variables.
a) Para las operaciones matemáticas que están justificadas con tales números.
b) Para su fiabilidad: los números obtenidos en una ocasión pueden variar en otra
c) Para su validez: podemos estar midiendo una cosa que no es por completo la cosa deseada.
Medir determinados objetos de los ámbitos en que trabajamos – Educación, Economía,
Medicina, Psicología, Sociología...- implica definir el objeto a medir, encontrar manifestaciones
de tal objeto o reactivos adecuados y decidir la regla de medida, la regla que nos permitirá
atribuir un valor a cada manifestación o reactivo unidad de medida).
TIPOS DE VARIABLES
|
ESCALA DE MEDIDA
|
||
Cualitativas
|
Nominales
Dicotómicas: sexo Politómicas: estado civil, clase social, grado universitario... |
||
Cuasi-cuantitativas
|
Ordinales:
|
||
Cuantitativas
|
Continuas: edad, talla, peso
Discretas: número de alumnos
|
||
Cuadro 2: Clasificación de la variables
En algunos de estos casos caben transformaciones; así, una variable cuantitativa continua
puede ser “tratada” como discreta, prescindiendo de algunos de los valores posibles; por
ejemplo: podemos tomar valores de edad de los alumnos quedándonos con los años y obviando
los meses, o tomando años y meses, obviando semanas, días...
Una dificultad añadida se da en el caso de datos cualitativos, como los surgidos de entrevistas,
que se desea tratar tanto cualitativa como cuantitativamente. Por ejemplo, en el citado Informe
Ábaco, utilizamos el siguiente guión para las entrevistas a personalidades representativas de la
sociedad andaluza, tanto en general como del ámbito educativo en particular (Cuadro 3):
Guión para las entrevistas
¿QUÉ PRETENDEMOS?
Recoger información subjetiva de los encuestados que nos permita conocer:
-
Una valoración global y genérica sobre la calidad del sistema educativo .
- Los aspectos en que fundamenta su valoración (en definitiva: qué entiende por calidaddel sistema educativo)
- En qué lugar sitúan el sistema educativo del Estado XX en el contexto de su pais : por debajo, en la media o por encima
-
Los aspectos en que, a su juicio, el sistema de su Estado está mejor y peor que la media
- Cuáles son los aspectos, a su juicio, que necesitan una acción de mejora más urgente.Cuáles son, a su juicio, los más difíciles de afrontar
- Las medidas que tomaría en el supuesto de tener plena autoridad, y autoridad efectiva,para mejorar el sistema
PREGUNTAS A FORMULAR
-
¿Cuál es, a su juicio, la valoración global de la calidad de la educación de su Estado ? Trate de
calificarla como MUY BUENA, BUENA, ACEPTABLE, REGULAR, MALA
- Cuando ha emitido tal valoración, ¿en qué aspectos concretos ha pensado o ha tenido en cuenta?
2. Los números nos informan, los números dicen cosas
Cuando un sociólogo hace una encuesta sobre intención de voto, obtiene determinados
valores que suele traducir a porcentajes para su interpretación.
Cuando un psicólogo aplica un test de autoestima a un grupo de alumnos, asigna a cada uno
una puntuación*; esta puntuación oscila entre un suelo y un techo (mínima y máxima), cuyos
valores dependen de la regla de medida y de su correspondiente unidad de medida (por ejemplo:
un punto por cada respuesta positiva).
Cuando un profesor propone a sus alumnos un examen, asigna a cada uno de ellos una
calificación que, del mismo modo, depende del número de ítems o preguntas y de la regla de
medida: por ejemplo: número de respuestas acertadas menos número de errores, partido por el
número de alternativas ofrecidas menos 1, fórmula habitual para la calificación de las pruebas
objetivas (ecuación 1):
-
Si pone en relación la calidad de la educación en el Estado XX, en general, ¿dónde la sitúa: por
encima, por debajo o en la media?
-
Tal vez haya aspectos en los que la educación en Andalucía pueda situarse de forma
diferente en relación con lo de su pais Según su juicio, ¿hay aspectos en los que la
Educación en el Estado XX está por encima de la media? ¿Cuáles?. ¿Y por debajo de la
media? ¿Cuáles?
-
¿Cuáles son los aspectos más necesitados de una mejora urgente? ¿Por qué?¿Cuáles son
los aspectos más difíciles de mejorar? ¿Por qué?
-
Póngase en el supuesto de que tiene autoridad efectiva para cambiar las cosas a mejor.
¿Qué medidas tomaría en primer lugar?¿Cuáles encontrarían una mayor resistencia?
¿Cuáles exigirían una mayor prudencia?
El tratamiento de datos cualitativos es mucho más complejo que el que se da a instrumentos
de recogida de datos en los que los sujetos consultados pueden atribuir valor a sus
respuestas de acuerdo con determinadas reglas de medida. No es objeto de este curso 0
abordar este punto.
Obviamente, “medir” el rendimiento con un examen de desarrollo multiplica los problemas para
decidir cuál es la unidad y, en consecuencia, cuál es el valor a asignar a cada examen.
Veamos algunos casos:
-
Un cuestionario de 40 preguntas (ítems) en que el encuestado puede marcar SI, NO, NO
SÉ.
-
Una prueba objetiva en la que el profesor decide valorar solo las preguntas bien
resueltas.
-
Otra prueba objetiva en la que el profesor aplica la fórmula anterior, restando los errores
teniendo en cuenta que las alternativas ofrecidas son 4.
- Una escala de actitud en que para cada ítem el consultado debe marcar su posición entre 1 (mínimo) y 7 (máximo).Parece evidente que si en cada una de esas situaciones una persona obtiene 25 puntos, tal valor no puede interpretarse del mismo modo ni puede significar lo mismo.
2.1. ¿Cómo interpretar esos valores? El caso de las puntuaciones
individuales
Si nos interesa una puntuación individual* (representada por Xi: puntuación directa* del sujeto i)
solo nos hacemos una idea de dos maneras: conociendo los valores extremos o poniendo su
puntuación en relación con el grupo. Por ejemplo, 9 puntos es un sobresaliente si la prueba se
puntúa sobre 10, pero es una puntuación muy baja si lo es sobre 50. Y también es una
puntuación baja si la mayoría de las puntuaciones obtenidas por los sujetos del grupo están por
encima de los 30 puntos.
Otra forma de interpretar las puntuaciones es a través de determinadas transformaciones de las
puntuaciones individuales directas, a ciertas medidas, como puede ser un cuantil. Entre los
cuantiles, los más usados son el cuartil, el decil y el centil o percentil; estas medidas nos indican
la posición de un sujeto cuando el grupo se ordena en cuatro, diez o cien partes. Así, estar en el
cuartil 1 (Q1) es encontrase entre el 25 % inferior del grupo; hallarse en el decil 7 (D7) equivale a
superar al 70 % del grupo, y obtener una puntuación equivalente al centil o percentil 78 (C78)
viene a ser superar al 78 % del grupo.
Medidas individuales son, también, la puntuación de desviación –puntuación diferencial*-
representada por x, que no es sino su separación –negativa o positiva- en relación con la media
del grupo (xi = Xi – Media).
Debemos tomar conciencia de la importancia que cobra la regla de medida; con ella
atribuimos valor –números- a la información recogida con los diferentes instrumentos. Ahora
bien: conviene reflexionar sobre el carácter arbitrario que, en muchas ocasiones, tiene la
decisión sobre tal regla, y lo que ello representa para el trabajo con tales números.
Así, un sujeto cuya xi = -2 nos indica, de entrada, que puntúa por debajo de la media aritmética*
(signo negativo) y, en concreto, que se aparta dos puntos de la misma.
La Edad Mental (EM) es, también una puntuación individual*, y su cociente con la edad
cronológica (EC) otra diferente, el Cociente Intelectual (CI): CI = EM / EC.
La EM indica que una persona tiene una inteligencia propia de una determina edad. Por ejemplo, si un niño tiene EM = 9, estamos diciendo que su desarrollo intelectual equivale al de un niño ideal de 9 años; claro está: si tal niño tiene en realidad 12, estamos afirmando que tiene retraso mental, pero si tuviera 8, la interpretación es que es un niño con desarrollo intelectual por encima del propio de su edad. Para una mejor interpretación se ha desarrollado el CI, por lo general multiplicado por 100. De esta forma, un niño de 6 años y EM de 6, tiene un CI = 1, o de 100, si lo multiplicamos por 100. Tanto ese 1 como el 100 nos informan de un niño cuyo desarrollo intelectual es normal, apropiado a su edad cronológica.
La EM indica que una persona tiene una inteligencia propia de una determina edad. Por ejemplo, si un niño tiene EM = 9, estamos diciendo que su desarrollo intelectual equivale al de un niño ideal de 9 años; claro está: si tal niño tiene en realidad 12, estamos afirmando que tiene retraso mental, pero si tuviera 8, la interpretación es que es un niño con desarrollo intelectual por encima del propio de su edad. Para una mejor interpretación se ha desarrollado el CI, por lo general multiplicado por 100. De esta forma, un niño de 6 años y EM de 6, tiene un CI = 1, o de 100, si lo multiplicamos por 100. Tanto ese 1 como el 100 nos informan de un niño cuyo desarrollo intelectual es normal, apropiado a su edad cronológica.
Otra medida, que exige previamente el cálculo de medidas de grupo (a las que nos referiremos
en seguida), es la puntuación zi; esta puntuación individual es el cociente entre la puntuación
diferencial (xi)* de cada persona (puntuación directa menos la media del grupo) y la desviación
típica* de este. En resumen, la zi indica en cuántas desviaciones típicas del grupo se aparta un
sujeto cualquiera de la media del mismo (ecuación 2). Para entendernos: lo mismo que hablando
de distancias utilizamos como unidad el Km., en este caso tomamos con unidad el valor de la
desviación típica*.
Entenderemos mejor esto al hablar en su momento de la curva normal de probabilidades*. En
efecto: con ella presente sabremos que zi = 0 representa a un sujeto normal, en la media; que zi
= -1 es propia de un sujeto que supera al 34 %, mientras que zi = + 1 lo hace con el 84 %
aproximadamente.Clarificaremos estos conceptos más adelante.
Medidas individuales son aquellas que se refieren a un solo sujeto; como se ha indicado, su
puntuación directa* se representa por Xi. Para interpretar este valor podemos acudir a xi o
puntuación diferencial * con respecto a la media; a zi, que indica en cuántas desviaciones típicas
se aparta el sujeto de la media aritmética* del grupo; o a los diversos cuantiles (Q, D o P).
Existen otras medidas, como la EM o el CI.
2.2. El caso de las puntuaciones en grupo
Si nuestro interés es interpretar las puntuaciones del grupo, y este es pequeño, no resulta difícil
hacernos una idea de cómo es ese grupo; sin embargo, cuando es grande, ver las puntuaciones
tal y como van apareciendo al ser calificados los exámenes o valorado un test, o recogidas las
puntuaciones de un cuestionario... se convierte en algo complejo: los números parecen una
realidad confusa e informe, como se aprecia en el siguiente conjunto de datos:
Serie de datos 1:
72, 87, 95, 88, 79, 69, 55, 54, 69, 77, 88, 60, 64, 60, 88, 77, 67, 75, 75, 52,
52, 67, 77, 95, 87, 60, 95, 86, 77, 67, 85, 51, 51, 67, 77, 85, 94, 64, 64, 50,94, 93, 85, 76, 64, 75, 91, 82, 85, 62, 62, 77, 82, 91, 90, 80, 85, 82, 110, 75,
62, 62, 75, 72, 80, 62, 94, 90, 67, 85, 54, 60, 90, 72, 80, 22, 79, 89, 57, 89,
79, 8, 57, 77, 71, 76, 89, 91, 54, 70, 94, 79, 57, 55, 70, 89, 70, 88, 26, 10
N = 100
Ante estos hechos, la Estadística* nos ayuda mediante la organización de los datos, en particular
a través de su ordenación y reducción o simplificación
3. Organización de los datos
La primera operación que suele realizarse es la de ordenar los números, las puntuaciones. Una
operación tan sencilla como esa nos permite conocer:
Veamos varios casos en una sencilla escala entre 0 y 10:
Caso a): 8, 6, 6, 6, 5, 3, 3, 3, 2, 2.
-
Aquí apreciamos que no aparecen las puntuaciones extremas (9 y 10, 0 y 1)
-
Que hay valores vacíos: 7 y 4
- Que se da una doble acumulación de puntuaciones, una en la parte superior y otraen la inferior (6 y 3, repetidos en tres ocasiones).Caso b): 9, 8, 7, 6, 5, 5, 5, 4, 3, 2En esta ocasión tampoco el grupo presenta puntuaciones a lo largo de todo el recorrido (falta el 10, el 1 y el 0), pero no hay huecos (hay mayor continuidad que en el caso anterior), se da una acumulación en el centro (valor 5) y una notable simetría en torno a la puntuación central.Caso c)1, 1, 1, 1, 1, 1, 1, 1, 1, 1 5,5,5,5,5,5,5,5,5,5 9,9,9,9,9,9,9,9,9,9En estos tres ejemplos la distribución es uniforme: todos los sujetos alcanzan la misma puntuación, pero en el primero todas son bajas y en el tercero todas elevadas, frente a al segundo, de puntuaciones medias.Comparemos ahora estas dos:5, 5, 5, 5, 5,5,5,5,5,5 10,10,10,10,10,0,0,0,0,0
o Las puntuaciones extremas; puestas las puntuaciones individuales en relación con
las extremas posibles del cuestionario, de la prueba objetiva,... ya nos ofrecen una
información interesante.
o La continuidad o no de las mismas, apreciando si se dan o no valores vacíos,
huecos.
o La acumulación o no y en qué parte –superior, central o inferior- de la distribución de
valores ordenados.
Como vemos, estamos ante la máxima homogeneidad y la máxima heterogeneidad
respectivamente. Cuando calculemos las medias aritméticas, veremos que en ambos grupos la
media es la misma (5), pero un profesor que tuviera que trabajar con uno u otro grupo debería
actuar claramente de formas bien distintas.
Los casos anteriores nos ilustran sobre el valor de una operación tan simple como es la
ordenación –creciente o decreciente- de las puntuaciones. Fácilmente se comprenderá que esa
utilidad es mucho mayor si, en lugar de los 10 casos, tuviéramos ante nosotros 100, 400, 1000...
Pero en ciertos casos, cuando el tamaño es elevado –pongamos 100 o más casos- la ordenación
es laboriosa y su utilidad queda limitada, como fácilmente se desprende de los datos anteriores
que utilizaremos más adelante.
3.1. La reducción. Distribución de frecuencias.
Cuando el conjunto de casos es elevado, como en la anterior serie 1 (el valor de N es de 100)
una forma de facilitar la interpretación es mediante la reducción del conjunto a otro menor. El
caso más sencillo se da cuando se evita la repetición de las puntuaciones. Estamos hablando de
una distribución de frecuencias en la que, por un lado, tenemos las puntuaciones obtenidas (Xi)
y, por otra, las veces que cada puntuación aparece en el conjunto de casos (fi).
Así, con los casos a y b del apartado anterior podríamos reducirlos, quedando del siguiente modo
Así, con los casos a y b del apartado anterior podríamos reducirlos, quedando del siguiente modo
La forma más sencilla de hacernos cargo de ciertas características de un grupo consiste en
ordenarlos de forma creciente o decreciente. Esta sencilla acción nos permite apreciar su
recorrido (diferencia entre las puntuaciones extremas), si se da o no continuidad a lo largo
del mismo, su dispersión* o variabilidad o la forma* y el lugar en que se agrupan las
puntuaciones.
Caso a)
|
Caso b)
|
||||||||||
Xi
|
fi
|
Xi
|
fi
|
||||||||
8
|
1
|
9
|
1
|
||||||||
6
|
3
|
8
|
1
|
||||||||
5
|
1
|
7
|
1
|
||||||||
3
|
3
|
6
|
1
|
||||||||
2
|
2
|
5
|
3
|
||||||||
4
|
1
|
||||||||||
3
|
1
|
||||||||||
2
|
1
|
Cuadro 4. Reducción de datos originales a una distribución de frecuencias
Supongamos que hemos realizado un examen, consistente en una prueba objetiva, a un total de
30 alumnos. Las calificaciones, a fin de que sean fácilmente comprensibles, las hemos reducido
a la escala 0 - 10, habitual en el ámbito académico. Cabe pensar que estas calificaciones se
puedan considerar ordinales e, incluso, de intervalo, dado que disponemos de una unidad de
medida razonablemente precisa.
He aquí los datos (Serie 2):
He aquí los datos (Serie 2):
Xi: 9, 7, 7, 4, 5, 6, 7, 3, 1, 8, 8, 9, 3, 4, 10, 6, 3, 4, 8, 7, 1, 3, 2, 5, 7, 5, 4, 5, 8, 2
Podemos hacer la ordenación de mayor a menor, que ya nos informará de las características de
este grupo de alumnos:
Xi: 10, 9, 9, 8, 8, 8, 8, 7, 7,7, 7, 7, 6, 6, 5, 5, 5, 5, 4, 4, 4, 4, 3, 3, 3, 3, 2, 2, 1, 1
Como vemos:
-
Únicamente nos falta la puntuación 0
-
Se da continuidad de las puntuaciones
- Apreciamos una mayor concentración de puntuaciones elevadasSi reducimos el conjunto de datos, podemos apreciarlo más claramente. Para ello basta construir una distribución de frecuencias. Nótese que entre la serie anterior y la siguiente no se dan sino diferencias de forma pero no de contenido:Tabla 1: Distribución de frecuencias correspondiente a la serie 2Como vemos, las 30 puntuaciones han quedado reducidas a 10 diferentes y la acumulación de las puntuaciones repetidas, tomadas como frecuencias, nos permite una mayor y más fácil comprensión de las características del grupo:
-
a) Heterogéneo
-
b) Continuo: no se aprecia discontinuidad entre las puntuaciones
- c) Con tendencia hacia las puntuaciones más elevadas: si tomamos el 5 como suficiente oaprobado, 18 de las 30 lo alcanzan y lo superan.
- d) Además, en lugar de concentrarse el mayor número de casos en lo que podríamosllamar lo “normal”, esto es: en torno al 5, comprobamos que, además de los de puntuación muy alta (el 9 y el 10), lo que predomina son las puntuaciones elevadas (los notables).
Estas características son de gran relevancia para un profesor que deba atender las diferencias
entre sus alumnos, o para un orientador que tenga que trabajar la autoestima de los mismos.
Los datos anteriores pueden presentarse de forma intuitiva mediante una representación gráfica
conocida como histograma* (figura 3) consistente en un eje de coordenadas, con los diferentes
valores en el eje de abscisas y con las frecuencias en el de ordenadas.
Figura 3. Histograma correspondiente a los datos de la tabla 1
Sin embargo, todavía es posible una reducción mayor de los datos, algo necesario cuando el
rango o recorrido de las puntuaciones (diferencia entre los valores extremos, representado por
R) es mayor, como ocurre con los siguientes datos, ya aludidos previamente (serie 1), en donde
estamos ante 100 sujetos (N = 100) con puntuaciones que pueden ir de 0 a 130, presentados
primero de forma “natural”, desordenada, y luego ordenados en forma decreciente:
Serie desordenada, con las puntuaciones Xi según aparecen al investigador (Serie 1):
72, 87, 95, 88, 79, 69, 55, 54, 69, 77, 88, 60, 64, 60, 88, 77, 67, 75, 75, 52,
52, 67, 77, 95, 87, 60, 95, 86, 77, 67, 85, 51, 51, 67, 77, 85, 94, 64, 64, 50,
94, 93, 85, 76, 64, 75, 91, 82, 85, 62, 62, 77, 82, 91, 90, 80, 85, 82, 110, 75,
62, 62, 75, 72, 80, 62, 94, 90, 67, 85, 54, 60, 90, 72, 80, 22, 79, 89, 57, 89,
79, 8, 57, 77, 71, 76, 89, 91, 54, 70, 94, 79, 57, 55, 70, 89, 70, 88, 26, 10
N = 100
Serie ordenada en forma decreciente, correspondiente a los datos anteriores:
110, 95, 95, 95, 94, 94, 94, 94, 93, 91, 91, 91, 90, 90, 90, 89, 89, 89, 89, 88,
88, 88, 88, 87, 87, 86, 85, 85, 85, 85, 85, 85, 82, 82, 82, 80, 80, 80, 79, 79,
79, 79, 77, 77, 77, 77, 77, 77, 77, 76, 76, 75, 75, 75, 75, 75, 72, 72, 72, 71,
70, 70, 70, 69, 69, 67, 67, 67, 67, 67, 64, 64, 64, 64, 62, 62, 62, 62, 62, 60,
60, 60, 60, 57, 57, 57, 55, 55, 54, 54, 54, 52, 52, 51, 51, 50, 26, 22, 10, 8.
N = 100
El rango, en este caso es: R = 110 – 8 + 1 = 103 puntuaciones diferentes posibles. La mera
ordenación ya nos permite ver el amplio recorrido de las mismas, con valores que, por una parte,se acercan a las puntuaciones más extremas (8, cerca del 0, y 110, próximo a la puntuación
máxima de 130).
Una distribución original de datos, ordenada o no, puede reducirse por medio de una
distribución de frecuencias; en ella se presenta una columna -o una fila- con las diversas
puntuaciones, representadas por Xi, y otra con las frecuencias -fi- o veces que cada
puntuación se repite.
La representación gráfica adecuada es el histograma.
se acercan a las puntuaciones más extremas (8, cerca del 0, y 110, próximo a la puntuación
máxima de 130)
Pero, por otra parte, si reducimos la serie a las puntuaciones directas (Xi) con sus
correspondientes frecuencias (fi), como hemos hecho en el caso anterior, podemos apreciar que
estamos ante una distribución todavía muy amplia todavía de no fácil apreciación de una forma
global e intuitiva: nada menos que 35 valores:
Tabla 2. Distribucion de frecuencias (Amplitud del intervalo = 1) correspondiente a los datos
de la serie 1
Por ello es frecuente que la distribución tome la modalidad de intervalos, esto es: se trata de una
distribución que nos indica cuantos casos (frecuencias: fi) hay para un conjunto de puntuaciones
que denominamos intervalos (I). Lógicamente, las frecuencias serán tanto más elevadas cuanto
menor sea el número de intervalos. Por ello hay que decidir con prudencia cuántos intervalos
teniendo en cuenta el recorrido del conjunto y la amplitud que queremos dar a cada uno.
A tales efectos, debemos pensar que siempre que hagamos una distribución de intervalos vamos
a “deformar” la distribución original en mayor o menor grado, ya que a todas las puntuaciones del
intervalo las vamos a representar por una, la que ocupe el lugar central de cada intervalo (marca
de clase, representada por Xi, al igual que la puntuación directa). Sin embargo, cabe pensar que
las deformaciones en un intervalo en un sentido tenderán a compensarse con las de otros
intervalos en sentido contrario. Veamos.
En nuestro caso, la distribución oscila entre 8 y 110 puntuaciones; por tanto, hay (110 – 8) + 1
puntuaciones posibles; podemos hacer una distribución por intervalos; si tomamos la decisión de
que su amplitud sea de 10 puntos, la distribución podría ser la siguiente (Tabla 3):
Tabla 3: Distribución de frecuencias (amplitud del intervalo = 10) correspondiente a los datos de la serie 1.
Como se puede apreciar, esta distribución es mucho más manejable y hasta intuitiva; a simple
vista apreciamos:
Su gran heterogeneida
-
Su discontinuidad en la parte inferior, con dos grandes huecos de puntuaciones carentes
de sujetos (a partir de la puntuación 20 hasta la 40, ambas inclusive). Cabe pensar que
los cuatro sujetos inferiores de los dos primeros intervalos de la distribución podrían
considerarse ajenos al grueso de grupo.
-
La tendencia a valores elevados, no solo por el caso que se encuentra en el intervalo
superior sino porque las mayores frecuencias se sitúan claramente a la derecha de la
misma
-
Debemos reconocer cierta distorsión. La más clara está en la puntuación superior, 110,
que queda disminuida al ser representada por la marca de clase (105.5), al igual que la
inferior, 8, que quedará representada por 5.5. Sin embargo, se acepta que en otros
casos ocurrirá al contrario y que, en conjunto se compensan. En efecto, la puntuación 22
será representada por 25,5 y la 94 por 95.5.
- Además, no debemos olvidar que, en general, estamos trabajando con números que no son totalmente fiables, que su fiabilidad no es total, por lo que la aparente pérdida de precisión no es tal si reconocemos esas limitaciones de los números que utilizamos.Una representación gráfica de estos datos es el histograma*, con una base proporcional a la amplitud del intervalo y una altura relaciona con su frecuencia (fig. 4a):
Cuando el recorrido de la variable* es muy amplio, es preferible acudir a una distribución
por intervalos. En este caso, utilizamos una fila, o una columna para los intervalos y otra
para las frecuencias. En teste caso, las frecuencias son las correspondientes a la
amplitud de cada intervalo (que comienza medio punto antes de su puntuación inferior y
acaba medio punto después de la puntuación superior). Cuando se opera con este tipo
de distribuciones, cada intervalo se representa por su marca de clase, Xi, igual que la
puntuación directa en el caso de datos no agrupados.
%
Soltero
Casado
Separado
Viudo
Figura 4b: Diagrama de barras correspondiente a los % de estudiantes según su estado civil
%
Pedagogía
Psicología
Sociología
Ingeniería
Económicas
Medidina
Ciencias
Magisterio
Figura 4c: Diagrama de barras correspondiente a los % de estudiantes según el grado
No hay comentarios.:
Publicar un comentario