viernes, enero 27, 2012

Y yo me pregunto...

¿Cómo alguien así puede llegar a la universidad? De un trabajo de un alumno, donde describe el transcurso de una clase:
Ha entrado el profesor en clase, y una alumna la dicho que le explicado como estaba organizado todo y la dicho el profesor que eso ya lo había explicado en una sesión que no tenia porque haber dado clase y la dado en horas que el profesor no tenia porque haber dado y se ha cabreado la alumna y luego ya nos ha comentado el profesor lo de la fecha de examen y haber si decidíamos cuando por que le han dicho en enero.
Notas:
a) No, no es la norma entre el alumnado esta forma de escribir.
b) Sí, la capacidad para expresar ideas es un problema para muchos alumnos.

miércoles, junio 29, 2011

Factor de impacto 2010 ya disponible


¿Sirve el factor de impacto para lo que se usa en España? No. ¿Se pide cada vez más? Sí. Pues a bailar con la música que nos ponen.

martes, junio 14, 2011

Manifiesto a favor de una psicopatología clínica, que no estadística

Pequeño fisking de un manifiesto que va dando vueltas por ahí. Seguro que en otras disciplinas no tienen que lidiar con estas tonterías...
Mediante el presente escrito, los profesionales e instituciones abajo firmantes (en el manifiesto original no hay listado de abajofirmantes), nos manifestamos a favor de criterios clínicos de diagnosis, y por lo tanto en contra de la imposición del Manual Diagnóstico y Estadístico de los Desórdenes Mentales de la American Psychiatric Association como criterio único en la clínica de las sintomatologías psíquicas. (La cosa ya empieza mal. ¿Quién impone el DSM? Éste es un recurso clínico que cuenta con gran aceptación y prestigio. Su uso está extendido porque permite a clínicos, investigadores y administración emplear un lenguaje común. También, porque sigue las reglas del método científico: investigación continuada, minimización de criterios de autoridad, empirismo... Nadie, salvo para algún informe pericial o alguna aseguradora, obliga el uso del DSM. En Psicología, por desgracia, si uno quiere basar su práctica clínica en posos de té puede legalmente hacerlo)

Queremos compartir, debatir y consensuar el conocimiento clínico -logía- sobre el pathos psíquico -padecimiento sintomático, que no enfermedad- a fin de cuestionar la existencia de una salud psíquica, estadística o normativa, así como la impostura clínica e intelectual del desorden, trastorno, enfermedad mental. (Interesante. El DSM sale de compartir -publicaciones científicas, borradores-, debatir -respuestas a todos esto- y consensuar -metaanálisis, grupos de trabajo- el trabajo de múltiples clínicos y grupos de investigación. La base de datos Web of Science, ante la búsqueda "Topic=(dsm-v)", la versión todavía no cerrada del próximo DSM, da 917 resultados. Casi mil documentos de algo todavía por aprobarse. Ya verán ustedes cuando se haya lanzado) También queremos denunciar la imposición del tratamiento único -terapias tipificadas para trastornos formateados- por el menosprecio que supone a las diferentes teorías y estrategias terapéuticas (Lo que muchos deseamos es que entre los tratamientos disponibles estén únicamente aquellos con apoyo teórico y empírico; que aquellos que o nunca funcionaron o han sido superados por otros sean definitivamente descartados. Esto no supone imponer un tratamiento único. Primero, la gente que se mantiene en prácticas clínicas obsoletas sigue teniendo posibilidad legal para ello. Segundo, aquellos psicólogos con conocimientos actualizados tienen claro que, para multitud de diagnósticos, no hay un solo tratamiento con aval empírico y que el tratamiento a emplear depende de características del cliente más allá simplemente su diagnóstico), y a la libertad de elección de los pacientes (No hay libertad sin conocimiento. Los clientes tienen derecho a saber si el tratamiento que se les ofrece es el mejor disponible, si va a ser básicamente con la nada o si va a ser incluso contraterapéutico. Y en ámbitos de salud pública, el tema se complica. ¿Sería aceptable que en el hospital más próximo cambiaran la quimio por acupuntura porque todas las estrategias han de tener cabida? ¿Sería esto ampliar la libertad del paciente?). En el momento actual, asistimos al devenir de una clínica cada vez menos dialogante, más indiferente a las manifestaciones del padecimiento psíquico, aferrada a los protocolos y a tratamientos exclusivamente paliativos para las consecuencias, y no para sus causas (La búsqueda de la causa... la gran excusa para eternizar la terapia. Imagine que usted tiene VIH. No sabe bien si es por haberse inyectado heroína con una jeringuilla infectada, por haber mantenido relaciones sexuales de riesgo, por una transfusión en un país sin garantías para estos casos... No le dan retrovirales -o lo que sea más oportuno- hasta tener claro el motivo exacto. Y que, una vez visto que es por la jeringa, no le dan retrovirales hasta no saber por qué se drogaba... Las causas, para una parte importantísima de los tratamientos, son triviales). Tal y como dice G. Berrios (2010) «Nos enfrentamos a una situación paradójica en la que se les pide a los clínicos que acepten un cambio radical en la forma de desarrollar su labor, (ej. abandonar los consejos de su propia experiencia y seguir los dictados de datos estadísticos impersonales) cuando en realidad, las bases actuales de la evidencia no son otras que lo que dicen los estadísticos, los teóricos, los gestores, las empresas (como el Instituto Cochrane) y los inversores capitalistas que son precisamente aquellos que dicen donde se pone el dinero». (Porque, claro, lo que le parece a uno mismo es mucho mejor que el consenso entre muchos) En consecuencia, manifestamos nuestra defensa de un modelo sanitario, donde la palabra sea un valor a promover y donde cada paciente sea considerado en su particularidad. (La psicología basada en pruebas es completamente compatible con la particularización de los tratamientos. Siempre y cuando esa personalización cuente con apoyo. A mayor conocimiento clínico, más variables entran en el modelo -más allá del diagnóstico- para determinar qué tratamiento seguir) La defensa de la dimensión subjetiva implica una confianza en lo que cada uno pone en juego para tratar aquello que en él mismo se revela como insoportable, extraño a sí mismo, pero sin embargo familiar. Manifestamos nuestra repulsa a las políticas asistenciales que persiguen la seguridad en detrimento de las libertades y los derechos. A las políticas que, con el pretexto de las buenas intenciones y de la búsqueda del bien del paciente, lo reducen a un cálculo de su rendimiento, a un factor de riesgo o a un índice de vulnerabilidad que debe ser eliminado, poco menos que a la fuerza. (Palabras, palabras que no dicen nada. Esta gente sí que reduce al cliente a la nada, porque su ego -personal y teórico- prevalece sobre el interés del enfermo)
Pueden seguir leyendo al manifiesto aquí. Yo ya he cubierto mi dosis de tonterías.

miércoles, febrero 16, 2011

La percepción extrasensorial en una revista de la APA

Bem, D. J. (En prensa). Feeling the future: Experimental evidence for anomalous retroactive influences on cognition and affect. Journal of Personality and Social Psychology. [doi] [pdf]

Nota. Esta revista está editada por la asociación de Psicología más importante del mundo y va por el volumen 100. No es, ni mucho menos, una revista de vaya usted a saber dónde.

Resumen:
The term psi denotes anomalous processes of information or energy transfer that are currently unexplained in terms of known physical or biological mechanisms. Two variants of psi are precognition (conscious cognitive awareness) and premonition (affective apprehension) of a future event that could not otherwise be anticipated through any known inferential process. Precognition and premonition are themselves special cases of a more general phenomenon: the anomalous retroactive influence of some future event on an individual's current responses, whether those responses are conscious or nonconscious, cognitive or affective. This article reports 9 experiments, involving more than 1,000 participants, that test for retroactive influence by “time-reversing” well-established psychological effects so that the individual's responses are obtained before the putatively causal stimulus events occur. Data are presented for 4 time-reversed effects: precognitive approach to erotic stimuli and precognitive avoidance of negative stimuli; retroactive priming; retroactive habituation; and retroactive facilitation of recall. The mean effect size (d) in psi performance across all 9 experiments was 0.22, and all but one of the experiments yielded statistically significant results. The individual-difference variable of stimulus seeking, a component of extraversion, was significantly correlated with psi performance in 5 of the experiments, with participants who scored above the midpoint on a scale of stimulus seeking achieving a mean effect size of 0.43. Skepticism about psi, issues of replication, and theories of psi are also discussed.

Ejemplo de experimento:

Experiment 1: Precognitive Detection of Erotic Stimuli

[...]

One hundred Cornell undergraduates, 50 women and 50 men, were recruited for this experiment using the Psychology Department’s automated online sign-up system. They either received one point of experimental credit in a psychology course offering that option or were paid $5 for their participation. Both the recruiting announcement and the introductory explanation given to participants upon entering the laboratory informed them that
this is an experiment that tests for ESP [percepción extrasensorial]. It takes about 20 minutes and is run completely by computer. First you will answer a couple of brief questions. Then, on each trial of the experiment, pictures of two curtains will appear on the screen side by side. One of them has a picture behind it; the other has a blank wall behind it. Your task is to click on the curtain that you feel has the picture behind it. The curtain will then open, permitting you to see if you selected the correct curtain. There will be 36 trials in all. Several of the pictures contain explicit erotic images (e.g., couples engaged in nonviolent but explicit consensual sexual acts). If you object to seeing such images, you should not participate in this experiment.
[...]

Each session of the experiment included both erotic and nonerotic pictures randomly intermixed, and the main psi hypothesis was that participants would be able to identify the position of the hidden erotic picture significantly more often than chance (50%). The hit rate on erotic trials can also be compared with the hit rates on the nonerotic trials to test whether there is something unique about erotic content in addition to its positive valence and high arousal value.

[...]

Across all 100 sessions, participants correctly identified the future position of the erotic pictures significantly more frequently than the 50% hit rate expected by chance: 53.1%, t(99) = 2.51, p = .01, d = 0.25. In contrast, their hit rate on the nonerotic pictures did not differ significantly from chance: 49.8%, t(99) = -0.15, p = .56. This was true across all types of nonerotic pictures: neutral pictures, 49.6%; negative pictures, 51.3%; positive pictures, 49.4%; and romantic but nonerotic pictures, 50.2%. (All t values tdiff(99) = 1.85, p = .031, d = 0.19. Because erotic and nonerotic trials were randomly interspersed in the trial sequence, this significant difference also serves to rule out the possibility that the significant hit rate on erotic pictures was an artifact of inadequate randomization of their left/right positions.
Como ustedes comprenderán, el artículo, todavía en prensa, ya he generado una enorme reacción. De hecho, ha conseguido que la discusión entre estadística frecuentista y bayesiana llegue a las páginas de New York Times.

¿Mi opinión? Ah, si tuviera tiempo ahora mismo para tener opiniones... Pero no quería dejar de darles noticia sobre esta serie de experimentos.

miércoles, febrero 09, 2011

Desde el decanato notifican...

Desde el decanato notifican que, a partir de ahora, los exámenes ya no se llamarán "exámenes", porque esta palabra agobia a los estudiantes. A partir de ahora, el nombre apropiado es "evaluaciones".

viernes, enero 21, 2011

De la irrelevancia de los psicólogos

¿Cuál es la rama del conocimiento o ciencia especializada en la conducta humana?
La Psicología.

¿Quiénes son, por tanto, los profesionales especializados en conducta humana?
Los psicólogos.

¿Quiénes son los profesionales con mejor preparación para la modificación de conducta?
Los psicólogos.

¿Son los hábitos de conducta una forma de conducta?
Sí.

¿Es el consumo de tabaco y la adicción al mismo un hábito de conducta?
Sí.

Así, ¿quiénes son los profesionales mejor preparados para ayudar a reducir o abandonar el hábito de consumo de tabaco?
Los psicólogos.

¿Cuál es el papel social que han asumido los psicólogos con la nueva ley antitabaco?
Irrelevante.

Con la polvareda de la nueva ley y todo lo que se ha hablado sobre ella en los medios de comunicación, ¿es la gente más consciente ahora que antes de que los profesionales a los que acudir buscando ayuda para dejar de fumar son los psicólogos?
No.

domingo, agosto 15, 2010

¿Y si los semáforos fueran dañinos para la seguridad?

¿Y si lo que parecía de puro sentido común, los semáforos, resulta que es una mala idea?
Politicians often sneer at libertarians, saying, "You want to get rid of traffic lights?!" Well, yes, actually. In some cases, traffic moves better and more safely when government removes traffic lights, stop signs, even curbs.

It's Friedrich Hayek's "spontaneous" order in action: Instead of sitting at a mechanized light waiting to be told when to go, drivers meet in an intersection and negotiate their way through by making eye contact and gesturing. The secret is that drivers must pay attention to their surroundings—to pedestrians and other cars—rather than just to signs and signals. It demonstrates the "Peltzman Effect" (named after retired University of Chicago economist Sam Peltzman): People tend to behave more recklessly when their sense of safety is increased. By removing signs, lights and barriers, drivers feel less safe, so they drive more carefully. They pay more attention.

In Drachten, Holland, lights and signs were removed from an intersection handling about 30,000 cars a day. Average waiting times dropped from 50 seconds to less than 30 seconds. Accidents dropped from an average of eight per year to just one.

On Kensington High Street in London, after pedestrian railing and other traffic markers were removed, accidents dropped by 44 percent.

"What these signs are doing is treating the driver as if they were an idiot," says traffic architect Ben Hamilton-Baillie. "If you do so, drivers exhibit no intelligence."

Once again, freedom and responsibility triumph. (John Stossel, Reason, 05/08/10). [vía]

martes, junio 29, 2010

Otros blogs van a Menéame; éste va a al Journal of the American Society for Information Science and Technology

García-Pérez, M. A. (En prensa). Accuracy and completeness of publication and citation records in the Web of Science, PsycINFO, and Google Scholar: A case study for the computation of h indices in Psychology. Journal of the American Society for Information Science and Technology. [link].
[T]he validity of journal impact factors for any purpose whatsoever has recently been questioned because the method by which they are computed is neither transparent nor reproducible (Brumback, 2008a, 2008b; Carrió, 2008; Hernán, 2008; Joseph&Hoey, 1999; Porta & Álvarez-Dardet, 2008; Rogers, 2002; Rossner, van Epps & Hill, 2007, 2008; Seglen, 1997b; The PLoS Medicine Editors, 2006; Wilcox, 2008) and also because of the ease with which journal impact factors can be manipulated (Agrawal, 2005; Brumback, 2009; Cameron, 2005; Della Sala & Brooks, 2008; Falagas &Alexiou, 2007, 2008; Lavie, 2009; Opatrný, 2008; Reedijk & Moed, 2008; Schutte & Švec, 2007; Seglen, 1997b; Sevinc, 2004; Topo Universitario, 2008; van Diest, Holzel, Burnett, & Crocker, 2001; Yu &Wang, 2007). [pág. 1 del preprint)]

La cita es a esta anotación.

domingo, junio 27, 2010

Sobre la Clínica Tibidado y las terapias de conversión

Expedientada una clínica por 'curar' la homosexualidad

La Generalitat catalana ha abierto un expediente a una clínica de Barcelona por aplicar terapias para curar la homosexualidad. Los responsables de Policlínica Tibidabo ofrecen a sus pacientes, presuntamente, pastillas y tratamientos psiquiátricos para que dejen de ser gays. "No existe evidencia científica que sostenga que la homosexualidad deba ser tratada como una enfermedad, al margen de ideologías personales", aseguró ayer la consejera de Salud, Marina Geli, que investigará si otros centros psiquiátricos también aplican soluciones médicas a la orientación sexual. (El País, 15/06/10).
Para empezar, lo que es enfermedad o no jamás lo determinará la evidencia científica. La normalidad y lo aceptable son fruto de consensos sociales y detrás de ellos, sin mucho rascar, se encuentran valores. La homosexualidad salió del Diagnostic and Statistical Manual of Mental Disorders gracias a la presión de colectivos gays y, principalmente, porque era de sentido común (el sentir común)¹.

Segundo, el que algo sea tratado con pastillas no implica que sea considerado una enfermedad. El tener más de setenta y cinco años, hombre y con problemas de erección no es ninguna enfermedad, pero sí que existen tratamientos con pastillas para esta circunstancia. El igualar tratamiento médico a enfermedad es tener una concepción muy reducida del papel de los facultativos.

Tirando de lógica simple, dos son las opciones que le podemos ofrecersi a consulta psicológica o médica llega una persona que está insatisfecha con ser homosexual (o con tener poco pecho, o con ser albino...), : facilitar el cambio o ayudar a que acepte lo que hay. El pequeño gran detalle, el caso de la homosexualidad, es:
What About So-Called "Conversion Therapies"?

Some therapists who undertake so-called conversion therapy report that they have been able to change their clients' sexual orientation from homosexual to heterosexual. Close scrutiny of these reports, however. show several factors that cast doubt on their claims. For example, many of these claims come from organizations with an ideological perspective that condemns homosexuality. Furthermore, their claims are poorly documented; for example, treatment outcome is not followed and reported over time, as would be the standard to test the validity of any mental health intervention.
Dicho de otro modo: hoy por hoy no hay terapia efectiva para cambiar la orientación sexual. Quien la ofrezca, está vendiendo humo. Está generando expectativas en sus clientes que no podrá satisfacer. Está demostrando que, o no conoce los más recientes desarrollos de su disciplina, o es un estafador.

¿Están de acuerdo hasta aquí? Si su respuesta es afirmativa, por favor, justifiquen por qué no cargan contra la Clínica Tibidado (y tantas más) por ofrecer tratamientos homeopáticos (inútiles), multitud de médicos que ofrecen dietas protéicas (inútiles) y demás intervenciones en el ámbito de salud que, no es que no estén sustentadas por datos, sino que las pruebas muestran claramente que son inútiles. Hay muchos, muchos profesionales que no se leen ni una sola revista, que en su vida se han visitado la Biblioteca Cochrane o similares, para los que la salud ya no es tema de ciencia, sino de 'intuición ilustrada'. Gente que hace daño (y el límite superior del daño en salud ya saben cuál es), que hacer perder dinero... y que puede dormir tan tranquilos porque no pretenden curar la homosexualidad.

¹ Por no dejar espacio a dudas, comparto este sentido común según el cual la homosexualidad no es una enfermedad. Me cuesta mucho imaginar argumentos racionales para defender lo contrario. Pero mis argumentos sobre la no-enfermedad están basados en valores, no en ciencia.

miércoles, junio 23, 2010

Yo conozco al amigo del primo del Consejero - Un comentario al Informe de Resultados de la Evaluación General de Diagnóstico 2009

Según el análisis de los datos obtenidos por MAGISTERIO de los 50 centros valencianos evaluados por el Instituto de Evaluación ... [ver P. S.]
Los datos de la EGD-2009 no son públicos. Las personas interesadas en la evaluación educativa tenemos que hacer un acto de fe en que han sido analizados correctamente y no podemos plantearnos preguntas adicionales a las que se plantean desde el Instituto de Evaluación.



¿Han sido analizados correctamente?

Sabemos que hay análisis incorrectos. Por ejemplo, no se realizan comparaciones múltiples de medias, sino comparaciones dos a dos, disparando el riesgo de cometer errores. Incluso esas comparaciones a pares están mal hechas. Igualmente, sabemos que el modelo de Rasch es erróneo cuando un grupo de ítems comparten un enunciado. En ese caso, se incumple el supuesto de independiencia local y es necesario modelar la correlación entre especificidades de los items con un parámetro adicional. En este caso el coeficiente alfa de Cronbach es un indicador inadecuado de la fiabilidad de la escala.

En otros temas, nos quedan dudas. Para una parte importante de los resultados presentados, desconocemos las técnicas estadísticas empleadas. El campo de la medición en educación no es estático. No se ha llegado al punto de que haya unos pocos métodos conocidos y reconocidos como los mejores y los que siempre hay que aplicar. Hay varias revistas especializadas: Applied Measurement in Education, Applied Psychological Measurement, Educational and Psychological Measurement, Journal of Educational and Behavioral Statistics, Journal of Educational Measurement. Sólo una información detallada del método de análisis permite evaluar si se han incorporado las métodos que han demostrado mejor funcionamiento. Uno no puede despacharse el tema de funcionamiento diferencial diciendo "el procedimiento empleado fue la comparación del parámetro de dificultad de los ítems dentro de los grupos de contraste" (pág. 36). ¿Método de Raju o de Thissen? ¿Sólo se tuvo en cuenta la significación estadística o también el tamaño del efecto?

Respecto al funcionamiento diferencial de los items, sorprenden enormemente comentarios como éste: "Los resultados del País Vasco en la competencia en el conocimiento y la interacción con el mundo físico no aparecen dentro del gráfico por un funcionamiento diferencial en los ítems de la versión euskera" (pág. 66). En los informes internacionales, como el PISA, se consigue comparar a multitud de países, muchos de ellos con disparidad lingüística igual o mayor a la que puede encontrarse entre el español y el vasco. ¿Cómo es posible que el Instituto de Evaluación haya fallado en esto? No sabemos si fallan todos los ítems, en qué medida lo hacen, si se salvan algunas preguntas que pudieran permitir establecer una métrica común...



¿Preguntas adicionales?

Y aquí el origen de esta anotación. Son muchos/varios/algunos los investigadores que desearían realizar una explotación de los datos buscando respuestas a nuevas preguntas o intentando comprobar que las respuestas previas están bien fundamentadas. Pero sólo algunos podrán.

Ahora vendrá el bonito de juego de "yo conozco a...", "a ti te paso la base de datos porque sé que tus preguntas van a llevarte las respuestas que yo quiero" o "¿qué me das a cambio de...?". Ésta es la idea de transparencia, de fomento de la investigación o de políticas sociales basadas en pruebas que tienen nuestros políticos y gestores.

No hacer públicos los datos me parece una tomadura de pelo. Que ya empiece a haber reanálisis de gente a la que sí que le han pasado los datos me parece otra tomadura de pelo.



P. S. (23/06 - 18:40). Mis disculpas a Pablo Rovira, el periodista autor de la noticia de Magisterio. He tenido muy poco tacto al titular esta entrada, de tal modo que puede entenderse que acuso al Sr. Rovira de 'malas artes' o de servilismo para conseguir los datos. Jamás fue mi intención.

Quería criticar que, al no publicar los datos, se abren unos (posibles) modos pocos claros para hacerse con ellos. No critico a quienes los consigan, sino a quienes los tienen y no los distribuyen. Obviamente, la labor de un periodista implicado con su profesión es intentar obtenerlos y no tengo razón para cuestionar el modo como ha llegado a ellos el Sr. Rovira.

jueves, junio 17, 2010

Intervalos de confianza y comparación de medias - Un comentario al Informe de Resultados de la Evaluación General de Diagnóstico 2009

Gracias al blog de José Manuel Lacasa me entero de que ha salido el informe de resultados de la Evaluación General de Diagnóstico 2009. La tentación es demasiado grande y, pese a que el trabajo me desborda (incluyendo concurso en semana y media de Ayudante Doctor), me lanzo a revisar el informe.

Comentaré un solo punto, de corte técnico-estadístico. En la página 62 del informe puede leerse:
entre todas las comunidades con puntuaciones medias próximas (con diferencias tales que sus intervalos de confianza coinciden en parte) nada se puede decir sobre el “orden” que unas tienen con respecto a otras.
Traducido: cuando el intervalo de confianza de dos medias se solapa, la diferencia entre ambas no es estadísticamente significativa.

Lástima que esta frase sea falsa. Los lectores interesados pueden consultar, entre otros:
  • Austin, P. C, & Hux, J. E. (2002). A brief note on overlapping confidence intervals. Journal of Vascular Surgery, 36,194-195.
  • Cumming, G, & Finch, S. (2005). Inference by eye: Confidence intervals and how to read pictures of data. American Psychologist, 60,170-180.
  • Schenker, N, & Gentleman, J. F. (2001). On judging the significance of differences by examining the overlap between confidence intervals. The American Statistician, 55, 182-186.
  • Wolfe, R, & Hanley, J. (2002). If we‘re so different why do we keep overlapping? When 1 plus 1 doesn‘t make 2. Canadian Medical Association Journal, 166, 65-66.
Tal y como apuntaban un par de investigadores en el título de un artículo Researchers misunderstand confidence intervals and standard error bars.

Un ejemplo servirá para ilustrar cómo dos intervalos de confianza pueden solaparse y, pese a ello, que la diferencia de medias sea estadísticamente significativa. Los datos los tienen aquí. Se trata de una misma variable medida en dos grupos diferentes, con 25 observaciones por grupo.
  • El grupo 0 tiene una media de 500, con un intervalo de confianza al 95% entre 415.7 y 584.3.
  • El grupo 1 tiene una media de 650, con un intervalo de confainza el 95% entre 565.7 y 734.3. El grupo 1 es el resultado de sumar 150 a cada observación del Grupo 0.
Aquí un gráfico donde se recoge la misma información y se ve cómo los intervalos de confianza se superponen.

Cuando realizamos una comparación de medias de dos muestras independientes, encontramos que... p = 0.01241 < 0.05. Luego rechazamos la hipótesis nula y podemos afirmar que la diferencia entre las dos medias es estadísticamente significativa.

Sirva esto como ejemplo de que, una vez más, el Instituto de Evaluación analiza los datos con un rigor por debajo de lo esperable. En el Instituto de Evaluación tienen lagunas estadísticas y psicométricas que les impiden tomar las mejores decisiones de análisis en cada momento y que, en algunas ocasiones, les llevan a conclusiones dudosas.

Ciertamente, esto no es importante, por un motivos bien sencillos:
  • El informe es políticamente irrelevante. Este país ha renunciado a una política educativa basada en la evidencia. ¿Acaso creen que tendrá algún efecto el que en el informe se diga, explícitamente, que un mayor uso de las nuevas tecnologías no mejora el rendimiento? ¿O que los colegios privados consiguen resultados equivalentes a los públicos (una vez controlado el efecto del origen socio-económico-cultural de los estudiantes) pero con un ratio alumnos/profesor muy superior, esto es, que los colegios privados son más eficientes?
  • El informe no pregunta lo importante. El informe pregunta por todo lo que no podemos controlar: dónde estudia la gente, qué han estudiado sus padres, dónde nacieron... Pero no se entra en qué modos docentes llevan a qué resultados. No podemos saber si tal filosofía educativa es mejor que otra, porque no entra en el cuestionario. Y es mucho más sencillo enseñar el mejor modo de dar clases que mutar a los inmigrantes en nacionales.
Vuelvo a mi agujero.

jueves, marzo 25, 2010

Tamaño del aula y rendimiento escolar

Del informe Los determinantes del éxito en la educación primaria en España (marzo/2010), de Brindusa Anghel y Antonio Cabrales, para la Fundación de Estudios de Economía Aplicada.
Por lo que respecta a las variables de ámbito escolar, la primera conclusión es que el tamaño de la clase no parece tener un efecto significativo sobre el rendimiento
de los estudiantes. Esta evidencia es importante porque la respuesta habitual de algunos sectores a los problemas educativos es que se necesitan más recursos. La evidencia sobre el tamaño de la clase implica que los recursos adicionales pueden despilfarrarse con facilidad en políticas improductivas.

[...]

En consonancia con los resultados de investigaciones previas que resumimos en nuestra revisión de la literatura, no encontrarnos ninguna evidencia sólida de que la reducción del tamaño de la clase mejore el rendimiento académico de los niños. [...] La ratio profesor/alumno tampoco resulta un factor relevante.
Algún día las políticas sociales (jajajá) se harán con criterios rigurosos y avalados por pruebas. Mientras, a tirar de lo que más vende y mejor suena.

P. S. (26/03/10). Llegué a este estudio gracias a la página de Aprendemás.