domingo, febrero 24, 2008

Mil empates pueden ser una derrota - PP versus PSOE

Explicación estadística, cuento y sociología política.

----------------------------------

Sospecho que una moneda que llevo en el bolsillo está trucada, que con ella cara y cruces no se reparten al 50% los resultados. Para ponerlo a prueba, la lanzo al aire una vez y, al recogerlo, veo que ha salido cara. Como el 100% de los resultados ha sido cara, algo muy distinto del 50% que cabía esperar por azar, concluyo que con mi moneda las caras se ven favorecidas.

¿Tiene algún problema el razonamiento? Me dirán, imagino, que con un solo lanzamiento no voy a ningún lado. De acuerdo. Pues la tiro y otra cara. Dos de dos, 100% caras. ¿Ahora puedo decir que está trucada?

¿Y si la tiro tres veces y me salen tres caras? ¿Y si la tiro diez y me salen diez caras? ¿Un mil de mil ya me permitiría decir que la moneda está trucada? ¿A partir de dónde dejaría de tirar la moneda y me permitiría decir que la moneda favorece a las caras?

Lo que hacemos para determinar que una moneda está trucada es establecer un modelo de qué reusltados son compatibles, entran dentro de lo probable, con una moneda estándar y, complementariamente, qué resultados son los que no cuadrarían. Sacar dos caras de dos es bastante habitual con monedas ordinarias. Una de cuatro veces. No nos atrevemos a decir que está trucada con una prueba que encaja tan bien con la 'inocencia' de la moneda.

La estadística nos permite establecer la probabilidad de ciertos patrones de resultados asumiendo que no hubiera diferencias en probabilidad entre alternativas [p(caras) = p(cruces) = .5]. Si queremos saber si una moneda está trucada, en lo que pensamos es en monedas equilibradas. Vemos si lo que encontramos en la realidad cuadra, en términos de probabilidad, con esa moneda legal y, de ser poco esperable un patrón de resultados del tipo que hemos encontrado, rechazamos que la moneda sea legal.

Meter probabilidades es meter posibilidades de equivocarse. Dos son los errores que podemos cometer. El primero, dar por legal una moneda trucada. Imaginen que tenemos una moneda que sabemos que está completamente trucada. Al lanzarla tres veces conseguimos tres caras. Tres caras de tres es un resultado con probabilidad no muy baja para una moneda legal (.125). Por eso, sólo con esta prueba, según las convenciones estadísticas habituales, no podríamos rechazar que la moneda es legal. Habríamos dado por buena (o con no suficientes pruebas como para considerarla mala) una moneda trucada.

El segundo error es dar por mala una moneda legal. Con una moneda perfectamente legal podemos sacar, tras lanzarla mil veces, siempre el mismo resultado. Probabilidad muy baja, desde luego, pero distinta de cero (.5^999). Ese patrón de resultados sería tan anómalo, tan sospechoso, que nos llevaría a catalogar como trucada una moneda legal.

----------------------------------

En un pueblo viven 101 vecinos. Desde hace mucho, mucho tiempo, el sistema de elección de alcalde es siempre el mismo. El alcalde que finaliza su mandato espera en una habitación a cada uno de sus vecinos. Se juega con ellos a cara o cruz la alcaldía. Si sale cara, pierde el vecino, queda fuera del juego por el cargo. Si sale cruz, pierde el alcalde, el vecino vencedor es el nuevo alcalde proviosional y toma su puesto en proceso de jugarse el cargo con quienes todavía no han sido eliminados. A todos les parece un sistema justo y lo dan por bueno.

Desde hace mucho, mucho tiempo el alcalde es siempre el mismo. Siempre la suerte la acompaña y saca 100 caras en cada una de las elecciones a las que se ha presentado. Algún vecino, con la mosca detrás de la oreja, pide asamblea popular, donde plantea lo sorprendente y sospechoso de tanta fortuna del alcalde.

El alcalde, indignado ante la más o menos velada acusión que lanzan sobre él, se dirige a uno de los vecinos más respetados:

- Pepe, cuando estamos tú y yo reunidos, ¿cuántas veces tiramos la moneda? Una sola, ¿verdad? ¿Y tú desconfiarías de una moneda que en un lanzamiento sale cara?

Pepe, claro, reconoce que no. Una cara de un lanzamiento pasa el 50% de las veces.

Lo mismo le pregunta a María, a Antonio, a Adela, a Gumersindo... Todos reconocen, por evidente, que uno no puede desconfiar de una moneda en la que sale una cara de uno.

El alcalde, acariciando la moneda que guarda en el bolsillo, vuelve a su despacho, sabiendo que le esperan muchas más reelecciones.

----------------------------------

Los estudios de intención de voto son útiles, pero no una panacea. Para que predijeran a la perfección los resultados de las siguientes elecciones haría falta que: a) la gente no mintiera; b) la gente no cambiara de idea desde que son preguntados hasta el día de las elecciones; y c) que la muestra encuestada fuera representativa de la población de votantes. Pero: a) la gente miente porque le da vergüenza reconocer según qué intenciones, porque le gusta engañar, por muchos motivos; b) la gente cambia porque sí, por la campaña, por las circunstancias; y c) la muestra no es representativa de la población de votantes, sino de la población general (si la encuesta está bien hecha). Pero la población de votantes y la población general son diferentes en algo más que en pasarse por el colegio electoral: varían en estatus socioeconómico, cultural, reparto territorial, etc.

A eso hay que sumarle los errores de estimación de probabilidades. Pongamos en un bipartidismo pleno y cambiamos las caras y cruces por PP y PSOE. Si preguntamos a cien personas y 52 de ellas nos dicen que votarían al PSOE, estaríamos en lo que llaman un empate técnico. Si la población estuviera repartida a partes iguales, en una cantidad importante de encuestas nos saldrían diferencias entre partidos de este tamaño o mayores. Este tamaño de la diferencia no es suficientemente elevado como para descartar que, en la realidad, no haya diferencia. Ahora bien, si en lugar de preguntar a cien hubiéramos preguntado a diez mil, diferencias de proporción de exactamente el mismo tamaño ya serían lo suficientemente grandes como para poder decir que no son compatibles con diferencias nulas en la población general.

----------------------------------

Ahora mismo, en plena euforia encuestadora, multitud de resultados muestran un empate técnico entre los dos mayores partidos. Sistemáticamente, el PP queda por debajo. Hay quienes quieren ver en ello una equivalencia en las expectativas de ambas formaciones. Sin embargo, esto es equivalente al argumento del alcalde y sus lanzamientos de moneda. Que el alcalde ganase frente a Pepe no era llamativo. Ni que lo hiciera ante Adela. Lo llamativo era que ganara a todos, uno detrás de otro. No había que formularse cien veces la pregunta '¿es sorprendente una cara?', sino plantearse '¿son sorprendentes cien caras seguidas?'. Porque sí, sí que lo son. La probabilidad de que no hubiera tongo en ese pueblo era muy, muy baja.

Igualmente, en el caso de las encuestas. Cada encuesta no es una entidad aislada, sino datos adicionales que han de agregarse a los ya disponibles. Y cuando vamos agragando información, el error de medida de las encuestas se va reduciendo y, con ello, el tamaño de las diferencias que puede entrar dentro del empate técnico.

Esta época es especialmente adecuada para hacer esa agrupación de datos (meta-análisis). Encuestas separadas por un amplio intervalo de tiempo puede perder sentido el juntarlas. La población española no es justo la misma ahora que la de hace tres años, ni en componentes ni en intenciones de voto. Sin embargo, el poco tiempo en los trabajos de campo de los estudios actuales invita a combinar todos los datos que van ofreciendo. Aquella que presenta un tamaño muestral mayor será la que será ponderada en mayor medida a la hora de establecer la conclusión general. Pero lo que no deberíamos sería dejarnos engañar como con el cuento del alcalde y las monedas. Detrás de mil empates puede haber una clara derrota.

(Planteémoslo de otro modo. Si aceptamos que PP y PSOE están igualados en intención de voto y que las diferencias son puro azar de muestreo, ¿por qué el PP tiene tan mala pata que casi siempre las esas diferencias aleatorias le perjudican?).

No hay comentarios:

Publicar un comentario