Articulista Invitado

Pronosticadores vs encuestadores

Las encuestas electorales han dejado de ser parámetro para conocer a los ganadores, pues sus estimaciones han resultado fallidas en los años recientes.


Las elecciones en Estados Unidos nos remiten a un debate añejo sobre la capacidad predictiva de las encuestas. Algunos nos hemos negado a aceptar que se genere tal expectativa predicitiva sobre el método e insistimos en que los diagnósticos no son pronósticos y hay que ser muy cautos con el método. Vemos el mayor valor de las encuestas en su carácter explicativo y en la generación de escenarios, más allá de su capacidad para ser precisas en eventos futuros. Sin embargo, muchos actores, en particular los medios de comunicación y tomadores de decisiones, juzgan su valor a partir de su precisión en particular en contiendas electorales.

En Estados Unidos está muy bien definido el papel de las agregadoras o concentradoras de encuestas que pronostican el resultado electoral (pundits) y el de los encuestadores (pollsters). Los primeros adivinan el futuro, los segundos miden. Sitios como Fivethirtyeight, Real Clear Politics, Hufftingtonpost, Upshot del New York Times, entre otros, ofrecieron las probabilidades del triunfo de Clinton y Trump durante toda la elección, además de los cambios de preferencia por uno y otro candidato con márgenes de error agregados. Para estos concentradores de información las encuestas fueron solo un insumo más, tal vez el principal, pero no el único. Incorporaron variables económicas, mercados de apuestas, indicadores demográficos, niveles de aprobación, etcétera. Las mediciones eran ponderadas por su récord, calidad, tamaño de muestra, fecha de levantamiento, independienteme de si eran telefónicas (tanto a líneas de tierra como celulares), por internet, con paneles, obtenidas con robots, con metodologías mixtas, y un largo etcétera. Por ello para algunos el problema en esta elección estuvo más bien en el trabajo y metodología de los pundits y cómo presentaron sus estimaciones y no necesariamente de los pollsters.

Durante toda la campaña estos pronosticadores tuvieron a Clinton como la más probable ganadora, de allí la sorpresa del resultado. Sin embargo, jamás dejaron de advertir que el triunfo de Trump era posible, aunque poco probable. Las probabilidades podían ir tan cerradas como 55-45 o tan abiertas como 92-8, aunque siempre a favor de Clinton. Trump tanto para la elección nacional como para diferentes estados estuvo frecuentemente dentro del margen de error, literalmente hasta el último día. Baste citar el texto de Nate Silver, el multicitado pronosticador que hasta esta elección había tenido un récord impecable, quien publicó el día anterior a la elección en su corte de las 10 de la noche “hoy amanecimos con que Nevada, Carolina del Norte y Florida cambiaron de rojo a azul, pero, es posible que Florida y Carolina del Norte podrían voltearse nuevamente, pero no Nevada”. Estos pundits nunca dejaron de advertir que Trump tenía una oportunidad, pero “en las probabilidades la gente quería ver el 70 de Hillary y no el 30 de Trump”.

Ya a dos semanas de la elección, con más información, más análisis y con los conteos de votos más avanzados nos vamos enterando de los problemas de medición que pudo haber habido, más alla de lo que hayan dicho los pronósticos. En sentido estricto la diferencia entre las mediciones preelectorales y el voto popular no tuvo más error que en 2012. Obama estaba arriba por .7 por ciento en las últimas mediciones y terminó ganando por 3 por ciento. Hillary Clinton hasta el conteo de este martes estaba arriba por alrededor de entre un millón 250 mil (NYT) y un millón y medio de votos (CNN), lo cual implica una diferencia de 1.2% (y es muy probable que la diferencia sea más amplia cuando termine el cómputo). La diferencia que se le daba a Hillary por parte de las agregadoras de encuestas o pronosticadores estaba entre 3% y 3.5% (Fivethirtyeight y Real Clear Politics). Es decir, el sesgo fue en dirección contraria, pero en una magnitud o con un margen de error similar. A Obama se le subestimó, a Hillary se le sobrestimó.

Si la Presidencia de Estados Unidos se definiera por el voto popular, como sucede en nuestro país, no estaríamos en esta revisión de errores y diferencias. El millón de votos de diferencia a favor de Clinton fue registrado por pollsters y pundits, el problema fue medir correctamente los estados o los votos electorales. Es difícil explicar las diferencias entre las mediciones preelectorales y el resultado de la elección en una sola explicación, cuando lo que se tenían que medir eran 50 elecciones. Pero sin duda hay algunos explicaciones genéricas útiles.

El fenómeno que tenemos que explicar es muy sencillo: ¿por qué se subestimó a Trump? Y en particular por qué se le subestimó en estados clave. Lo resumiremos en: 1) tasa de no respuesta (no genérica, sino de grupos específicos), 2) subestimación de la participación de votantes (segmentos de población específicos), 3) volatilidad del voto en la última semana. 4) Y a esto habrá que agregar un debate: ¿hubo o no voto oculto del votante a favor de Trump?

Tasa de no respuesta

Según el Pew Research Center la participación en encuestas telefónicas en EU disminuyó desde 43% en el año 1997 a 14% en 2012. En palabras de Nick Bilton “los ciudadanos están más interesados en proteger su privacidad que en decir por quién votarán. Michael Jamrisko explica que los estadunidenses cada vez deciden participar menos y desconfían de las encuestas desde una percepción política. A esto hay que agregar que la disminución de teléfonos fijos ante el aumento de la telefonía móvil contribuye a la volatilidad demográfica del electorado, es decir, que al momento de levantar la información ya no se sabe exactamente en qué ciudad o estado reside el participante.

El problema más grave es cuando los potenciales encuestados de un sondeo se niegan sistemáticamente a recoger el teléfono, afectando en las características sociodemográficas que los encuestadores no logran medir o no pueden ajustar para igualar el total de la población. Este error es extendible para algunos a todas aquellas opciones que impliquen recolección de datos medidas por tecnología, léase paneles de internet, etcétera.

El alto sesgo de “no respuesta” como producto de la desconfianza se asocia a características sociodemográficas. Un estudio del Pew Research Center demuestra que los ciudadanos con bajo nivel educacional o desconfiados de las instituciones son más difíciles de encuestar. Un ejemplo de esto es el análisis del portal FiveThirtyEight, el cual sostiene que entre los votantes de Trump existe una alta desconfianza hacia las instituciones, lo que genera una baja respuesta para participar en las encuestas.

Participación

Cohn del New York Times: el votante con un alto nivel educativo pudo haber sido sobrerrepresentado por los pollsters, así como una posible sobrestimación de la participación afroamericana. Las estimaciones de los estados de contienda —Iowa, Ohio, Florida, Pennsylvania, Wisconsin y Michigan—, los resultados de las encuestas eran mixtos, pero todos subestimaron el apoyo hacia Trump. Los cuestionamientos sobre la subestimación de Trump en otros estados que ya se daban ganados por los republicanos es irrelevante porque fueron estados donde no se puso mucha atención ni sofisticación en la medición. Al igual que los estados evidentemente demócratas como California, Oregon o Washington.

Volatilidad

Los votantes más volátiles que decidieron la última semana favorecieron claramente a Trump según Scott Kitter (Pew). Esto fue muy evidente en estados como Wisconsin, Pennsilvania, Florida, Michigan, Ohio y Virginia. Hubo eventos en los últimos días que pudieron haber contribuido a este fenómeno. En particular el anuncio del director del FBI de reabrir la investigación sobre los correos de Clinton. Es probable que las investigaciones del FBI en torno a los correos de Hillary Clinton aumentaran la desconfianza de los votantes hacia su figura política. Las declaraciones del FBI pudieron haber afectado la intención de voto, lo cual no fue medido por algunas encuestas.

El debate

La evidencia disponible hasta ahora no parece indicar que haya habido voto oculto. En ello parecen coincidir la mayor parte de los pollsters. De otra manera no se explicaría la subestimación hacia Trump incluso en estados evidentemente republicanos.

Finalmente para claridad del debate público y una lección que debemos aprender de esta elección en Estados Unidos no es solo tener muchas precauciones con la información que se genera a partir de encuestas, en particular la electoral, o toda aquella que mide variables sensibles social o políticamente, o con poblaciones bajo presión. Para el debate público y por claridad también será útil distinguir a los pronosticadores (pundits) de los encuestadores (pollsters).

*Fundador y director de Parametría


[Dé clic sobre la imagen para ampliar]