Escobari y Hoover hicieron comparaciones inapropiadas con 2016, lo que provocó que las estimaciones «diferencia en diferencia» es nula

7 min read

Esta es la décima de una serie de publicaciones de blog que analizan los informes de Diego Escobari y Gary Hoover sobre las elecciones presidenciales en Bolivia de 2019. Sus conclusiones no resisten el escrutinio. Como señalamos en nuestro informe de Nickels Before Dimes, aquí ampliamos las afirmaciones y conclusiones que Escobari y Hoover hicieron en su informe. Enlaces a publicaciones: Parte uno, Parte dos, Parte tres, Parte cuatro, Parte cinco, Parte seis, Parte siete, Parte ocho y Parte nueve. En la publicación anterior Observamos que si bien la geografía es estable de una elección a otra, Pero no hay garantía de que el impacto de la geografía en la proporción de votos sea consistente en el tiempo. Esto puede dar lugar a una brecha cada vez mayor entre el margen observado y el progreso del recuento. Incluso si no hay fraude. También notamos que los resultados en los colegios electorales incluidos en los anuncios del TSE mostraron esta tendencia. Sostenemos que esto plantea un problema para Escobari y Hoover. En esta publicación mostraremos que el modelo ¿Cómo identifican falsamente sus «diferencias en diferencias» el fraude cuando las diferencias en las tendencias interactúan con el sesgo de conteo? Aunque la tendencia de los resultados es lineal. Una forma de demostrarlo es aplicando Escobari y Hoover a datos electorales sintéticos. Podemos controlar la cantidad total de fraude. Podemos crear una variable «geográfica», pero no podremos observarla directamente en nuestro análisis. Pero es constante en toda la zona y está relacionado con la llegada. Entonces podríamos crear resultados electorales basados ​​únicamente en la geografía oculta. independientemente de la llegada Para mayor claridad de la ilustración Dividimos el grupo SHUTDOWN en unidades de votación durante los últimos seis minutos de su llegada. En la Figura 1, vemos dos resultados de encuestas sintéticos diferentes. Tanto los resultados de la izquierda como los de la derecha siguen la misma tendencia general en cuanto al orden en que se enviaron los colegios electorales: en cada ubicación, marcamos los colegios electorales cerrados en verde. No hay tendencia dentro de las regiones de izquierda o derecha. Y el cierre no tuvo ningún impacto en los márgenes. La diferencia entre izquierda y derecha es en qué medida la geografía explica las diferencias entre distritos. Figura 1. Dos ejemplos de fuentes de datos electorales sintéticos: Los cálculos de la Escrito por la derecha, la geografía explica bastante poco. Por tanto, la tendencia general es más evidente. Esto se debe a que el orden de transmisión es un indicador imperfecto de la geografía. Podemos crear estimaciones diferentes de estos datos, como hicimos con los resultados electorales reales de 2019, tanto en el lado izquierdo como en el derecho. Las diferentes estimaciones de Escobari y Hoover indican fraude en ausencia de fraude. A menos que ajustemos a nivel local, Tabla 1 Aplicación de las “estimaciones de diferencias” de Escobari y Hoover a datos sintéticos Izquierda Derecha (1) (2) (3) (4) Cierre de variable 15,46 (0,706) 0,233 (0,110 ) 16,26 (0,141) 0,132 (0,706) Constante 7,780 (0,298) ) ) 10,38 (0,037) 7,370 (0,076) 10,11 (0,044) Zona de efectos fijos No Sí No Sí Observaciones 35.000 35.000 35.000 35.000 R2 0,0136 0,988 0 .199 0.773 Fuente: Cálculos del autor. Para crear resultados electorales sintéticos Ni siquiera hemos identificado los distritos que contaron tarde. Por lo tanto, sabemos que no habrá retrasos en el fraude a nivel de distrito, pero eso no debería impedir que los datos sintéticos aumenten en 2016. Como podemos ver en la Figura 2, los resultados sintéticos de 2019 son más sensibles a la geografía que los resultados de 2016. Figura 2. Ejemplo de datos sintéticos que cubren múltiples elecciones Fuente: Cálculos del autor Escobari y Hoover ¿Qué hacemos con estos datos adicionales? en forma de simples diferencias Compararon la diferencia promedio entre las unidades electorales incluidas en el anuncio del TSE y las que fueron excluidas. Asumieron que si no había fraude no habría diferencia entre los dos. En el modelo de «diferencia en diferencia», la línea de base para el fraude en 2019 no era cero, pero cualquier diferencia se observaría en 2016. Gráficamente, Puede ver el modelo de diferencia fundamental de Escobari y Hoover aplicado a los datos sintéticos en la Figura 3. Las finas líneas discontinuas indican tendencias para cada elección. y las líneas gruesas y continuas indican las predicciones del modelo.Figura 3. La divergencia simple falla en fuentes de datos sintéticos: cálculos electorales del autor. Esto se debe a que las tendencias no son paralelas. La brecha promedio entre 2016 y 2019 fue de 11,8 puntos porcentuales entre las mesas incluidas en el anuncio del TSE, pero de 15,1 puntos porcentuales entre las que cerraron, lo que resulta en una brecha de “diferencia en diferencia” de 3,3 puntos porcentuales (una diferencia entre las últimas diferencia de llegada de 15,1 puntos porcentuales y diferencia de llegada anticipada de 11,8 puntos porcentuales). Pero nada de esto tiene nada de interesante. Excepto que estas cosas son más beneficiosas para el titular del cargo. La doble diferencia se produce porque los márgenes son más sensibles a la geografía en 2019, algo inherente a los datos. Como siempre, podemos incluir controles geográficos con ajustes a nivel de área. Sin embargo, esto borra la tendencia general de las elecciones. Pero se mantendrán las diferencias electorales cruzadas. La diferencia de tendencias no cambiará. Esto significa que la diferencia en la disparidad no cambia. Por lo tanto, Escobari y Hoover nuevamente malinterpretan esta mayor sensibilidad geográfica como «fraude». Figura 4. La nivelación espacial de los datos sintéticos no tiene ningún efecto sobre la fuente. Fuente de estimaciones: cálculos del autor En la Tabla 2 vemos los resultados estadísticos de la aplicación del modelo de diferencias a datos tanto de «izquierda» como de «derecha» y con diferentes niveles de control geográfico. La diferencia en diferencias se muestra como “CIERRE x Y2019” Tabla 2 Aplicación de las “estimaciones de diferencias” de Escobari y Hoover a datos sintéticos Izquierda Derecha (1) (2) (3) (4) (5) ( 6) Variable de cierre x año 2019 4,703 (1,03) 4,703 (1,069) 4,703 (1,456) 3,343 (0,150) 3,343 (0,156) 3,343 (0,212) Cierre de negocios 10,75 (0,784) -2,202 (0,543) 12,9 1 (0,13) 7) -1,687 ( 0,127) Año 2019 11,74 ( 0,437) 11,74 (0,43) ) 6) 11,74 (0,618) 11,79 (0,063) 11,79 (0,065) 11,79 (0,089) Valor constante -3,963 (0,331) -1,754 (0,229) -2,129 (0,280) – 4,44 2 (0,068) -1,956 ( 0,047) -2,241 (0,040) Hoja de conteo de resultados fijos No Sí Sí No Sí Sí Hoja de conteo No No Sí No No Sí Observaciones 70.000 70.000 70.000 70.000 70.000 70.000 R2 0,0231 0,523 0,530 0 ,332 0,746 0,86 1 Fuente: Cálculos del autor. Tenga en cuenta que dentro de cada conjunto de datos El nivel de control geográfico no cambia en absoluto la estimación puntual de la doble diferencia. Pero la incertidumbre es mayor en los datos de la «izquierda», que no se explican completamente por la geografía. La razón por la que la estimación puntual es fija en cada conjunto de datos es porque nuestros datos están completos. Disponemos de datos de 2016 y 2019 para cada mesa electoral. El modelo de diferencias en diferencias aplicado a los márgenes de votación es exactamente la misma disminución que el modelo de diferencias simples aplicado a los márgenes crecientes de 2016 a 2019. En otras palabras, con diferentes modelos de diferencias Estamos preguntando simplemente. ¿Cuánto más hay? Los márgenes brutos aumentaron en promedio en el segmento SHUTDOWN en comparación con los aumentos en las unidades de votación anteriores. Si hubiera alguna razón benigna para que los márgenes brutos de SHUTDOWN aumentaran aún más, Una doble diferencia sobreestimaría el valor del fraude. No hay fraude en los datos sintéticos. Pero especificando la hipótesis Las «tendencias paralelas» no son una suposición. Interpretar las dobles diferencias como fraude es un completo error. En la próxima publicación aplicaremos estos métodos a datos electorales reales. Y cabe señalar que el problema de las tendencias no paralelas todavía existe.

Source link

You May Also Like

More From Author

+ There are no comments

Add yours