Este es el blog de la asociación Autonomía y Bienvivir, no dejes de visitar nuestra página web, para conocer nuestro ideario: Visitar página web

martes, 1 de mayo de 2018

Sin tiempo, por favor, somos científicos sociales.


Como ya explicamos hace un tiempo en “Sin filosofía, por favor,somos científicos sociales” (se llega pinchando en el título), las matemáticas pueden ser usadas para intimidar al vulgo, pues permiten hacer gala de un conocimiento y dominio de herramientas que pueden parecer en principio complejas. Sin embargo, como vimos, e iremos viendo, el empleo de métodos matemáticos, generalmente usados por la física, en las “ciencias sociales”, no es muy distinto al empleo de las matemáticas que hacen los astrólogos, haciendo de esto un arma de doble filo que permite a quien puede entrar y salir con facilidad de estas formalidades, triturarlo todo.





“Los expertos tienen una comprensión pobre de la incertidumbre. Por lo general, esto se manifiesta en forma de exceso de confianza: los expertos subestiman la probabilidad de que sus predicciones sean erróneas.”

Escribía en 2011 Nate Silver[1]. Años después, el sitio web fundado por él escribía sobre Trump:


“Al igual que su calificación desfavorable, es con mucho el peor de los 106 candidatos presidenciales desde 1980 que están en nuestra base de datos. 
Sólo por esta razón, Trump tiene más posibilidades de participar en otra película de "Solo en casa" con Macaulay Culkin, o jugar en las finales de la NBA, que ganar la nominación republicana.”

Así se pronunciaba[2]FiveThirtyEight”, la famosa web de internet de análisis estadísticos, sobre todo electorales. Posteriormente, como con anterioridad, seguiría pronunciándose sobre las elecciones americanas:

Trump es el candidato más débil del GOP en la era moderna[3], sólo unos meses antes de las elecciones primarias. Peor aún, el propio Nate Silver, fundador del sitio web, llegaría a demostrar posteriormente su mala concepción de la estadística, en una disculpa por sus errores ante las primarias:

“El gran error es curioso para un sitio web que se centra en las estadísticas. A diferencia de prácticamente cualquier otro pronóstico que publicamos en FiveThirtyEight, incluidas las proyecciones primarias y de caucus que acabo de mencionar, nuestras primeras estimaciones de las posibilidades de Trump no se basaron en un modelo estadístico.En cambio, eran "probabilidades subjetivas", es decir, conjeturas educadas. En otras palabras, básicamente actuamos como expertos, pero agregando números a nuestras estimaciones. 
(Creo que deberíamos haber diseñado un modelo, pero dado que no lo hicimos, no creo que haya nada de malo en enmarcar nuestras estimaciones en términos porcentuales. Es fácil hacer declaraciones engorrosas como "Trump es un desfavorecido para ganar la nominación, pero no podemos descartar nada", dejando suficiente ambigüedad en esa oración que puede afirmar que ha sido profética, cualquiera que sea el resultado. Poner las cosas en términos de porcentaje es más responsable, especialmente si desea probar sus pronósticos para la calibración más adelante)”[4].

Posteriormente, en las elecciones presidenciales, no sólo “FiveThirtyEight”, quien daba horas antes un 71% o 72% de probabilidad de victoria a Hillary[5], pensaba en términos probabilísticos, sino la gran mayoría de medios[6].

Sin embargo, pensar en estas categorías es absurdo, no muy distinto a pensar en términos probabilísticos sobre el monstruo del Lago Ness, lo que deja a este tipo de conjeturas como puras palabras vacías cuya única concordancia es si acaso semántica, como iré demostrando.




Para ello explicaremos el concepto de estacionariedad, pero antes iré al concepto de ergodicidad, que ya expliqué, por lo que sólo lo resumiré:

Un proceso es ergódico cuando, para cualquier elemento del conjunto, su promedio temporal coincide con la distribución del conjunto, es decir, los elementos que lo forman son homogéneos y mantienen la misma distribución de probabilidad. 

Esto nos permite que, estudiando a un solo elemento durante un periodo de tiempo, tendremos conocimiento sobre el comportamiento y distribución del conjunto, y viceversa, si tenemos una muestra del conjunto en un único intervalo de tiempo, sabremos el comportamiento temporal de cualquier elemento a lo largo del tiempo, dado que en el tiempo coincidirá con la distribución del conjunto. Hablamos de ergodicidad entonces, cuando conociendo a un elemento podemos conocer al conjunto y viceversa. Nos permite entonces, hacer inducciones.

Un ejemplo sencillo es una tirada a cara o cruz de 1.000 monedas iguales, su resultado, que tenderá a estar cercano al 50% para cada cara, será similar a tirar una sola moneda 1.000 veces[7]. Igualmente, un proceso no ergódico será el lanzamiento de un balón a una canasta por 1.000 individuos, donde la distinta capacidad de los individuos (heterogeneidad de los elementos del conjunto) arrojará un resultado diferente al que saldría si uno de los individuos realiza 1.000 lanzamientos a canasta él solo.

Estacionariedad, es sin embargo una de las características que necesita la ergodicidad, por lo que un proceso ergódico es aún más restrictivo que un proceso estacionario, pues necesita estacionariedad, pudiendo existir procesos estacionarios que no son ergódicos y, si bien la estacionariedad es un concepto quizás más fácil que el concepto de ergodicidad, sus consecuencias son mucho más profundas y complejas, ampliando su rango de acción a sucesos que no son ergódicos. Empecemos por explicarla:

Estacionario, del latín "stacionarius"hace referencia a algo que está estacionado, quieto, sin cambios. Podemos encontrarlo en numerosos conceptos como “estado estacionario”, “punto estacionario”, “conjunto estacionario”, “fase estacionaria”, etc.

Aquí usaremos el concepto de “proceso estocástico estacionario”:

Un proceso estocástico o aleatorio es estacionario cuando, para cualquier periodo de tiempo “tn”, su distribución de probabilidad es la misma, es decir, no varía en el tiempo. Esto significa que sus valores de probabilidad “P”, no estarán influidos por los eventos o resultados pasados. De este modo, su media y varianza tampoco divergirán en el tiempo, siendo constantes.

El lanzamiento de una moneda 1.000 veces será un proceso estacionario, dado que durante todo el periodo de tiempo la probabilidad de salir cara o cruz se mantendrá sin cambios, de modo que la media y varianza serán constantes, puesto que no hay una perturbación que modifique las continuas reproducciones del experimento. Tiremos las veces que tiremos la moneda, si la realización del experimento no varia, se dará el caso de estacionariedad, teniendo las series de repeticiones una media y varianza constante en el tiempo.

En otras palabras, la media y varianza de 1.000 lanzamientos será la misma que la de los 1.000 siguientes, 2.000 o 100.000, pues no variará en el tiempo. Y, como vimos anteriormente, que el lanzamiento conjunto de un dado enumerado del 1 al 6 y otro enumerado del 7 al 12, no era un proceso ergódico, sí será en cambio de un proceso estacionario, pues si bien ninguno de los dados por separado mantendrá una distribución de probabilidad igual al conjunto, sí que ambos dados por separado presentan estacionariedad, es decir, son homogéneos individualmente en el tiempo.


Así por ejemplo, la probabilidad de salir una cara “X” en un dado y una cara “Y” en el otro dado se mantendrá constante en el tiempo[8]. Esto es debido a que, si bien los elementos son heterogéneos, estos no sufren cambios en el tiempo y cada uno de todos los procesos se realizará de forma similar, haciendo que su media y varianza sean igualmente constantes en el tiempo. Aquí una muestra de la evolución de sus medias hasta 250 lanzamientos:



Como se puede apreciar, su media es constante, se lancen 250 veces o 250 mil. Por lo que, si bien estudiando un solo dado no podemos conocer al conjunto ni viceversa, estudiando un periodo en el tiempo, sí que podremos asignar probabilidades para eventos futuros, las cuales tendrán una media y varianza exactamente igual a las pasadas.


Aquí un ejemplo gráfico del lanzamiento del dado enumerado del 1 al 6, cuya media está arriba:



Como vemos, su espacio muestral (esto es, los resultados probables) va de 1 al 6, guardando una probabilidad para salir la cara “X” similar en cada tirada (pues las circunstancias en que se desarrolla cada tirada no varían ni los resultados anteriores suponen cambios), por lo que podemos concluir que la probabilidad de salir “X” se cumplirá para cualquier momento del tiempo. Su media, en torno a "3´5", será constante, como su varianza, lo que, si bien no nos permite determinar sus resultados futuros, sí nos permite determinar la media y varianza que tendría si siguiéramos realizando el experimento en el tiempo.

Si un proceso ergódico tiene la ventaja de que estudiando un instante del conjunto conocemos un elemento a lo largo del tiempo y viceversa, de modo que estudiando un elemento a lo largo del tiempo conocemos al conjunto, la estacionariedad implica que:

Estudiando un periodo de tiempo de un proceso, dado que este no se reproduce de forma distinta a lo largo del tiempo y, a pesar de que evolucione de manera aleatoria, podremos conocer su distribución de probabilidad pasada, presente y futura, la media y varianza. Esto nos permite por ejemplo, si los sucesos no son equiprobables, conocer cuáles sucederán más a lo largo del tiempo, permitiendo si bien no determinar el futuro, sí determinar su media y varianza. 

Es precisamente, como la ergodicidad, una característica utilizada en física, para teoría de señales, ondas, vibraciones, etc.


Por ejemplo, aquí tenemos una serie estacionaria, en este caso, una vibración, es decir, una onda de sonido, por lo que los sonidos se repiten, en este caso de forma aleatoria bajo un mismo patrón, de modo que su media y varianza es similar para distintos periodos de tiempo y, conociendo un pequeño periodo, como el mostrado, podemos asignar probabilidades para los eventos futuros si la serie se sigue desarrollando, pues para todo el instante de tiempo “t”, la probabilidad, media y varianza serán similares. Además, podremos recrear una serie similar y extenderla todo lo que queramos, haciendo que mantenga una evolución en el tiempo con una media y varianza igual a la estudiada.

En cambio, en los procesos no estacionarios estos valores no serán constantes en el tiempo, lo que implica que, cogiendo pequeños periodos de tiempo, su media y varianza no coincide con otros periodos, por lo que por mucho que estudiemos un periodo de tiempo de la serie, no podremos asignar probabilidades a su desarrollo futuro o pasado, es decir, para procesos no estacionarios no existe la posibilidad de asignar probabilidades y por tanto, de hablar de ellos en términos probabilísticos, como tampoco podremos de ningún modo conocer su media y varianza futura.

Aquí un ejemplo, la tasa de desempleo en España:




Y, para los más marchosos, aquí una onda no estacionaria:




Y un experimento con estacionarias y no estacionaras: 



Lo más importante y lo que nos interesa, es que, todo proceso en el que su resultado al final de un periodo produce cambios que afecten al siguiente periodo será, por necesidad, no estacionario, pues los cambios que realiza influirán a los siguientes procesos, y los eventos humanos son, precisamente no estacionarios en su totalidad, puesto que los eventos pasados realizan cambios en los individuos y en el ambiente en el que se desarrolla la acción de éstos. Así, por ejemplo, en el experimento de lanzar a canasta 1.000 veces, habrá no estacionariedad, dado que el cansancio acumulado de los lanzamientos anteriores hará que la media de canastas descienda en el tiempo.




Igualmente, en la evolución de los accidentes de tráfico, podríamos esperar no estacionariedad[9], como también con la evolución de la estatura[10], es más, lo difícil sería encontrar un evento que fuese estacionario, lo cual es imposible, dado que la acción humana modifica el ambiente y a los individuos, de modo que el estado de un individuo a lo largo del tiempo difiere, como el ambiente en el que éste se mueve. El propio proceso de lanzar una moneda es no estacionario, o dicho en otro modo, uno podrá saber la probabilidad de que salga cara o cruz una vez se lleve a cabo el lanzamiento, pero no la probabilidad de que éste se realice[11].

Como vimos con la ergodicidad, el porcentaje de personas que mueren ahogadas o en accidente de bicicletas no significa que individualmente una persona tenga esa probabilidad, algo que en cierto modo aceptaba el “National Safety Council”, "Consejo Nacional de Seguridad" de EEUU, pero es más, al ser estos procesos no sólo no ergódicos, sino también no estacionarios, significa que no podremos hallar de ningún modo la probabilidad de que una persona muera, por mucho que la estudiemos a lo largo del tiempo, algo que el “National Safety Council” cree que se puede[12], junto con la gran mayoría de “científicos” sociales, lo que los hace no muy diferentes a quienes practican la quiromancia[13].

De hecho, es tan absurda la situación que sólo puede engañar a niños[14], dado que la estacionariedad necesita que los individuos no evolucionen en el tiempo, siendo exactamente iguales a lo largo de su vida, de modo que el comportamiento pasado, no difiera del futuro, y que el ambiente en el que se realizan sus procesos se mantenga inerte, no viéndose afectado por los procesos anteriores. Sólo así, se podrá mediante el estudio a lo largo del tiempo de un individuo, averiguar la probabilidad para un día futuro determinado, exactamente del mismo modo que a partir de varias tiradas de una moneda o un dado, podemos asignar probabilidades a las futuras tiradas[15].




Si utilizamos como ejemplo a “FiveThirtyEight” y hemos logrado entender los conceptos de ergodicidad y estacionariedad, podremos entender perfectamente su fracaso.


Para que sus perspectivas tuvieran sentido, no sólo debería de existir ergodicidad, permitiendo realizar inducciones a partir de las encuestas, sino estacionariedad[16], lo que significa que bastaría con analizar a un individuo, no a lo largo del tiempo, sino sólo durante un periodo, pues, dado que sólo si el individuo evoluciona según una distribución de probabilidad constante en el tiempo, podremos asignar, mediante el estudio del pasado, una distribución de probabilidad para periodos futuros[17].

Además, si se realizan cálculos buscando hallar la probabilidad de las elecciones o accidentes de automóvil, los resultados arrojados, de ser ciertos, deberían dar una distribución de probabilidad no sólo para absolutamente todos los periodos futuros, sino también para los pasados, de modo que su media y varianza serían constantes en el tiempo.

Dicho esto, si verdaderamente el estadístico Nate Silver, fuera capaz de calcular probabilidades acerca de las elecciones[18], o si el “NCS” tuviese la capacidad de medir la probabilidad para una persona de morir ahogada, esto significaría que las personas no cambian en el tiempo, esto es, que se han mantenido en el tiempo con una distribución de probabilidad constante, moviéndose de forma aleatoria estacionaria.

Así, una persona tendrá la misma probabilidad en cualquier tiempo pasado de morir ahogada, persiguiéndole para cualquier tiempo futuro, pese a que decida alejarse del agua o pase temporadas sin introducirse en ésta. Sin embargo, como no vivimos en un mundo como el de la película “El día de la marmota”, es posible esperar que los individuos evolucionen a lo largo del tiempo, de modo que lo que refleja una encuesta para un periodo “tα”, a pesar de pueda llegar a ser válido para ese periodo, dado que no existe estacionariedad y por lo tanto, mucho menos ergodicidad, no lo será para un periodo “tβ”, siendo los cálculos que se hagan con los datos de ese periodo y anteriores, inservibles para un periodo futuro "tf".

  
De hecho, y esto es lo gran absurdo y ridículo de todo, los propios estadísticos que elaboran estos cálculos acaban asumiendo como niños de forma inconsciente, precisamente por necesidad, la no estacionariedad y no ergodicidad, al realizar continuamente recolección de nuevos datos y cambios en sus modelos, por lo que acaban operando de una manera contradictoria sin ser conscientes de ello, pues mientras realizan cálculos estadísticos que únicamente servirían con procesos ergódicos o estacionarios, no dudan en ningún momento en actualizar sus datos o el modelo cuando la realidad, no estacionaria, cambia.


Así, acaban asignando probabilidades a la victoria de Trump, al crecimiento económico de futuros trimestres[19] o a cambios en los tipos de interés[20], enunciados que únicamente quedan en palabras vacías y poca comprensión de la realidad, para terminar posteriormente en una incomprensión del fracaso de las predicciones[21], por lo que acaban nuevamente repitiendo conjeturas mediante la misma metodología después de haber sido éstas trituradas por la realidad, la cual no entiende de estacionariedad[22]como pasó con Nate Silver dando más de dos tercios de probabilidad a Hillary en las elecciones presidenciales, una vez "corregidos" los errores cometidos en las primarias.


Por todo esto, seguiremos viendo fallos escandalosos como los del Brexit o las elecciones españolas en 2015, por el lado político, y crisis financieras y caídas de aseguradoras y bancos, a pesar de funcionar con modelos estadísticos a base de recopilar y procesar datos. Porque, pese a que amplíen su base de datos, tratan a éstos como si fuesen estacionarios y, en ocasiones ergódicos, algo que no son y que además, inconscientemente asumen y rechazan a la vez, haciendo de toda esta contradicción una gran parodia en la que ellos mismos caen engañados por los números que fabrican, cual brujo que de verdad acaba pensando que posee poderes de adivinación. Ciertamente, el catecismo de la Iglesia católica podría introducirlos como formas de adivinación.


“Todas las formas de adivinación deben rechazarse: el recurso a Satán o a los demonios, la evocación de los muertos, y otras prácticas que equivocadamente se supone “develan” el porvenirLa consulta de horóscopos, la astrología, la quiromancia, la interpretación de presagios y de suertes, los fenómenos de visión, el recurso a mediums encierran una voluntad de poder sobre el tiempo, la historia y, finalmente, los hombres, a la vez que un deseo de granjearse la protección de poderes ocultos. Están en contradicción con el honor y el respeto, mezclados de temor amoroso, que debemos solamente a Dios”(CEC, 2116).









[1] “Herman Cain and the Hubris of Experts” (octubre de 2011). Nate Silver.

[2] "Why Donald Trump Isn’t A Real Candidate, In One Chart" (16 junio de 2015). Harry Enten.

[3] “Trump Is The Weakest GOP Front-Runner In The Modern Era” (11 abril de 2016). Harry Enten.

[4] How I Acted Like A Pundit And Screwed Up On Donald Trump (mayo de 2016). Nate Silver.

[5] "Final Election Update: There’s A Wide Range Of Outcomes, And Most Of Them Come Up Clinton" (noviembre de 2016). Nate Silver.

[6] "Hillary Clinton has an 85% chance to win". (8 de noviembre de 2016). The New York Times. Los cuales además dieron una menor probabilidad a Trump, siendo “FiveThirtyEight” quien más apostó por él.

[7] El fenómeno podrá ser descrito como “Cara = (P*1.000)”, donde P es la probabilidad de que salga cara y 1.000 es interpretable como el número de veces que la moneda es lanzada o como el número de monedas que se lanzan una sola vez, dado que son homogéneas, conservan el mismo valor de probabilidad “P”.

[8] Por ejemplo, siendo “X” una cara del 1 al 6 e “Y” una cara del 7 al 12, la probabilidad de salir “X” e “Y” en un periodo “tα” de “t”, será:

“Ptα (X, Y) = Ptα(X) * Pα(Y)”; siendo “Ptα (X)” y “Ptα (Y)” la probabilidad de salir “X” e “Y” en el periodo “α”.

Al ser estacionaria, la probabilidad será válida para un periodo “α” como para cualquier otro periodo “β”, dado que será válida para todo “t”, cumpliéndose que Ptα = Ptβ, por lo que la podemos definir de nuevo como:

“Pt (X, Y) = P(X) * P(Y),  t”.

[9] Un número creciente de accidentes puede ocasionar la toma de mayor precaución, vigilancia, etc. Sin olvidarse de que el aumento de estos ya viola el principio de estacionariedad, de media estable en el tiempo.

[10] Cambios en el ambiente como mejor alimentación, tendrán efectos en los individuos.

[11] Los Pelayo, cuando acudían a los casinos, sabían la probabilidad de que ganaran o perdieran en las máquinas que estudiaban, pues siguen un proceso estacionario (las máquinas no cambiaban en el tiempo), pero no podían saber la probabilidad de que llegasen a jugar en ellas.

De hecho, es tan absurdo que si fuera un proceso estacionario, si jugasen varias veces consecutivas de forma exitosa, igual que si conseguimos lanzar una moneda varias veces consecutivas, nos saldrá una probabilidad de 1 dado todos los eventos exitosos anteriores, por lo que, si realmente fuese un proceso estacionario, podríamos estar realizando la actividad hasta el fin de los tiempos.

[12] “Estas probabilidades son promedios estadísticos sobre la población de EE.UU. No reflejan las probabilidades de muerte de una persona en particular por una causa en particular, que varía significativamente según el estilo de vida, la ocupación, la residencia y muchos otros factores”.

Informaba el “NSC” sobre los datos que da, medianamente consciente de la no ergodicidad de éstos.
Actualmente, ha cambiado el texto:

Las probabilidades que se dan en el árbol de datos y en la tabla correspondiente son promedios estadísticos de toda la población de EE.UU. Y no reflejan necesariamente las posibilidades de muerte de una persona en particular por una causa externa particular. Las probabilidades de que un individuo muera por diversas causas externas se ven afectadas por las actividades en las que participa, dónde vive y conduce, y qué tipo de trabajo hace, entre otros factores.

The odds given in the data tree and corresponding table are statistical averages over the whole U.S. population and do not necessarily reflect the chances of death for a particular person from a particular external cause. Any individual’s odds of dying from various external causes are affected by the activities in which they participate, where they live and drive, and what kind of work they do, among other factors.”


[13] En realidad, dado que quienes practican la quiromancia suelen estar marginados socialmente, el daño que ocasionan con asiduidad los expertos es bastante superior.

[14] En esencia, no se diferencia de un niño al que enseñan en la escuela a hallar la longitud de una circunferencia, y lo acaba realizando sin ser consciente de que está multiplicando las unidades del diámetro por la longitud de una circunferencia de una unidad de diámetro. O, a cuando halla mediante teorema de Pitágoras la longitud de la hipotenusa, pero sin ser consciente de que lo realiza mediante la igualación de la suma del área de dos cuadrados, cuyos lados son iguales a los catetos del triángulo, y el área de un cuadrado cuyo lado es igual a la hipotenusa.

[15] Nassim Taleb, en su teoría del cisne negro, o del evento “altamente improbables”, como lo denomina en el subtítulo, cae en este error, al pensar que los fallos están en no considerar eventos que mantienen una probabilidad casi inexistente, “riesgos de cola”, cuando la realidad es que al futuro no se le pueden asignar probabilidades. Así, en un mundo como el que concibe Taleb, la salvación estaría en recoger mejor información y tomar en consideración los riesgos de cola, que serían eventos tan improbables como que al lanzar una moneda, ésta acabe de canto. Sin embargo, en un mundo no estacionario como en el que vivimos, realizar algo así sólo serían cálculos matemáticos sin sentido, más allá de la lógica algebraica interna que puedan tener.

[16] La ergodicidad necesita de estacionariedad para cumplirse.

[17] Del mismo modo que tirando un dado 1.000 veces sabremos la distribución de probabilidad si se tirase 100.000 veces o, al ser ergódico, la distribución de probabilidad de tirar 100.000 dados una sola vez, pues el hecho de ser ergódico nos permite extrapolar la distribución de probabilidad.

[18] Para las elecciones las condiciones necesarias son realmente ridículas, pues significa que las personas crean conjuntos de distribución ergódicos, los cuales evolucionan en el tiempo de forma biyectiva a otros conjuntos con los que guardan relación binaria homogénea, esto es, en esencia, que las elecciones siempre serían las mimas para cada periodo, por muchas veces que se repita, del mismo modo que el resultado de arrojar 1.000 dados será el mismo.

[19] Bastante optimistas, para lo que luego sería una de las mayores crisis económicas de los EEUU:

De hecho, la FED realiza estas encuestas periódicamente, “Survey of Professional Forecasters”, “Encuesta de pronosticadores profesionales” se llaman.

Si bien hubo economistas que lograron ver que la economía iba encaminada a una crisis, no lo hicieron mediante el uso de modelos o probabilidades, algo imposible, pues sería necesario homogeneidad de las funciones del modelo a lo largo del tiempo para lo primero y un mundo estacionario para lo segundo.

[20] http://www.cmegroup.com/trading/interest-rates/countdown-to-fomc.html

[21] Se puede ver, por ejemplo, cómo Nate Silver explicaba las causas de su fallo en la predicción:
How I Acted Like A Pundit And Screwed Up On Donald Trump (mayo de 2016). Nate Silver.

[22] El hecho de que no sea estacionaria significa que, para el día de las elecciones “te”, la distribución del conjunto será diferente a la distribución del día de antes, por lo que, incluso conociendo la preferencia de la población total el día "te-1", habrá indecisos que decidan cambiar su voto, participar en las elecciones o directamente cambien sus preferencias, lo cual no sigue un proceso estocástico estacionario.

No hay comentarios:

Publicar un comentario