Ciencia
De aquellos datos, estas conclusiones

Entre científicos, la controversia sobre qué estadística es la “correcta” sigue a día de hoy. Cuál se usa en distintos campos tiene mucho que ver con la costumbre.

Estadísticas
Foto de Quinn Dombrowski.
24 ago 2019 06:49

Cómo aprendemos a partir de los datos? Si confirman una teoría, creemos más en ella, y si la contradicen, la rechazamos. Parece de sentido sentido común, y una versión ligeramente más refinada es lo que se conoce como método científico. Esta forma de aprender tiene varios aspectos sorprendentes y detalles tremendamente interesantes. Sin embargo, también puede subvertirse para hacernos “aprender” cosas que tienen poco que ver con la realidad.

En realidad, los datos por sí solos nunca confirman ni rechazan del todo un punto de partida. Si por ejemplo miramos las temperaturas máximas en España durante los últimos cien años, los valores registrados (los “datos”), podrían ocurrir tanto si hay cambio climático como si no lo hay. ¿Eso significa que no nos dicen nada sobre si lo hay? No, porque las probabilidades de que ocurran no son las mismas. Si no hay cambio climático, esperaríamos que las temperaturas se distribuyan completamente al azar. Sería muy sorprendente que las más altas se dieran en años recientes, aunque no imposible (la probabilidad sería muy baja aunque no cero, porque nunca lo es). Si hay cambio climático sí tendrían una probabilidad muy alta.

Vamos a centrarnos en cómo se utilizan en ciencia los métodos para obtener unas conclusiones a partir de unos datos. La forma en que, a partir de un punto de partida, se llega a saber con qué probabilidad pueden ocurrir esos datos es lo que se conoce como cálculo de probabilidades. Al punto de partida, por cierto, también se le llama “hipótesis” o “modelo”. La probabilidad es un campo muy estudiado, que se entiende bastante bien y sobre el que hay poca controversia. Normalmente la parte más importante es la de crear/imaginar —pñor algo decía Einstein que “la imaginación es más importante que el conocimiento”— buenos modelos que describan lo que ocurre y a partir de ahí existen múltiples técnicas para calcular las probabilidades que queremos saber sobre los datos.

Sin embargo en lo que normalmente estamos interesados es en lo contrario: saber hasta qué punto creer un modelo u otro en base a los datos que tenemos. Es decir, el proceso inverso al de calcular la probabilidad de los datos. La disciplina que estudia esta especie de trabajo detectivesco se conoce como inferencia estadística (a veces simplemente, estadística). Es a la vez más interesante y mucho más controvertida que el mero cálculo de probabilidades, en el cual está basada.

Piense como una científica

La forma de encontrar la probabilidad inversa, es decir, la probabilidad de algo a partir de los datos, es relativamente sencilla. En realidad el cerebro humano ya la utiliza de forma natural sin darnos cuenta. “Estas huellas podrían ser de pantera o de gato, ¿cuánto se parecen realmente a unas u otras?, ¿cuántas panteras y gatos hay por estos parajes?, y a raíz de esto, ¿cuánto tengo que preocuparme entonces?”. Sin hacer cálculos de forma consciente, por lo general estimamos bien, tal y como lo haríamos si usáramos lo que se llama “estadística Bayesiana”. En ella, calcularíamos la probabilidad del modelo como proporcional al producto de la probabilidad inicial veces la probabilidad de los datos según el modelo.
A nivel de individuos interesados en conocer cómo es la realidad, es bueno ser consciente de que hay múltiples formas de engañar “con estadística”

Laplace, científico pionero en el cálculo de probabilidades, ya utilizaba a principios del siglo XIX esta forma para hacer inferencia estadística. Con ella pudo estimar entre otras cosas la masa del planeta Saturno con tan solo un 0,4% de error, una precisión asombrosamente buena para la época.

En realidad con esta estadística lo que hacemos es actualizar una estimación a partir de unos datos. Es decir, necesitamos tener una estimación inicial (comúnmente llamada probabilidad a priori, o prior) antes de usarla. El resultado de la estimación depende mucho de ese prior. ¿Y qué prior utilizar? La falta de consenso en ese último punto llevó a la estadística por un largo desvío durante muchos años.

Probabilidad, ¿frecuencia o medida de la incertidumbre?

Donde sí estaban las cosas más claras era en, dado un modelo, saber la probabilidad de que salgan unos datos, en el sentido siguiente: si repetimos el mismo experimento muchas veces ¿cuántas veces ocurre cada resultado? Por ejemplo, si tiramos un dado muchas veces, ¿cuántas veces saldrá el 6?

Interpretando la probabilidad como esa frecuencia para muchas repeticiones, en lugar de como una medida de la incertidumbre, se desarrolló todo un grupo de técnicas “estadísticas” para analizar los datos. Es lo que se conoce como “estadística frecuentista”, y es la otra corriente principal en ciencia sobre cómo interpretar los datos.

Los distintos conceptos y tests estadísticos que se crearon son muy potentes y ayudan tanto a entender los datos como a tomar decisiones en base a ellos. Sin embargo, utilizarlos correctamente requiere estar atentos a sutilezas y en realidad no responden a las preguntas que uno se suele plantear. Por ejemplo, en lugar de decir que la masa de Saturno está entre ciertos valores con una cierta la probabilidad, lo que dicen son cosas como que si repetimos muchas veces el tomar los datos, se construiría un intervalo en el que su masa caería dentro un cierto número de veces. Algo que está relacionado, pero que ni es lo mismo ni tampoco muy intuitivo.

Sorprendentemente a día de hoy la estadística frecuentista sigue siendo el estándar que se enseña en la universidad. Sin embargo en las últimas décadas vuelve a haber más científicos que se toman en serio la estadística Bayesiana, en la que se han desarrollado técnicas más potentes, que no son solo más generales que las frecuentistas, sino que las pueden justificar cuando estas tienen sentido, y dar una respuesta mejor cuando no.

Entre científicos, la controversia sobre qué estadística es la “correcta” sigue a día de hoy. Cuál se usa en distintos campos tiene mucho que ver con la costumbre. En campos como la física de partículas se utiliza mucho la versión frecuentista, mientras que en otros como la astrofísica o más modernamente en inteligencia artificial normalmente se tiene una visión Bayesiana.

Este es el panorama actual en ciencia en cuanto a estadística. A pesar de sus diferencias, en la práctica con ambas formas, Bayesiana y frecuentista, podemos aprender bien en base a los datos y entender mejor el mundo. Es solo en ciertos casos límite que la distinción se vuelve importante (y en esos casos, nuestra opinión sobre cuál es la adecuada habrá quedado clara).

Mentiras, malditas mentiras, y estadística

La inferencia estadística es una herramienta con la que podemos conocer el mundo cada vez mejor a partir de los datos que tenemos. No solo en ciencia, sino en cualquier aspecto de la vida.

Así que para ir siendo más sabios, basta con tomar cada vez más datos. ¿No?

La razón de que no sea tan fácil es que normalmente los datos que nos llegan no son independientes, suelen estar sesgados. Si nos quieren hacer creer alguna mentira, qué mejor que hacernos llegar unos datos y no otros, tal vez incluso sacarlos de contexto o hasta distorsionarlos un poco, y para recubrirlo todo añadir un análisis estadístico en base a ellos y que dé apariencia de verdad inescapable a la conclusión.

Aquí lo que está en cuestión no es la metodología científica para plantear experimentos y obtener información, ni las interpretaciones varias de la “inferencia estadística”. A nivel de individuos interesados en conocer cómo es la realidad, es bueno ser consciente de que hay múltiples formas de engañar “con estadística”. Esto no se les pasa por alto a quienes quieren manipular las opiniones, ni es algo nuevo. Sobre las formas en que se hace, y qué podemos hacer al respecto, esperamos hablar en un próximo artículo.

Archivado en: Ciencia
Informar de un error
Es necesario tener cuenta y acceder a ella para poder hacer envíos. Regístrate. Entra en tu cuenta.

Relacionadas

Ecofeminismo
Cuando la ciencia y el feminismo se encuentran en la naturaleza. Carson y Margulis sembraron ecofeminismo.
Rachel Carson y Lynn Margulis desafiaron el pensamiento dominante y patriarcal.
Ciencia
Tribuna La mediación social de la ciencia
No se puede programar un sistema equilibrado de ciencia y tecnología a golpe de titular, como tampoco se puede desplegar la actividad científica al margen de las necesidades radicales de la población y el desarrollo nacional.
Ciencia
un día para la ciencia, 364 días para la precariedad La ciencia precaria del 11F
La precariedad en la investigación sigue imparable y el efecto tijera-pinza cada vez es más visible. Y los últimos informes no parecen presentar mejoría a largo plazo.
David González
25/8/2019 11:18

Gracias por el artículo.

Sigo creyendo que la era del Big Data está fundamentada en el síndrome de Diógenes del dato, generando silos tóxicos. Aquí, la Teoría de Muestreo ha sido relejada por un discurso marquetiniano basado en una columna que se tambalea sin sesar: la Ley de los Pequeños Números.

Que barbaridades ve uno en las empresas, buscando el número dorado, sea o no real.

Un saludo, Compañero

1
0
Economía
Aranceles Trump anuncia nuevos aranceles del 20% a Europa en ‘el día de la liberación’
El presidente de los Estados Unidos vuelve a amenazar con impuestos a las importaciones que, según él, son respuesta a los gravámenes sobre empresas estadounidenses en Europa.
Genocidio
Genocidio En esta última ofensiva, Israel ataca con fuerza al aparato político de Hamás en Gaza
Pese a las numerosas bajas de los últimos 18 meses de guerra, Hamás habría reclutado al menos entre 10.000 y 15.000 combatientes nuevos.
Macrogranjas
Maltrato animal Retiran el sello de bienestar animal a la granja vinculada a Mercadona donde ocurrió una “masacre” de pollos
La propietaria de la instalación, Lusiaves, ha perdido la certificación catalana de bienestar animal Welfair. Tras las difusión de imágenes de la “masacre”, plantilla actual y pasada de la empresa aseguró que eran prácticas “recurrentes”.
Galicia
Vivienda ¿Por qué no nos atrevemos a hablar de rentismo popular? Cuando tu casero no es un fondo buitre
Activistas y especialistas abordan la incidencia y la responsabilidad de los pequeños propietarios en el problema de la vivienda en Galicia, donde es especialmente incidente, y en el resto del Estado.
Comunidad de Madrid
Instituto del Menor La Comunidad de Madrid arranca una hija a una mujer peruana que ha denunciado violencia de género
La madre afectada, Pamela L.C., considera que ha habido un componente racista en el arrancamiento. La mujer no obtuvo ninguna información sobre el paradero de su hija hasta la citación en el Instituto Madrileño del Menor una semana después del parto.
Almería
Medio ambiente La demolición del Algarrobico será “este mismo año”
El Gobierno ha publicado en el BOE el proceso de expropiación de la parcela. La ministra de Hacienda asegura que el derribo será “con o sin la colaboración de la Junta de Andalucía”.

Últimas

León
Accidentes laborales Cuatro mil personas despiden en Villablino a los mineros muertos
Los sindicatos se concentran en Oviedo y exigen al Principado que se persone como acusación particular en el proceso penal. En 2023, un vecino alertó de las condiciones de inseguridad bajo las que operaba la mina.
Desempleo
Empleo El paro en mujeres marca un mínimo histórico desde 2008
El desempleo se ha reducido en 146.865 personas en los últimos 12 meses, de los que casi 79.000 son mujeres. La tasa de población activa femenina llega al 47%.
Universidad
Educación El Gobierno anuncia el endurecimiento de la normativa para la creación de universidades privadas
El Consejo de Ministros aprueba la tramitación urgente de una modificación en la legislación que regula la creación de centros privados de enseñanzas universitarias.
Formación El Salto
Formación Masculinidades neoliberales: afectos de odio, cultura bro y extrema derecha
Abiertas las inscripciones para esta nueva propuesta de formación online, que abordará la relación entre el fortalecimiento de las derechas, el avance de un neoliberalismo desbocado y la aparición de culturas de género cada vez más conservadoras.
Estados Unidos
Estados Unidos Estudiantes de Columbia luchan contra las amenazas de deportación
Los estudiantes de Columbia se unen mientras el ICE y el Departamento de Policía de Nueva York (NYPD) atacan el activismo palestino. “[Columbia] está dispuesta a concederle al gobierno de Trump todo lo que quiera”, declara un estudiante a Mondoweiss.
Ecuador
Hacia el 13 de abril Acuerdo histórico de la izquierda y el movimiento indígena para la segunda vuelta de las elecciones en Ecuador
La alianza entre la Revolución Ciudadana y Pachakutik, el brazo político del movimiento indígena, no se producía desde 2006 y podría ser determinante para la victoria de la candidata correísta, Luisa González, en las elecciones del 13 de abril.
Más noticias
València
València La turistificación masiva asfixia los distritos valencianos de Camins al Grau y Algirós
El vecindario se organiza en una plataforma para luchar por el derecho a la vivienda en dos de los distritos con mayor presión turística de la capital del Turia.

Recomendadas

Asturias
Asturias Cinco muertos en la mina de Zarréu: demasiadas preguntas sin respuesta
El accidente más grave en la minería asturiana en casi tres décadas vuelve a poner en cuestión el sistema de permisos, controles y ayudas públicas para minas en proceso de reconversión.
Violencia obstétrica
Violencia obstétrica Helena Eyimi, matrona: “El parto es un misterio y queremos controlarlo todo, pero no podemos”
Consentimiento informado, trato personalizado y libertad de elección. Para Helena Eyimi (Madrid, 1975) , matrona asesora de Naciones Unidas, es fundamental que las mujeres se sitúen en el centro de las decisiones durante el parto y esos tres conceptos son clave.
Culturas
Culturas Lorca fue también un visionario que intuyó los vínculos entre la música negra y el flamenco
La 24ª edición del Festival de Flamenco de Nueva York abrió un espacio de debate para analizar el impacto que tuvo el movimiento cultural del Renacimiento de Harlem en la obra del poeta granadino.