Inicio > El pizarrón Opinión > Pedro R. García: Todo el mundo miente

Pedro R. García: Todo el mundo miente

 

Apodíctica afirmación de Seth Setphens-Davidowitz

“Es casi imposible yevar la antorcha de la verdad por entre un gentío sin chamuscar a alguien la barba”. (Georg Christoph Lichtenberg).

Acotación necesaria,

Según este seminal texto intitulado “Todo el mundo miente” cuyo autor fue analista científico de datos en Google,  es licenciado en Filosofía y doctor ciencias económicas. Quien ahora es profesor en The Wharton School y articulista de opinión para el New York Times. (traducido por Martín Schifino). Su libro ha sido todo un éxito de ventas, así que pronto nos ofrecerá uno mas en esa inteligente línea de divulgación. Tras el prólogo de Steven Pinker “Las ciencias sociales se están convirtiendo en una verdadera ciencia. Y esa verdadera nueva ciencia tiene la capacidad de cambiar la vida para mejor. Los recientes experimentos demuestran que la inteligencia de datos tiene la capacidad de reemplazar las corazonadas, las ideas recibidas y las correlaciones inadvertidas por cosas que de verdad funcionan: causalmente. Provocando una revolución basada en las revelaciones de los macrodatos. Pero eso no quiere decir que podamos contestar cualquier pregunta con solo proyectarle sobre datos. Más aún, la inteligencia de datos no elimina la necesidad de utilizar las demás formas de concebir el mundo que han desarrollado los seres humanos a lo largo de milenios. Ambos ámbitos se complementan. Con una mezcla de curiosidad, creatividad y datos se puede mejorar nuestra comprensión del mundo. En ellos se ocultan historias dignas de narrarse”. El libro de Seth Setphens-Davidowitz, “Todo el mundo miente. Revela que Internet y el big data pueden decirnos sobre nosotros mismos”, Capitán Swing (2019)  (287 pp.), traducido por Martín Schiaffino, nos ha incitado pensar. Y eso es lo que más puede aspirar un libro. Seguro que si no has leído ningún otro libro sobre la revolución de los macrodatos y lo que las grandes corporaciones como Google, Facebook, Amazon o Netflix saben sobre tí, también te hará reflexionar. Incluso si ya has leído otros textos sobre este tema tan de actualidad, éste destaca por su cuidada escritura; se lee muy fácil y ajusta experiencias personales con investigaciones del propio autor, además de entrevistas e investigaciones de otros científicos de datos. Sin lugar a dudas, un libro que vale la pena. Topamos en el mismo con  ocho capítulos divididos en tres partes, la conclusión y los agradecimientos. En el prólogo (pp. 9-11), Pinker nos dice que “los big data o macrodatos de las búsquedas de internet y otras huellas en línea no constituyen un “cerebroscopio”, pero ofrecen una visión sin precedentes de la psique humana”. Y confiesa que le “impactó sobremanera lo que revela internet sobre la sexualidad humana”. En la “Introducción. El perfil de una revolución” (pp. 15-35), el autor se describe: “soy experto en datos de internet. Todos los días rastreo huellas digitales que se dejan al transitar por la red. A partir de los botones o teclas que apretamos, intento entender qué queremos en realidad, qué haremos en realidad y quiénes somos en realidad”. Y nos relata su propia historia, con Obama, el racismo y Trump como protagonistas. “Con frecuencia la gente miente: a sí misma y a los demás”. Sobre todo en las encuestas y los sondeos. “Las búsquedas de Google constituyen el conjunto de datos más importante jamás recopilado sobre la psique humana. Estos ignorados datos, que están cada vez más disponibles en nuestra era digital, ampliarán radicalmente nuestra comprensión de la humanidad”. Así yegamos a la primera parte “Datos grandes, datos pequeños”, constituida por el capítulo 1, “Malas corazonadas” (pp. 39-55), que se inicia con los consejos de su abuela, tan siempre intuitivos.“La mejor ciencia de datos, en realidad, es sorprendentemente intuitiva. [Casi] cualquier persona inteligente puede comprender los mejores estudios de macrodatos. Si un estudio no se entiende, lo más probable es que el problema resida en el estudio, no en el lector”. Por ejemplo, en contra de la opinión popular, el autor nos muestra que “un mejor estatus socioeconómico brinda una mayor probabilidad de yegar a la NBA”. La segunda parte, “Las capacidades de los macrodatos”, se inicia con el capítulo 2, “¿Tenía razón Freud?” (pp. 59-68). “Karl Popper, el filósofo austro-británico, afirmó que las teorías de Freud no eran falsables. No había manera de demostrar si eran verdaderas o falsas. Hasta ahora, claro”. Por ejemplo, “la teoría freudiana de que los errores revelan nuestros deseos subconscientes es falsable; y, según mi examen de los datos, falsa. Pero ¿erraba Freud el tiro en todas sus teorías? No tanto. La primera vez que tuve acceso a los datos de PornHub, di con una revelación que me pareció cuando menos un poco freudiana. Un número sorprendente de personas buscan representaciones de incesto en los sitios pornográficos convencionales”. “Los macrodatos tienen cuatro capacidades únicas. (1:) Ofrecer nuevos tipos de datos. (2:) Proporcionar datos honestos. (3:) Permitirnos enfocar pequeños subgrupos de personas. ((Y 4:) Consentirnos hacer muchos experimentos sobre relaciones causales”. Así nos adentramos en “¿por qué importa la inteligencia de datos?” en el capítulo 3, “Datos reinventados” (pp. 69-114), que se inicia describiendo el uso de Google Correlate . “La revolución de los macrodatos depende menos de recolectar cada vez más datos que de reunir los datos apropiados”. El autor nos pone el ejemplo de los parámetros fisiológicos de los caballos de carreras en “Los cuerpos como datos”. Cómo la selección de las palabras aporta más información que su propio significado en “Las palabras como datos”. Y finaliza con el uso de “Las imágenes como datos” El libro incluye un gran número de referencias bibliográficas a pie de página, muchas de ellas de artículos científicos y periodísticos del propio autor. También se incluyen enlaces a su página web donde se recopilan los datos usados, para que todos los interesados puedan reproducir sus conclusiones. El capítulo 4, “Suero de la verdad digital” (pp. 115-170) justifica el título del libro: “Todo el mundo miente. En las encuestas, mucha gente se guarda información sobre las conductas y los pensamientos vergonzosos. Quiere salir bien parada, aun cuando la mayoría de las encuestas sean anónimas. El sesgo de deseabilidad social”. Aunque “otro motivo para mentir es simplemente burlarse de las encuestas”, algo típico entre jóvenes afirma el autor. “A veces escribimos en Google lo que pensamos sin censura, sin gran esperanza de que pueda ayudarnos. En ese caso, la ventana de búsqueda funciona como un confesionario. Según mis investigaciones, las búsquedas que expresan pensamientos frente a las que piden información, solo son realizadas por una pequeña porción de las personas a las que se les ocurre el pensamiento”. Por ejemplo, “la mayoría de las personas nunca piensan que pueden arrepentirse de tener hijos. Pero algunas lo hacen. Puede que no lo admitan delante de nadie, salvo de Google”. La sexualidad de los estadounidenses es uno de los temas más jugosos del libro. En la sección “La verdad sobre el sexo” aparecen curiosidades como que “he calculado que un hombre que busca información sobre Judy Garland tiene tres veces más posibilidades de buscar pornografía gay que pornografía heterosexual”. Pero me resultó más interesante “La verdad sobre el odio y el prejuicio” sobre racismo. Tras “La verdad sobre internet”, “La verdad sobre el abuso infantil y el aborto”, “La verdad sobre tus amigos de Facebook”, yegamos a “La verdad sobre tus clientes”, donde Xavier Amatriain, “un ex-científico de datos de Netflix afirma que “los algoritmos te conocen mejor de lo que te conoces a ti mismo”. Finaliza el capítulo con “¿Podemos soportar la verdad?”, que nos recuerda que “sensibilizarnos sobre nuestros prejuicios subconscientes también puede ser útil”. El capítulo 5, “Más de cerca” (pp. 171-207), afirma que “si tenemos suficientes datos, podemos ver cómo se comporta la gente en pueblos y ciudades particulares. Y logramos percibir cómo se conducen hora a hora y minuto a minuto. Advertimos la conducta humana en primer plano”. Se centra en Estados Unidos, pero se mencionan otros países. “¿Estados Unidos es una “tierra de oportunidades”? La respuesta no es ni que sí ni que no. La respuesta es: algunas partes del país lo son; otras, no”. En “¿Qué ocurre realmente en nuestros condados, ciudades y pueblos?” nos encontramos curiosidades como que “los pobres que viven cerca de los ricos hacen más ejercicio, fuman menos y tienen menos probabilidades de padecer obesidad”. “¿En qué ocupamos los minutos y las horas?” se resuelven dudas como si las películas pueden incitar conductas violentas te machaco la duda: no. Por ejemplo, “la violencia doméstica aumenta inmediatamente después de que el equipo de fútbol [americano] local pierda un partido que se esperaba que ganase”. Me ha resultado muy curioso “Nuestros dobles”, donde se afirman que “la búsqueda del doble es el mejor método jamás creado para predecir el desempeño de los beisbolistas” ¿también lo será para los futbolistas?. La idea se puede aplicar a muchos campos. “La pediatría se revolucionaría con solo crear un conjunto de datos completo de las tablas de estatura y peso de los niños y de todas las enfermedades que puedan tener. De ese modo, la curva de crecimiento de cada niño podría compararse con la curva de crecimiento de todos los demás y señalar automáticamente cualquier patrón problemático”. Lo importante no son los datos, per se, sino las “Historias de datos”, como si el científico de datos fuera un Sherlock Holmes. El capítulo 6, “Todo el mundo es un laboratorio” (pp. 209-240) nos habla “de la diferencia entre correlación y causalidad, un tema muy importante en el análisis de datos. Los ensayos aleatorizados se utilizan cada vez más en las ciencias sociales”. Aunque a veces se yaman pruebas A/B como se describe en “El ABC de las pruebas A/B”, muy usadas por los diseñadores de páginas web; el autor nos pone ejemplos de la campaña electoral de Obama y de la publicidad en Google. “Nos guste o no, la experimentación es una de las herramientas esenciales con las que ahora cuentan los científicos de datos”. “Los experimentos crueles, pero iluminadores, de la naturaleza” nos habla de los anuncios en la Super Bowl. “Los anuncios surten efecto. Pero no solo surten efecto. Son increíblemente efectivos. De hecho, los márgenes son enormes. Son tan efectivos para aumentar la demanda que, en realidad, a las empresas les salen baratos”. Me ha resultado curioso cómo afectan los asesinatos de presidentes a la historia del mundo. O cómo los incentivos financieros afectan a lo que recetan los médicos. Por cierto, “los médicos no prestan gran atención a los incentivos financieros de cara a las cosas que ponen en riesgo la vida; prestan mucha atención a los incentivos financieros ante las cosas sin importancia”. “La categoría de los experimentos naturales que aprovecha cortes numéricos abruptos es tan poderosa que tiene su propio nombre ente los economistas: discontinuidad en la regresión”. Estos experimentos tan interesantes nos yevan a la tercera parte, “Macrodatos: precaución”, con el capítulo 7, “¿Macrodatos, macrochascos? Lo que no se puede hacer con ellos” (pp. 243-255). Se inicia con una refrescante anécdota entre Lawrence Summers y el autor sobre la predicción de los mercados financieros usando macrodatos. “¿Se pueden utilizar los macrodatos para predecir con éxito los movimientos de la bolsa? La respuesta breve es que no”. La razón es que somos víctimas de “La maldición de la dimensionalidad”, es decir, “someter a prueba demasiadas cosas”. La relación entre el genoma humano y el coeficiente intelectual es uno de los ejemplos. “Los científicos saben que el genoma humano difiere en millones de formas. Simplemente, hay demasiados genes que analizar. Cuantas más variables se consideren, más prudente habrá que ser y, en consecuencia, más rigurosas deberán ser las pruebas fuera de muestra. Así nos introducimos en “El énfasis excesivo en lo medible” y yegamos al capítulo 8, “¿Más datos, más problemas? Lo que no deberíamos hacer” (pp. 257-268). “A veces, el poder de los macrodatos es tan impresionante que da miedo. Plantea problemas éticos”. Como “El peligro del poder de las corporaciones”, ya que “los datos en internet pueden señalar a las empresas qué clientes deben evitar y a cuáles pueden explotar. Hasta la fecha, los macrodatos han ayudado a ambas partes en la lucha entre consumidores y empresas. Debemos asegurarnos de que la lucha siga siendo justa”. “El peligro del poder de los Gobiernos” nos aconseja que “debemos guardarnos de permitir que el Gobierno intervenga a nivel individual en respuesta a los datos de búsqueda. Y no solo por motivos éticos o legales. Al menos de momento, también por motivos científicos inherentes a los datos”. Así yegamos a la “Conclusión: ¿Cuántas personas acaban los libros?” (pp. 271-281). Tras presentar sus problemas para acabar el libro, nos encontramos con un capítulo bastante flojo, que desmerece mucho al resto. Una pena. Por ejemplo, no me gustado este comentario: “Si Karl Popper estuviera vivo hoy, habría más probabilidades de que se preguntase si los grandes teóricos de cuerdas de hoy son científicos en toda regla o solo se dan el gusto de dedicarse a la gimnasia mental”. No creo que un filósofo de su altura perdiera el tiempo con estas nimiedades. Tampoco este otro: “Toda la psicología podía utilizar las herramientas de Silicon Valley para optimizar notablemente sus investigaciones. Espero con impaciencia el primer artículo de psicología que, en lugar de detallar un par de experimentos hechos con unos pocos estudiantes, muestre los resultados de un millar de rápidas pruebas A/B”. Me ha gustado su confesión como escritor: “Me tomó cinco meses y 47 borradores escribir mi primera columna sobre sexo para The New York Times, que tenía 2.000 palabras. Para algunos capítulos de este libro hice 60 borradores. Puedo pasarme horas buscando la palabra necesaria para una frase de una nota al pie. Pero, por mucho que me esfuerce en pulir la prosa, la mayoría de (los lectores) leerán las primeras 50 páginas, recordarán algunas ideas sueltas y seguirán con su vida. Según los macrodatos, muy pocos siguen leyendo”. Finaliza este libro que me ha gustado mucho con los “Agradecimientos” (pp. 285-287). Lo que más me ha gustado es que me ha hecho pensar sobre qué cosas de mi labor como en mi intento de ser difusor de algunas ideas podrían ser exploradas usando macrodatos y las herramientas que ofrece Google. Por desgracia, mis primeros intentos me han mostrado que se requiere tiempo, mucho tiempo, mucho más tiempo del que puedo dedicar a esta labor en estos momentos. Así que te recomiendo este libro, que seguro que te hará pensar a ti también. Manuel López Zafra, también en una investigación señala “que en un mundo donde todos los días a todas horas, los votantes dejan un rastro digital, triunfara quien sea capaz de identificar el comportamiento de cada segmento de votantes”, (sobre el tema volveremos en una nueva entrega).

“Con nuestras omisiones le hemos cortado una vez más rodajas al tiempo, pero el tiempo sigue igual”

pgpgarcia5@gmail.com

 

Te puede interesar

Loading...
Compartir

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Traducción »