Infografías y visualizaciones que simplifican en exceso o confunden datos

Aberto Cairo

Exposición en Chicas Superpoderosas, Miami

El origen de esta presentación viene de una plática que tuvimos mi amiga Mariana y yo. Un día me dijo: ¿podrías dar una plática en Chicas Superpoderosas? Y yo dije: por supuesto que sí... pero ¿una plática sobre qué? Obviamente pensé en visualizaciones e infografía. Ella me contestó: puedes escoger el tema que quieras. Entonces pensé y pensé en puras estupideces, sinceramente.

Esto fue lo que hice: me aislé de todo, de redes sociales, ruidos, de todo lo que me distrajera. Cuando quiero aislarme voy a las librerías. Bueno, entonces la semana pasada fui a Barnes & Noble, empecé a recolectar libros al azar y a ponerlos sobre la mesa y encontré uno muy interesante, que terminé comprando: "Reinventing American Health Care". El libro literalmente me atrapó ya que explica por qué el servicio de salud de Obama es tan innecesario en EE.UU., utilizando información gráfica y muchos ejemplos a través de la visualización.

Todos estos gráficos y visualizaciones dentro de este libro está rodeados de textos, contextos, y esa es la clave para hacer visualizaciones o infográficos, no olvidarnos del contexto que queremos presentar y eso es lo que les deseo advertir, porque ustedes trabajan con visualizaciones y les quiero dar algunos consejos.

¿Cómo pueden mejorar su trabajo? Les daré tres recomendaciones:

Primera recomendación. Las historias son siempre más complicadas de lo que parecen al principio. No traten de simplificar datos en exceso. Les daré algunos ejemplos de lo que digo:

Existe un sitio que se llama Vox.com, que intenta explicar temas complejos a lectores en general y es un excelente ejemplo de como a veces simplificamos en exceso. Hace unas semanas publicaron un montón de infográficos y un grupo de visualizaciones para explicar porqué el sistema de salud actual de los Estados Unidos es tan caro. Utilizaron diagramas, gráficos, cuadros, comparaciones, etc. Leí la publicación y me fui directamente a la fuente principal de todos estos datos: International Federation of Health Plans, y encontré el reporte en el cual Vox.com se basó para crear los infográficos. Me di cuenta que en el reporte no se mencionan muchas cosas interesantes sobre los datos, no se menciona que los precios para cada país se presentan por miembros participantes de International Federation of Health Plans, y la forma en que recopilaron los datos en Estados Unidos y en el resto de los países.

Para Estados Unidos, los precios fueron calculados sobre una base de datos de más de 100 millones de demandas que reflejan los precios negociados y pagados entre miles de proveedores y aproximadamente cien planes de salud comerciales. Cuando consultas los datos recolectados en otros países, los precios para Australia, Argentina y España son del sector privado, con datos proporcionados por un plan de salud privado en cada uno de esos países. No es un indicador. No puedes comparar manzanas con naranjas, y los periodistas que crearon esta historia no tomaron en cuenta estos hechos que no se pueden comparar, porque están comparando una gran base de datos con un sólo proveedor. Otra cosa a la que no pusieron atención fue que las circunstancias de cada uno de los países también afecta los precios, si se tiene un proveedor público de servicios de la salud eso baja los precios porque existe competencia, eso se tiene que tener en cuenta, de hecho la fuente original lo dice: la comparación entre los diferentes países es complicada debido a las diferencias en los sectores, tarifas y sistemas. ¿Por qué no se mostró esta leyenda en Vox.com? Estos datos son muy importantes para entender lo que la información significa, al no tomar en cuenta esto básicamente están creando una historia que no está completa.

Además, cuando Vox.com creó los gráficos, cometió un grave error. En uno de los gráficos que hicieron, muestran cuánto cuesta pasar un día en el hospital en Estados Unidos, Nueva Zelanda, Australia, Argentina y España. En el encabezado del gráfico se lee: el costo de un día en el hospital en Estados Unidos US$4.293 - En Argentina US$702. ¡Por supuesto! Pero los salarios en Estados Unidos son más altos que en Argentina, así que esos datos no son comparables.

El primer principio de visualización, lo tomé de un científico llamado Richard Feynman y dice: "no debes engañarte a ti mismo y eres la persona más fácil de engañar". Debemos recordar esto, porque no podemos saltarnos a la conclusión, tienen que forzarse a si mismos a navegar en los datos y en el contexto. Existe un término específico para cuando tratamos de saltarnos a la conclusión al ver datos, se llama patronicidad, es la tendencia de ver patrones significativos en datos sin sentido. Existen dos libros que hablan sobre la patronicidad "The Believing Brain" de Michael Shermer y "Thinking Fast and Slow" de Daniel Kahneman, ambos libros son muy importantes.

Ahora, este es un ejemplo de patronicidad que me ha pasado. Cada año, voy a Ucrania a impartir un taller sobre infografía y visualización, obviamente todos han leído sobre Ucrania y pues este año no fui por claras razones. La última vez que estuve ahí, esto fue antes que las protestas y la revolución comenzaran, conocí a personas que se dedican a hacer visualizaciones de datos periodísticos para una organización llamada Texty, una organización muy pequeña dedicada a la información, que sólo cuenta con un periodista y un diseñador, ambos muy talentosos. Ellos me mostraron las visualizaciones que habían creado e inmediatamente me di cuenta que eran muy buenas, una de ellas llamó mi atención más que las otras. Hay que recordar que me enseñaron las visualizaciones antes de que las protestas comenzaran. Eran infográficos que mostraban resultados electorales, les mostraré un mapa con dos colores diferentes: anaranjado que representa el partido pro-occidental y azul que representa el partido pro-ruso. Cuando vi el mapa, aunque no hablo ni una palabra en ucraniano, me quedé sorprendido, porque muestra claramente lo que está pasando en Ucrania: la parte occidental del país votó en su mayoría por el partido pro-occidental, mientras que la parte oriental y sur del país votaron por el partido pro-ruso, el partido del ex presidente que había sido expulsado unos meses atrás. Fue una visualización sorprendente... y también un poco confusa, les mostraré porqué. Cuando las protestas comenzaron en Ucrania yo tenía este mapa en mi poder, antes que cualquier organización de noticias de Estados Unidos lo publicara, después empecé a ver los mapas en todos lados. La BBC, por ejemplo, publicó el mapa mostrando en donde empezaron las primeras protestas y si comparas los mapas, si los pones lado a lado hay un traslapo, pues verán que las protestas comenzaron justo en la parte pro-occidental del país y cuando vi los dos mapas y los comparé, les envié un e-mail a los chicos de Texty diciéndoles que su mapa explicaba todo, que era muy claro, era demasiado claro... pero la escena política en Ucrania no era tan simple como la presentaba este mapa o como las organizaciones de noticias de los Estados Unidos la presentaba, es mucho más compleja de lo que parece. Los noticieros presentaban los mapas con una clara división en el país, lo que como encabezado es cierto, pero después del encabezado de la nota tienes que mostrar lo complejo.

Los chicos de Texty respondieron mi e-mail mandándome los resultados de muchos sondeos, en donde se les preguntaba a diferentes personas del país si preferían ser parte de la Unión Europea o si preferían ser parte de la Unión Rusia, y como pueden ver la mayoría de la parte pro-occidental prefirió ser parte de la Unión Europea y si van a la parte oriente y sur en el área más pro-rusa, la imagen no es muy clara, pues sólo el 50% en la parte oriental estaba a favor de unirse a Rusia. Lo que trato de explicar es que en este mapa se está simplificando en exceso, sólo se muestra el encabezado de la nota, necesitamos mostrar una imagen más compleja de las variables y sus relaciones al lector.

Hay cosas que los periodistas hacemos cuando nos saltamos a las conclusiones. Nosotros los periodistas en general, la forma en que creamos historias es que primero tenemos una hipótesis y luego buscamos algo que la confirme, no ponemos atención en lo que potencialmente podríamos comprobar o refutar. Eso no es lo que los científicos hacen, lo que ellos hacen es tener una idea que confirme la hipótesis, que compruebe o refute lo que tienen en mente, así que si alguna vez han hecho esto, tener primero el encabezado de la nota y después la idea, dejen de hacerlo, así no debemos trabajar, olvídense del encabezado por un minuto y exploren primero los datos.

Existe un mapa que fue hecho en el siglo XIX por el médico John Snow, quien investigaba que era lo que causaba el cólera en Londres en ese siglo, ahora sabemos que se debe a beber agua contaminada por una bacteria. En el siglo XIX se pensaba que el cólera se transmitía al inhalar aire contaminado debido a que muchos doctores observaron que los lugares que apestaban era donde se presentaban más casos de cólera, incluso establecieron una relación entre las dos variantes "entre más apeste el lugar, existen más casos de cólera". Sin embargo, John Snow sabía que el cólera no podía ser causado por aire contaminado, él sabía que debía ser por algo más. Su hipótesis era que el cólera era causado por beber agua contaminada, pero ¿cómo comprobarlo en esa época sin los avances de hoy? Lo hizo mediante un mapa.

Las rayas más oscuras representan el número de muertes, entre más se aproximen al centro del mapa, más muertes registradas. Cerca del centro hay un pozo de agua y ahí hay más casos de cólera. Es muy claro. Estos patrones de concentración comprueban la hipótesis pero también tenemos aquí ciertas cosas que la podrían refutar, ¿cómo cuáles? También hay gente que murió de cólera, muy lejos del pozo de agua, ¿por qué murieron? Hay muchos edificios alrededor del pozo de agua en donde no se registraron muertes, eso podría refutar potencialmente la hipótesis.

John Snow hizo algo que nosotros los periodistas deberíamos hacer más, puso atención a estas excepciones. Fue a esos lugares y descubrió que personas que murieron de cólera, que vivían lejos del pozo de agua, cada día camino a sus trabajos y a sus escuelas pasaban y bebían agua del pozo, por eso se contagiaron con la enfermedad. También puso atención a los edificios donde no se registraron muertes, fue a estos lugares y descubrió que estas personas tenían un pozo de agua privado dentro de los edificios y era de donde bebían agua, por eso no contrajeron cólera.

Es necesario poner especial atención a las excepciones, al contexto de los datos y a las variables que puedan afectar la historia.

Segunda recomendación. No se confundan. Sean creativos pero también escépticos de la creatividad. No simplifiquen las cosas en exceso pero tampoco las compliquen. Ahora les voy a hablar de las personas o agencias que admiro y les daré algunos ejemplos de esto.

La primera de ellas es Accurat, que producen muchísimos datos con visualizaciones pero algunos de ellos son muy complicados y difíciles de interpretar, algunos de ellos, no todos. Tenemos uno llamado "Brain drain" (Fuga de cerebros) que intenta presentar el porcentaje de investigadores de cada uno de estos países que son extranjeros, comparado con el número de personas que hacen otra cosas, comparado con esto, comparado con aquello, etc. Me perdí. No entendí nada. Si revisan el número de variables, son muchas. Es muy cansador para mí como lector aunque esté acostumbrado a leer visualizaciones. Esto es lo que pasa cuando se quiere ser sumamente creativo, los datos y variables deben de ser un poco más sencillas para un mejor entendimiento. Esto no significa que no debamos crear visualizaciones hermosas, significa que primero deben ser funcionales, debemos pensar en cómo nuestros lectores las van a interpretar.

Una persona que también admiro es Eric Fischer, quien creó un hermoso mapa de idiomas usados en Twitter. Aunque es un mapa muy bonito, básicamente te muestra algo que ya sabemos: las personas en España mandan tweets en español, los franceses en francés, los ingleses en inglés, los alemanes en alemán, etc. Esto representa a la población en general, ¿en qué sentido es esto interesante? ¿cómo podríamos mejorar este gráfico? ¿qué le falta a este hermoso gráfico? Pues, anotaciones, resaltar las excepciones, los detalles, las historias interesantes en los datos, etc. Les voy a mostrar un ejemplo: yo me pregunto, ¿quiénes son esas personas? ¿cuántas personas en Francia no mandan mensajes en francés? En fin, a este gráfico le falta resaltar los datos interesantes y decir algo respecto a las personas, colocar un número y decir algo sobre estas personas, de esa forma se tendría información del contexto.

Otro gráfico que está muy bien hecho en mi opinión, es del New York Times. Verán que es un gráfico en escala que muestra la relación que existe entre el número de casos de cáncer de seno detectados en estos países y la tasa de mortalidad detectada en cada uno de los mismos. Entre más casos detectados, menor es la cantidad de muertes y entre menos casos detectados, mayor es el número de muertes. Lo interesante del gráfico es cómo resaltan las historias interesantes de los datos, porque incluyen un botón que al darle clic va a desplegar parte de la historia que te dirá algo sobre estos países, existe una interacción entre las palabras y los visuales y eso es la clave, es narrativa, es contar una historia. Debemos tener presente estas técnicas, este tipo de dispositivos.

Por otro lado, debemos tener en cuenta que en algunas ocasiones es conveniente representar nuestros datos más de una vez y lo que veo que es muy frecuente entre diseñadores visuales es que ellos solamente los representan una vez y ya, miles de gráficos y entiéndalos como puedan. Lo que pueden hacer es presentar sus gráficos de diferentes formas: mapas, diagramas, cuadros, barras, etc. porque cada uno de estos gráficos va a llevar al lector a alguna parte.

Tercera Recomendación. Mi última recomendación es enfocarse en aquello que más importe, lo más relevante. Muchos diseñadores visuales se enfocan en gráficas triviales en lugar de enfocarse en cosas de más importancia, como inequidad, salud, acceso al agua potable, etc. Existen algunas visualizaciones que muestran gráficos muy bien hechos pero triviales, sin mucha importancia.

Por ejemplo, la hermosa visualización de Citi Bike de Nueva York, que de hecho es un video, básicamente muestra cuantos viajes en bicicleta se realizan en esa ciudad, a pesar de que visualmente es muy llamativa, no hay ninguna información, después pensé: ¿qué tan relevante es esta información? Tal vez si vives en Nueva York. Creo que tal vez otro tema sería más interesante.

Un ejemplo de una visualización simple y sorprendente hecha por el Wall Street Journal te permite explorar las opciones de servicios de salud que hay en Estados Unidos, en donde puedes navegar utilizando tu dirección o tu código postal, por ejemplo yo que vivo en Miami, escribo mi código postal y me mostrará las opciones que tengo de servicios y planes de salud, los costos, etc. Esto es muy útil, importante y fácil de usar.

Por último, recuerden que nuestra primera responsabilidad como periodistas, diseñadores, es con el planeta, la humanidad, los ciudadanos, y después de eso, después de crear herramientas, nuestra responsabilidad es con los clientes. Nuestro principal objetivo debe ser crear dispositivos que hagan del planeta un lugar mejor antes de considerarnos artistas, creo que muchos diseñadores se consideran a sí mismos como artistas antes de considerarse ingenieros de la información y creo que eso somos, somos ingenieros, creamos dispositivos de información de una forma significativa, relevante y útil.

Alberto Cairo (@albertocairo)

Profesor en la Escuela de Comunicaciones de la Universidad de Miami desde 2012, dirige también el Programa de Visualizaciones de la UM's Center for Computational Science. Autor de “Infografía 2.0: Visualización interactiva de información en prensa” y “The Functional Art: an Introduction to Information Graphics and Visualization”, dos de los libros más consultados y citados respecto al tema. A principios del 2000 lideró la creación del Departamento de Infografías Interactivas del diario español El Mundo, ganando diversos reconocimientos internacionales entre 2001 y 2005. Es invitado habitual para exponer en eventos de periodismo de datos y visualizaciones en todo el mundo.

Publica periódicamente en su blog The Functional Art.

Un proyecto de               Gracias al apoyo de