social media demographics

La primera clase del curso de Infografías impartido por Alberto Cairo en el Knight Center consistía en analizar un grupo de infografías. Entre ellas se encontraba esta representación visual de la distribución demográfica de usuarios en las redes sociales (ver original)

social-media-demographics-infographic_cutoff

 

Representadas a modo de planetas, las distintas redes muestran la distribución de usuarios en función del género, la edad, el nivel de educación y de ingresos. Además, el gráfico incluye otros datos adicionales como la media de tiempo empleado en el sitio o la media de visitas en un mes.

El tamaño de la red se refleja en el tamaño del planeta y la distribución de los distintos porcentajes se muestra en gráficos de área circular representando cada grupo por el código de color indicado en la cabecera.

El análisis

El primer problema a la hora de leer el gráfico es la pérdida de referencia. ¿Qué color correspondía a qué? Una vez empiezas a recorrer el gráfico hacia abajo se pierde la compleja leyenda de la cabecera, obligando al lector a volver una y otra vez al inicio de la imagen.

En segundo lugar, la comparación de valores entre las distintas redes resulta muy costosa debido a la  elección de gráficos de área y su distribución en distintos niveles de la composición. Contestar a la sencilla pregunta de qué red tiene el mayor porcentaje de mujeres o de usuarios jóvenes requiere de lápiz y papel al lado del ordenador.

Si bien los datos utilizados son interesantes para hacerse una idea del perfil socio demográfico de los usuarios de estas redes, se echan en falta otros valores de referencia como el número total de usuarios en internet para disponer de un porcentaje relativo del tamaño de cada una de las redes. Asimismo, no se explota la posibilidad de combinar variables para descubrir patrones de relación entre las distintas categorías de perfiles de usuario.

Por último, la gráfica carece de línea narrativa que sirva de apoyo al lector para entender lo que está viendo. El aspecto gráfico prima sobre el informativo.

La propuesta

El primer paso para rehacer la visualización fue tabular los datos y obtener otros valores de referencia que me permitieran relativizar los números. Hacerse a la idea de lo que representan 845 millones de usuarios frente a 4,5 me resultaba complicado sin relativizarlos.

La tabulación de datos me permitió jugar con distintas combinaciones para ver si presentando conjuntamente algunas de las variables podía descubrir patrones o relaciones nuevas. Las nuevas variables que incluí fueron:

  • número total de personas con acceso a internet
  • porcentaje de personas con acceso a internet presentes en cada una de las redes
  • año de creación de cada red social

También fue necesario hacer un filtrado de datos y decidir si excluía alguno. Las medias de tiempo y visitas se quedaron fuera porque, a mi entender, pertenecen a la categoría de uso de las redes y decidí que mi visualización se centrara únicamente en las características sociodemográficas. También influyó la inconsistencia de los datos adicionales: en algunas redes se mostraban las ocupaciones más habituales de los usuarios y otras las regiones de acceso más frecuentes a la red.

Con los datos que tenía debía decidir la historia que quería contar con la visualización y el valor que podían aportar las gráficas frente a los datos tabulados.  El objetivo principal de la propuesta se convirtió en permitir la comparación de valores por categorías y explorar las distintas correlaciones que podían existir entre la distribución de grupos de edad y el año de creación de la red, así como la relación entre niveles de estudios e ingresos económicos.

Cada una de las secciones de la visualización está encabezada por un pequeño resumen que guía la lectura de los gráficos. El tipo de gráficos elegido (barras, puntos y líneas) permite la comparación por alturas y se apoyan en una red de referencia para ubicar los valores en intervalos de 10 unidades.

En algunas variables he incluído el valor numérico (niveles de estudios), en otras tan sólo he señalado los valores máximos de cada grupo (distribución por grupos de edad). La principal razón para no incluir todos los valores numéricos ha sido la legibilidad, limpiar los gráficos de pequeñas manchas que exigían aumentar el tamaño de la visualización para ser leídas. Esto le resta exactitud a la gráfica pero creo que facilita identificar máximos y mínimos y ver tendencias.

Por ejemplo, la gráfica de distribución por grupos de edad está inspirada en las clásicas representaciones de pirámides poblacionales. En este caso, las pirámides están giradas 90 grados y cortadas por la mitad por motivos de composición visual. Los máximos de cada grupo están señalados por un triángulo de color y la leyenda de cada grupo está dentro del foco de la gráfica. Los números totales y relativos de usuarios de cada red se presentan a continuación para hacerse a la idea de la dimensión de cada comunidad. De un vistazo el lector puede ver la homogeneidad en la distribución en Reddit y o la notable diferencia entre la edad de usuarios de Facebook o Google+.

distribucion grupos edad

Respecto a los recursos visuales, he intentado evitar cualquier tipo de metáfora y utilizar únicamente elementos geométricos básicos (líneas, círculos, triángulos y rectángulos) para centrar la lectura. Lo más problemático ha sido el uso de cuadrados y círculos para indicar los porcentajes de hombres y mujeres. Esta gráfica no incluye los valores numéricos y creo que puede resultar difícil ver si el punto lo marcan los bordes de la figura o su centro.

Por ejemplo, el porcentaje de hombres en Facebook. ¿está más cerca de 40 o de 45? El valor real es 43, marcado por el centro de la figura. Las líneas que unen los círculos y los cuadrados intentan dar una pista de esta referencia pero no estoy segura de que lo hagan. Las líneas, sin embargo, sí creo que son de gran ayuda para identificar rápidamente la tendencia en cada red y su altura ayuda a ver dónde se dan las mayores diferencias.

distribucion por genero

 

Por último, los colores se reducen al rojo para marcar la línea del 50% en el eje vertical y el verde para señalar valores máximos. Sin embargo, en la última gráfica se combinan 4 valores diferentes y fue necesario incluir más colores para distinguir más fácilmente cada uno de los grupos. Es la más compleja de todas y la única que incluye los valores numéricos de cada variable. La razón es que los tamaños de las barras eran muy similares entre sí y creo que los números son útiles aquí para ver las diferencias de cada grupo.

estudios-ingresos

El resultado final tiene dos versiones: fondo oscuro y fondo claro. Quería probar cuál era más sencilla de leer en función del fondo. Creo que las gráficas funcionan de la parte superior funcionan mejor con el fondo oscuro pero la última es más legible con el fondo claro, especialmente los valores numéricos de cada barra.

SOCIAL MEDIA DEMOGRAFICS_b-01

SOCIAL MEDIA DEMOGRAFICS_c-02

 

Leave a Reply

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>