Metodología: cómo se calcula el Consensus Score

Esta página describe en detalle cómo se calculan las dos métricas principales que aparecen en cada ficha de libro: el Consensus Score y el índice de polarización. La metodología es pública y reproducible.

Fuentes de datos

El sistema agrega información de tres fuentes públicas:

OpenLibrary — base de datos abierta del Internet Archive. Cada obra (work) tiene una distribución de valoraciones por estrellas (1-5) y un promedio agregado.
Google Books — API de Google que expone valoración media (1-5) y número total de reseñas, cuando están disponibles.
Wikidata — base de datos estructurada con metadatos enciclopédicos: año de primera publicación, premios obtenidos, idioma original, ISBN.

La identificación de cada libro se hace por ISBN-13 cuando es posible, con resolución por título y autor como respaldo. La metadata cruzada permite detectar discrepancias entre fuentes.

Cálculo del Consensus Score

Una vez recogidas las puntuaciones de cada fuente:

Cada puntuación 1-5 estrellas se normaliza a una escala 0-10 (multiplicando por 2).
A cada fuente se le asigna un peso de partida: OpenLibrary 0,8 · Google Books 1,0. La diferencia refleja que las valoraciones de Google Books tienden a tener mayor diversidad demográfica.
Cada peso se multiplica por log10(valoraciones+1) + 1. Así, una fuente con 5.000 valoraciones pesa más que una con 50, pero la diferencia no escala linealmente — evitando que una sola fuente domine.
El Consensus Score es la media ponderada resultante, redondeada a una cifra decimal.

Ejemplo: si OpenLibrary muestra 4,3/5 (8,6/10) con 48 valoraciones y Google Books no tiene datos, el resultado es 8,6/10 con una sola fuente. Si una segunda fuente reporta 4,1/5 (8,2/10) con 2.341 valoraciones, el peso desplazará el promedio hacia ese valor.

Cálculo del índice de polarización

El índice de polarización mide cuánto discrepan los lectores entre sí, no cuán bueno o malo es un libro.

Se reconstruye el conjunto de valoraciones individuales a partir de la distribución por estrellas que publica OpenLibrary.
Se calcula la desviación típica poblacional (σ) sobre la escala 1-5.
Se mapea ese valor a una escala 0-100 multiplicando por 50 y aplicando un techo de 100.

Como referencia: una distribución plana entre 1 y 5 estrellas tiene σ ≈ 1,41. Una distribución muy bimodal (solo 1 y 5 estrellas) ronda σ ≈ 2,0. Etiquetas:

Polarización alta (≥60): opiniones divididas. Ideal para club de lectura.
Polarización baja (≤25): consenso amplio.
Valores intermedios: opiniones mixtas.

Tiempo de lectura

Calculado a partir del número de páginas reportado por OpenLibrary o Google Books, asumiendo una velocidad media de lectura de 250 palabras/minuto y una densidad media de 425 palabras por página, lo que da aproximadamente 1,7 minutos por página. Es una estimación; la velocidad real depende de la complejidad del texto y del lector.

Limitaciones

No todos los libros tienen suficientes valoraciones públicas. Cuando faltan datos, el libro se muestra sin puntuación en lugar de inventarla.
El Consensus Score se calcula sobre las fuentes disponibles. Algunas valoraciones pueden estar sesgadas hacia lectores anglosajones (Google Books), hacia lectores académicos (OpenLibrary) o hacia ediciones específicas.
La polarización se calcula solo cuando hay distribución completa de estrellas (al menos cinco valoraciones).
Los datos se refrescan periódicamente, pero no en tiempo real. Cada ficha indica las fuentes y el número de valoraciones agregadas.

Reproducibilidad

El código que realiza la agregación está disponible en el repositorio del proyecto. Cualquier persona puede ejecutarlo con los mismos identificadores ISBN y obtener resultados equivalentes (pequeñas diferencias temporales son posibles si las fuentes se actualizan entre ejecuciones).