Metodología: cómo se calcula el Consensus Score
Esta página describe en detalle cómo se calculan las dos métricas principales que aparecen en cada ficha de libro: el Consensus Score y el índice de polarización. La metodología es pública y reproducible.
Fuentes de datos
El sistema agrega información de tres fuentes públicas:
- OpenLibrary — base de datos abierta del Internet Archive. Cada obra (work) tiene una distribución de valoraciones por estrellas (1-5) y un promedio agregado.
- Google Books — API de Google que expone valoración media (1-5) y número total de reseñas, cuando están disponibles.
- Wikidata — base de datos estructurada con metadatos enciclopédicos: año de primera publicación, premios obtenidos, idioma original, ISBN.
La identificación de cada libro se hace por ISBN-13 cuando es posible, con resolución por título y autor como respaldo. La metadata cruzada permite detectar discrepancias entre fuentes.
Cálculo del Consensus Score
Una vez recogidas las puntuaciones de cada fuente:
- Cada puntuación 1-5 estrellas se normaliza a una escala 0-10 (multiplicando por 2).
- A cada fuente se le asigna un peso de partida: OpenLibrary 0,8 · Google Books 1,0. La diferencia refleja que las valoraciones de Google Books tienden a tener mayor diversidad demográfica.
- Cada peso se multiplica por
log10(valoraciones+1) + 1. Así, una fuente con 5.000 valoraciones pesa más que una con 50, pero la diferencia no escala linealmente — evitando que una sola fuente domine. - El Consensus Score es la media ponderada resultante, redondeada a una cifra decimal.
Ejemplo: si OpenLibrary muestra 4,3/5 (8,6/10) con 48 valoraciones y Google Books no tiene datos, el resultado es 8,6/10 con una sola fuente. Si una segunda fuente reporta 4,1/5 (8,2/10) con 2.341 valoraciones, el peso desplazará el promedio hacia ese valor.
Cálculo del índice de polarización
El índice de polarización mide cuánto discrepan los lectores entre sí, no cuán bueno o malo es un libro.
- Se reconstruye el conjunto de valoraciones individuales a partir de la distribución por estrellas que publica OpenLibrary.
- Se calcula la desviación típica poblacional (σ) sobre la escala 1-5.
- Se mapea ese valor a una escala 0-100 multiplicando por 50 y aplicando un techo de 100.
Como referencia: una distribución plana entre 1 y 5 estrellas tiene σ ≈ 1,41. Una distribución muy bimodal (solo 1 y 5 estrellas) ronda σ ≈ 2,0. Etiquetas:
- Polarización alta (≥60): opiniones divididas. Ideal para club de lectura.
- Polarización baja (≤25): consenso amplio.
- Valores intermedios: opiniones mixtas.
Tiempo de lectura
Calculado a partir del número de páginas reportado por OpenLibrary o Google Books, asumiendo una velocidad media de lectura de 250 palabras/minuto y una densidad media de 425 palabras por página, lo que da aproximadamente 1,7 minutos por página. Es una estimación; la velocidad real depende de la complejidad del texto y del lector.
Limitaciones
- No todos los libros tienen suficientes valoraciones públicas. Cuando faltan datos, el libro se muestra sin puntuación en lugar de inventarla.
- El Consensus Score se calcula sobre las fuentes disponibles. Algunas valoraciones pueden estar sesgadas hacia lectores anglosajones (Google Books), hacia lectores académicos (OpenLibrary) o hacia ediciones específicas.
- La polarización se calcula solo cuando hay distribución completa de estrellas (al menos cinco valoraciones).
- Los datos se refrescan periódicamente, pero no en tiempo real. Cada ficha indica las fuentes y el número de valoraciones agregadas.
Reproducibilidad
El código que realiza la agregación está disponible en el repositorio del proyecto. Cualquier persona puede ejecutarlo con los mismos identificadores ISBN y obtener resultados equivalentes (pequeñas diferencias temporales son posibles si las fuentes se actualizan entre ejecuciones).