ml. mejores libros ·es

Metodología: cómo se calcula el Consensus Score

Esta página describe en detalle cómo se calculan las dos métricas principales que aparecen en cada ficha de libro: el Consensus Score y el índice de polarización. La metodología es pública y reproducible.

Fuentes de datos

El sistema agrega información de tres fuentes públicas:

  1. OpenLibrary — base de datos abierta del Internet Archive. Cada obra (work) tiene una distribución de valoraciones por estrellas (1-5) y un promedio agregado.
  2. Google Books — API de Google que expone valoración media (1-5) y número total de reseñas, cuando están disponibles.
  3. Wikidata — base de datos estructurada con metadatos enciclopédicos: año de primera publicación, premios obtenidos, idioma original, ISBN.

La identificación de cada libro se hace por ISBN-13 cuando es posible, con resolución por título y autor como respaldo. La metadata cruzada permite detectar discrepancias entre fuentes.

Cálculo del Consensus Score

Una vez recogidas las puntuaciones de cada fuente:

  1. Cada puntuación 1-5 estrellas se normaliza a una escala 0-10 (multiplicando por 2).
  2. A cada fuente se le asigna un peso de partida: OpenLibrary 0,8 · Google Books 1,0. La diferencia refleja que las valoraciones de Google Books tienden a tener mayor diversidad demográfica.
  3. Cada peso se multiplica por log10(valoraciones+1) + 1. Así, una fuente con 5.000 valoraciones pesa más que una con 50, pero la diferencia no escala linealmente — evitando que una sola fuente domine.
  4. El Consensus Score es la media ponderada resultante, redondeada a una cifra decimal.

Ejemplo: si OpenLibrary muestra 4,3/5 (8,6/10) con 48 valoraciones y Google Books no tiene datos, el resultado es 8,6/10 con una sola fuente. Si una segunda fuente reporta 4,1/5 (8,2/10) con 2.341 valoraciones, el peso desplazará el promedio hacia ese valor.

Cálculo del índice de polarización

El índice de polarización mide cuánto discrepan los lectores entre sí, no cuán bueno o malo es un libro.

  1. Se reconstruye el conjunto de valoraciones individuales a partir de la distribución por estrellas que publica OpenLibrary.
  2. Se calcula la desviación típica poblacional (σ) sobre la escala 1-5.
  3. Se mapea ese valor a una escala 0-100 multiplicando por 50 y aplicando un techo de 100.

Como referencia: una distribución plana entre 1 y 5 estrellas tiene σ ≈ 1,41. Una distribución muy bimodal (solo 1 y 5 estrellas) ronda σ ≈ 2,0. Etiquetas:

  • Polarización alta (≥60): opiniones divididas. Ideal para club de lectura.
  • Polarización baja (≤25): consenso amplio.
  • Valores intermedios: opiniones mixtas.

Tiempo de lectura

Calculado a partir del número de páginas reportado por OpenLibrary o Google Books, asumiendo una velocidad media de lectura de 250 palabras/minuto y una densidad media de 425 palabras por página, lo que da aproximadamente 1,7 minutos por página. Es una estimación; la velocidad real depende de la complejidad del texto y del lector.

Limitaciones

  • No todos los libros tienen suficientes valoraciones públicas. Cuando faltan datos, el libro se muestra sin puntuación en lugar de inventarla.
  • El Consensus Score se calcula sobre las fuentes disponibles. Algunas valoraciones pueden estar sesgadas hacia lectores anglosajones (Google Books), hacia lectores académicos (OpenLibrary) o hacia ediciones específicas.
  • La polarización se calcula solo cuando hay distribución completa de estrellas (al menos cinco valoraciones).
  • Los datos se refrescan periódicamente, pero no en tiempo real. Cada ficha indica las fuentes y el número de valoraciones agregadas.

Reproducibilidad

El código que realiza la agregación está disponible en el repositorio del proyecto. Cualquier persona puede ejecutarlo con los mismos identificadores ISBN y obtener resultados equivalentes (pequeñas diferencias temporales son posibles si las fuentes se actualizan entre ejecuciones).