Garantizando la bibliografía más actual: Un "Buscador de Nuevas Ediciones" para nuestro fondo bibliográfico
Como biblioteca universitaria, nuestra misión es ofrecer a los alumnos la bibliografía más actual y relevante. Sin embargo, en la Facultad de Ciencias Económicas y Empresariales, esto supone un reto logístico enorme: solo nuestra bibliografía recomendada consta de unos 4.000 títulos.
El Problema: Infinitas horas de "clic" para mantener nuestro catálogo actualizado
Y es que el problema de mantener el catalogo actualizado no es solo de volumen, sino que el proceso manual es un cuello de botella inasumible que supone los siguientes pasos:
- Tomar el título y autor del libro.
- Buscarlos dichos datos en un buscador de internet
- Revisar múltiples URLs (intentando evitar aquellas que no aportan información útil) para localizar el año de la edición más reciente.
- Extraer y registrar la información de la nueva edición encontrada, si la hubiera.
Según nuestras estimaciones, por libro, este proceso toma una media de 30-35 segundos. Multiplicado por 4.000 títulos si, por ejemplo, quisieramos revisar toda la bibligrafía recomendada, supondría aproximadamente 35 horas de trabajo de verificación manual. Además, hay que destacar que pese a que esto parecería simplemente "una semana de trabajo", en realidad es una tarea mecánicamente tan repetitiva que es irreal asignarsela a una persona de forma continua y esperar buenos resultados. El resultado era una actualización lenta y con un "costo de oportunidad" altísimo para el personal de la biblioteca ya que no podía dedicarse a tareas de mayor valor.
La Solución: "Buscador de Nuevas Ediciones", un asistente automático de búsqueda y comparación
Como remedio a esta situación, desde la Biblioteca de Ciencias Económicas y Empresariales desarrollamos el "Buscador de Nuevas Ediciones", una herramienta programada en Python y alojada como aplicación interactiva en Hugging Face Spaces para su uso gratuito y libre para toda las comunidad universitaria.
Su funcionamiento es el siguiente:
- Entrada: El personal de la biblioteca sube un archivo Excel con la bibliografía a examinar (con columnas como
Title,Author,yeareIdioma). - Proceso: La aplicación analiza cada fila.
- Si el libro es español (
es), usa Selenium para navegar y scrapear la web del ISBN del Ministerio de Cultura, buscando la edición más reciente. - Si el libro es extranjero (
no-es), consulta la API de Open Library para encontrar la última edición publicada.
- Si el libro es español (
- Salida: La herramienta genera y devuelve un nuevo archivo Excel enriquecido usando un código de colores para marcar las coincidencias encontradas:
- 🟩 Verde: Éxito total. Se encontró una edición más nueva.
- 🟨 Amarillo: Éxito, pero con necesidad de revisión humana (ej: "El título no coincide exactamente"). La herramienta proporciona todos los datos encontrados (ISBN, año, título) en el propio Excel y marca el motivo, para que la revisión humana sea rápida.
- 🟥 Rojo: Fallo.La búsqueda no se pudo completar o hubo un error de input.
- ⬜ (Sin color): Éxito - sin versión más reciente. La búsqueda funcionó, pero la edición que teníamos ya era la más actual.
Así, gracias a nuesta app, en lugar de infinitvas horas de clics manuales, el personal solo tiene que subir un archivo, dejar que la herramienta trabaje en segundo plano y, finalmente, revisar el informe.
La Demostración (El "Cómo Funciona")
No hay mejor forma de demostrar valor que viéndolo en acción.
Mira un caso de uso real:
Toda la tecnología (Python, Selenium para el scraping, la API de Open Library y Gradio para la interfaz) se ejecuta directamente en el Space. Para total transparencia, el código de la "app.py" está disponible públicamente en la pestaña "Files" del Space para que otros colegas puedan revisarlo, sugerir contribuciones o adaptarlo.
El Impacto: De "Inviable" a "Periódico"
El impacto principal de este proyecto no solo la optimización del tiempo; es la viabilidad de una tarea que, en la práctica, era inabordable en su completitud. La revisión manual de miles de títulos simplemente se hacía imposible de acometer de forma manual, de tal forma que el catálogo se actualizaba de forma reactiva, solo para los títulos más demandados o cuando se recibía información específica.
El nuevo flujo de trabajo transforma el proceso. Volviendo al ejemplo de la bibliografía recomendada de la Facultad de Ciencias Económicas y Empresariales, estos serían los tiempos:
- Tiempo de Cómputo: La aplicación sería capaz de procesar los 4.000 títulos en aproximadamente 5.5 horas. Esencialmente,tiempo de máquina, durante el cual el personal de la biblioteca está libre para realizar otras tareas de valor.
- Tiempo Humano (Revisión): El personal ya no busca, solo revisa. Asumiendo (de forma conservadora) que un 25% de los títulos (1.000 libros) sean marcados como "Verde" (nuevo) o "Amarillo" (revisar), y dedicando 10 segundos a la comprobación visual del ISBN, el tiempo humano total se reduce a 2.8 horas.
El resultado es un cambio fundamental:
- Antes: 35 horas de trabajo humano activo.
- Después: 2.8 horas de trabajo humano de revisión (un proceso sistemático).
Esto supone una reducción de aproximadamente un 90% en el esfuerzo humano activo siendo el impacto real doble:
- Beneficio Cualitativo: El personal se libera de una tarea mecánica de bajo valor y puede dedicar esas horas a lo que realmente importa: la asistencia a investigadores, la formación de usuarios o la catalogación especializada.
- Impacto en la Calidad: Lo que antes, en la práctica, no se hacía de forma consistente, ahora puede ejecutarse de forma periodica. Así, podemos garantizar que nuestro catálogo cumpla con la política de adquisiciones de la biblioteca y ofrezca el mejor servicio a los alumnos.
Mejoras futuras y Llamada a la Acción
A pesar de lo dicho, somos conscientes de que esta herramienta es solo un primer paso y tiene importantes debilidades como que su eficacia depende de la fiabilidad de las fuentes de datos consultadas. Por ello, a corto plazo, nuestra prioridad es explorar la integración de fuentes de datos libres adicionales. Tanto la base de datos del ISBN como la API de Open Library, aunque valiosas, no siempre reflejan las ediciones más recientes con celeridad, especialmente si son muy nuevas.
Por otro lado, a medio plazo, planeamos integrar una API de traducción (español/inglés) para las palabras clave de los títulos. Esto permitiría a la herramienta localizar ediciones más modernas en ambos idiomas, ampliando significativamente el alcance de la verificación.
¡Pruébalo!
Ahora es tu turno:
- Prueba la demo: Buscador de Nuevas Ediciones
- Deja un comentario en la pestaña "Community" del Space con tus ideas o sugerencias.
- Contáctame: Si trabajas en otra biblioteca y te enfrentas a este mismo problema, si hay algo que quieras preguntarme o si puedo ayudarte en algo, puedes escribirme a [email protected].