L'auteur explore les moyens de générer un résumé de plusieurs documents en fonction de certains critères. Ils considèrent deux approches : créer un graphique et utiliser un grand modèle de langage (LLM) pour générer un résumé ou répondre à des questions, ou créer des résumés de documents individuels puis les combiner. L'auteur a écrit du code pour récupérer des articles de nouvelles sur un sujet, créer un graphique et résumer l'information. Le code utilise l'API de recherche DuckDuckGo pour récupérer des articles de nouvelles, et l'API d'intelligence artificielle générale pour extraire des entités et des relations des articles. Les entités et les relations sont utilisées pour créer un graphique, qui est ensuite utilisé pour générer un résumé du sujet. L'auteur est incertain si la création d'un graphique est la meilleure approche et sollicite des opinions. Le code utilise la bibliothèque NetworkX pour créer le graphique et la bibliothèque Matplotlib pour le visualiser. L'auteur utilise le modèle Gemini 1.5 Flash 002 pour générer du contenu, y compris le résumé. Le résumé généré est une histoire de 500-800 mots qui exploite les relations entre différents articles de nouvelles. L'auteur cherche à améliorer son approche et est ouvert aux suggestions.
dev.to
Graph + LLM or simply LLM for summarization?
