MarkItDown est une nouvelle bibliothèque développée par Microsoft qui convertit divers formats de fichiers en Markdown pour l'indexation, l'analyse de texte et d'autres fins. Elle prend en charge plusieurs types de fichiers, notamment les PDF, PowerPoint, Word, Excel, les images, les fichiers audio, HTML et d'autres formats basés sur le texte. L'API de la bibliothèque est simple à utiliser, nécessitant seulement quelques lignes de code pour convertir un fichier. Par exemple, la conversion d'un fichier Excel en Markdown peut être effectuée avec le code suivant : from markitdown import MarkItDown; markitdown = MarkItDown(); result = markitdown.convert("test.xlsx"); print(result.text_content). MarkItDown a été mis en avant par Stephan Ango, le PDG d'Obsidian, une application de rédaction et de prise de notes Markdown populaire. Google Docs a récemment ajouté l'exportation en Markdown, facilitant ainsi pour les utilisateurs le travail avec Markdown. MarkItDown est un outil utile pour ceux qui ont besoin de convertir des fichiers en Markdown, et son nom est approprié pour son objectif.
github.com
MarkItDown: Python Tool for Converting Files and Office Documents to Markdown
Create attached notes ...
