RSS Towards Data Science - Medium フォロー PyMuPDF がテーブルを認識できない場合:Azure Layout を使用した RAG 用 PDF の解析 エンタープライズドキュメントインテリジェンス [Vol.1 #5bis] - 同じリレーショナルテーブル。ネイティブテーブルセル。スキャンされたページや画像用のOCR。正規表現なしのキャプションと見出し。 When PyMuPDF Can’t See the Table: Parse PDFs for RAG with Azure Layout towardsdatascience.com