技術・スキル

VLMを使って、スライド⽂脈を加味したスライド情報抽出をしてみる

企業の資料作成でよく⽤いられる「スライド」に着⽬し、スライドをナレッジ化する際に、VLM(Vision Language Model)を用いて⽂脈を加味した情報抽出をおこなう⽅法について、簡単に調査検証してみました。