手術動画の階層的ワークフロー認識用大規模視覚言語データセットSurgLaViとSurgCLIP

AIによる要点抽出
  • 視覚と言語の事前学習(VLP)は外科映像と言語の整合によりワークフロー理解やタスク間転移を可能にするが、既存データセットは規模や手技多様性、意味的品質、階層構造が限定されているため、本研究ではこれらを解決する大規模階層型外科ビジョン・ランゲージデータセットSurgLaViを提示する。

続きを読むには
「medパス」での
新規会員登録 / ログインが必要です

ClinPeerの利用には
医療資格を証明する
「medパス」アカウントが必要です。

ClinPeerは、医学用語の正確性を含め、翻訳・要点抽出の精度の継続的な向上に努めています。 翻訳・要点抽出の精度にお気づきの点があれば、お問い合わせよりご連絡ください。 なおClinPeerでは、翻訳・要点抽出の正確性等の保証は致しかねますので、詳細については必ず原文をご確認ください。

意見を送る