米マサチューセッツ工科大学、米OpenAI社、英オックスフォード大学がプレプリントサーバーの arXivに発表した共同研究によると、画像と言語を組み合わせた機械学習モデル(VLM:Vision-language models)は「ない」「~しない」といった否定表現をほとんど理解できず、実世界の応用で重大な誤診リスクがはらんでいる可能性があるという。例えば、胸部X線画像に「組織の腫れはあるが心臓の拡大はない」と記載されている場合、本来は心臓疾患以外の鑑別が必要であるにもかかわらず、VLMは「腫れ」「拡大」というキーワードだけを重視し、誤った類似症例を提示する可能性がある。 研究チームはまず、既存データセットの画像キャプションを大規模
Source: 一般情報
視覚言語機械学習モデルは「~なし」など否定表現の理解に課題、誤認のリスクも
視覚言語機械学習モデルは「~なし」など否定表現の理解に課題、誤認のリスクも
投稿日: