AIによる皮膚疾患の診断精度を7つのLLMで比較、正解率トップはGPT-4o

投稿日:

 大規模言語モデル(LLM)による皮膚科的診断は、診断サポートとして有益な可能性がある一方で、診断の正確性に関する知見は限られている。ドイツの研究チームは、乾癬、白斑、丹毒、酒さの4つの皮膚科疾患について、7つのLLM(GPT-4o、GPT-4o mini、Gemini 1.5 Pro、Gemini 1.5 Flash、Claude 3.5 Sonnet、Llama 3.2 90B、Llama 3.2 11B)の診断性能を比較し、その成果をDiagnosisに発表した。 研究チームは、オンラインの皮膚疾患データベース「Atlas Dermatológico」と「DermIS.net」から、乾癬(254枚)、白斑(108枚)、丹毒(85枚)、酒さ(53枚)の4つの皮膚疾患に関する合計500枚の画像を引用し、データセットを作成した。バイアスを
Source: 一般情報
AIによる皮膚疾患の診断精度を7つのLLMで比較、正解率トップはGPT-4o

-未分類

Copyright© 医学学会ニュース , 2026 AllRights Reserved Powered by AFFINGER4.