|
|
|
|
|
基于AI的全景片骨质疏松筛查:聚焦颏孔的深度学习新突破 | MDPI Medical Sciences |
|
|
论文标题:Enhanced Osteoporosis Detection Using Artificial Intelligence: A Deep Learning Approach to Panoramic Radiographs with an Emphasis on the Mental Foramen
论文链接:https://www.mdpi.com/2076-3271/12/3/49
期刊名:Medical Sciences
期刊主页:https://www.mdpi.com/journal/medsci
骨质疏松是一种常见的系统性骨病,预计将影响超过60%的50岁以上女性。现行金标准DXA扫描多在骨折后才使用,难以及时发现疾病,因此亟需早筛技术。牙科全景片作为常规检查工具,被视为潜在的早期筛查媒介。尽管已有研究利用深度学习在全景片中识别骨质疏松,但多存在方法学缺陷,如年龄、性别、影像质量及结构重叠等因素未被控制,导致结果可信度不足。本研究旨在构建一个更严格、可靠的AI系统,用于在全景片中准确识别骨质疏松。研究收集250张影像,截取颏孔区域,并采用预训练CNN模型进行分类训练与验证,分别比较骨质疏松组与年龄性别匹配组、以及与年轻健康组的表现。结果显示,在严谨匹配条件下模型取得F1值0.74、AUC 0.84;在区分老年骨质疏松与年轻健康者时准确率达98%、AUC达0.98。来自奥地利多瑙河私立大学Vasilios Alevizakos博士及其团队在Medical Sciences期刊发表了文章,研究提出了基于全景片的骨质疏松AI检测的概念验证,并强调研究设计严谨性对结果可信度的关键作用。

自动裁切为矩形并聚焦于颏孔区域的影像:(A)年轻患者,(B)无骨质疏松的老年患者,(C)患有骨质疏松的老年患者。
研究过程与结果
研究回顾性纳入在某大学确诊骨质疏松的患者,并以DXA扫描的T值作为诊断标准:T值>-1为健康,T值<-2.5为骨质疏松(A组)。随后选取年龄和性别匹配的健康患者作为对照(B组),并额外收集不匹配年龄性别的年轻健康者(C组)用于进一步验证。共收集500张全景片,其中250张来自骨质疏松患者、250张来自健康对照。研究使用CvatAI标注60张颏孔区域图像,通过YoloV8自动裁切获得ROI,随后由经验丰富的研究者逐一检查裁切准确性。所有图像被处理为灰度图,包含左右颏孔区域。数据集按70%训练、15%测试、15%验证划分,对照组按训练集的年龄和性别比例匹配。
图像增强包括旋转、亮度和色彩扰动、随机裁切和垂直翻转,随后统一缩放至224×224并归一化。模型采用预训练的DenseNet201并改为二分类输出,优化器为SGD,学习率0.001,批量16,并使用L2正则化防止过拟合。模型训练150轮,使用PyTorch在单张V100 GPU上完成。另一套500张来自30岁以下健康者的图像也在相同参数下进行测试。统计分析以裁切区域的分类结果计算准确率、AUC、精确率和F1分数,并绘制混淆矩阵,用于比较骨质疏松组与年龄匹配组、以及与年轻对照组的差异。结果显示:在A组与B组(年龄匹配)比较中,模型精确率为73.6%,F1值0.74,AUC为0.84,表现中等。在A组与年轻C组比较中,模型准确率达97.8%,AUC达0.98,F1为0.97,但分析表明该高准确性主要由于模型识别“老年骨结构与年轻骨结构差异”,并非真正识别骨质疏松特征,具有误导性。研究提出了基于牙科全景片颏孔区域的AI骨质疏松检测的概念验证,并强调控制年龄、性别等因素的重要性,以提升方法学严谨性和结果可信度。

混淆矩阵显示:左图为模型在未接触过的验证集上,对骨质疏松组与年轻对照组进行检测的结果;右图为受试者工作特征(ROC)曲线。结果表明,高准确率主要源于模型识别“年轻骨骼与老年骨骼的差异”,而非真正识别骨质疏松特征,因此具有误导性。
研究总结
本研究证明深度学习算法能够在牙科全景片中识别骨质疏松的影像特征,并能有效区分不同年龄段的患者与对照组,具备一定诊断准确性。然而研究也强调,AI 结果的可靠性高度依赖数据选择与标注质量。既往研究显示,高质量、充分标注的数据可显著提升模型表现,而数据多样性不足或标注不严谨则会导致性能下降。本研究进一步发现,将年轻患者纳入对照组会使模型误将“年轻骨结构”与“老年骨结构”的差异误判为骨质疏松特征,从而造成高达97.81%的虚高准确率,说明数据构成可能严重误导模型表现。
研究也指出,AI性能受数据采集方式、网络结构及训练超参数等多重因素影响,使得不同研究结果难以直接比较。此外,本研究存在若干局限:全景片本身并非骨质疏松检测金标准;样本量小、来自单一机构,可能导致过拟合并限制推广性;仅使用一种影像类型,难以适用于其他影像模式;手动裁切颏孔区域也可能引入偏差。未来研究需扩大样本规模、使用多中心数据,并探索更适用于医学影像的网络结构。同时,需与临床医生合作,评估深度学习提示区域是否能提升人工诊断准确性。进一步研究模型在不同机构影像中的适应性,也将有助于提升其临床应用价值。
Medical Sciences期刊介绍
主编:Prof. Dr. Antoni Torres, Universidad de Barcelona, Spain; Instituto de Salud Carlos III, Spain
期刊旨在发表基础、转化和临床医学各方向的研究,主要刊发疾病发病机理、转化研究、实验室和动物研究、药理学、临床医学、流行病学和健康改善策略等领域的最新研究成果。目前已被 PubMed、PMC、MEDLINE、DOAJ 等重要数据库收录。
|
2024 Impact Factor
|
4.4
|
|
2024 CiteScore
|
8.7
|
|
Time to First Decision
|
18.7 Days
|
|
Acceptance to Publication
|
2.8 Days
|
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。