点击蓝字
关注我们
关注并星标
从此不迷路
计算机视觉研究院


公众号ID|计算机视觉研究院
https://pmc.ncbi.nlm.nih.gov/articles/PMC12027583/
计算机视觉研究院专栏
Column of Computer Vision Institute
锥虫寄生虫的早期检测对于锥虫病的及时治疗至关重大。锥虫病是一种被忽视的热带疾病,在受影响地区带来了严重的健康和社会经济挑战。

PART/1
概述
为了克服传统人工显微镜检查和现有自动化方法的局限性,我们提出了YOLO-Tryppa——一种基于YOLO的新型框架,专门用于快速且准确地检测显微镜图像中的小型锥虫寄生虫。YOLO-Tryppa整合了Ghost卷积,在保持鲁棒特征提取能力的同时降低计算复杂度,并引入了专门的P2预测头以提升小目标的定位精度。通过去除冗余的P5预测头,该方法显著减少了参数数量和浮点运算次数(GFLOPs)。在公开的Tryp数据集上的实验结果表明,YOLO-Tryppa的AP50达到71.3%,优于此前的最先进方法,从而在精度和效率两方面树立了新的标杆。这些改善使YOLO-Tryppa特别适合在资源受限的环境中部署,有助于推动更快速、更可靠的诊断实践。
被忽视的热带病(NTDs)持续给全球弱势群体带来严重的健康和社会经济负担。其中,由锥虫寄生虫引起的锥虫病构成了显著的诊断挑战,在撒哈拉以南非洲和拉丁美洲等地区尤为突出。通过人工显微镜检查血涂片的传统诊断方法不仅耗时费力、具有主观性,还依赖专业 expertise,往往导致诊断和治疗的延误。这种情况凸显了对自动化、可靠且可扩展的诊断工具的迫切需求。
深度学习的最新进展已经改变了医学成像和实时目标检测领域。卷积神经网络(CNNs),尤其是YOLO(You Only Look Once)系列模型,在各类检测任务中展现出了卓越的速度和精度。我们之前的研究成果YOLO-Para,适配了定制化的YOLOv8框架用于疟原虫检测,成功捕捉了具有挑战性的显微镜图像中细微的形态特征。基于这一成功,我们目前将方法扩展到锥虫检测领域。
在本研究中,我们引入了YOLO-Tryppa,这是一个为布氏锥虫识别专门设计的定制化检测框架。YOLO-Tryppa整合了针对性的架构修改,旨在提升Tryp数据聚焦常见的小型寄生虫的定位精度。我们采用了YOLOv11m架构,并提出了几项关键修改,例如用Ghost卷积替代标准卷积层,在保持精度的同时降低计算复杂度。此外,一方面我们引入专门的P2预测头以专攻小目标检测,另一方面移除了针对大目标的预测头,从而使架构与锥虫图像的具体特征相契合。YOLO-Tryppa与先前研究的区别在于,它强调实时检测能力,同时严格优化YOLO框架以增强小目标检测性能。
YOLO-Tryppa的开发和评估由Tryp数据集支持,该数据集是一组全面的显微镜图像集合,对布氏锥虫的边界框进行了精细标注。该数据集捕捉了寄生虫多样且复杂的表现形式,为评估检测性能提供了稳健的基准。通过对YOLO-Para架构进行这些策略性修改,我们的研究展示了深度学习模型在医学诊断中的适应性。它为资源受限环境下的疾病筛查提供了一个有价值的工具,有助于提升疾病筛查效率。
本文的主要贡献包括以下几点:
-
清晰阐述了锥虫病诊断面临的挑战以及自动化解决方案的研究动机;
-
开发了YOLO-Tryppa这一新型检测框架,其架构创新可增强小目标检测能力;
-
在Tryp数据集上开展了广泛评估,在检测性能和计算效率方面取得了显著提升。
PART/2
背景
2.1 医学成像中目标检测的演进
医学成像的传统方法严重依赖手工设计的特征和经典计算机视觉技术。尽管这些方法提供了早期的认知,但它们的性能常因对噪声的敏感性和临床数据的变异性而受限。卷积神经网络(CNNs)的出现标志着范式的转变,它能够直接从原始图像中实现鲁棒的、分层的特征提取。这一突破源于R-CNN、Fast R-CNN和单阶段检测器的发展,这些技术共同提升了检测精度和处理速度。现代深度学习架构通过在高精度和实时性能之间取得有效平衡,重新定义了目标检测。诸如YOLO系列、Faster R-CNN和RetinaNet等模型采用端到端的训练流程,可直接从完整图像中预测边界框和类别概率。这些模型已成功适配医学成像场景,通过微调来捕捉细微的病理特征,尽管面临低对比度和形态变异等挑战。定制化修改和迁移学习策略进一步增强了它们在专业任务中的适用性,包括寄生虫感染检测。
2.2 显微镜图像中的寄生虫检测
在显微镜图像中检测寄生虫本质上具有挑战性,这是由于寄生虫与周围组织对比度低、形态变异大,且存在成像伪影。锥虫病是一个重大的公共卫生问题,影响着南美洲、南亚、东南亚和撒哈拉以南非洲的多个地区。这种疾病通过采采蝇和虻等吸血昆虫传播,对人类和动物都有影响,会导致严重的人畜共患病后果。尽管聚合酶链反应(PCR)和免疫测定等分子技术仍是检测的金标准,但它们需要熟练的技术人员,涉及多个处理步骤,且需要昂贵的设备。相比之下,显微镜检查提供了一种快速且经济高效的诊断替代方案。不过,其敏感性低以及技术人员之间判读的差异性,凸显了对自动化计算机辅助诊断(CAD)系统的需求。人工智能与CAD系统的融合有望实现检测过程的标准化和加速,尤其是在资源有限的环境中。
目前,显微镜图像中寄生虫检测的最先进研究主要聚焦在疟原虫的识别上。例如,研究人员采用了三个预训练模型并结合迁移学习技术,以准确识别和分类疟原虫。类似地,在中,一种结合了随机森林算法的CNN被用于检测疟原虫。在锥虫定位方面,中应用了基于随机森林的机器学习方法从显微镜图像中提取特征,以促进寄生虫的识别和量化。此外,Jung等人在来自血涂片显微镜视频记录的数据集上使用ResNet18模型来检测寄生虫的存在与否。再者,在中,ResNet50被用于识别图像中的锥虫,并且使用通过K最近邻算法处理图像构建的向量数据库,对训练好的模型作为自主筛查系统进行了进一步验证。
2.3 注意力机制的融合
注意力机制在增强医学图像分析的CNN架构方面已变得至关重大。这些机制使模型能够选择性地聚焦图像中最相关的区域,空间注意力、通道注意力和自注意力等技术在减轻背景噪声影响的同时,显著提高了特征定位的准确性。这种针对性方法降低了假阳性率,并提升了对细微分散特征的检测能力。此外,注意力模块设计的近期创新可在训练和推理阶段实现动态加权,从而进一步优化检测性能。这种能力对于在复杂显微镜图像中准确识别寄生虫尤为关键。
2.4 轻量级目标检测器
在资源受限的环境(如野外诊所和远程实验室)中部署目标检测模型,需要在精度和计算效率之间取得平衡的架构。传统的基于深度学习的目标检测器,如Faster R-CNN和RetinaNet,检测精度高,但需要大量的处理能力,因此不太适合在边缘设备上进行实时应用。为解决这一局限性,轻量级目标检测器被开发出来,以在降低计算开销的同时提供实时性能。
MobileNet-SSD等模型利用深度可分离卷积和参数高效的架构,在显著降低推理时间的同时保持检测精度。YOLO系列,尤其是专为高效资源利用而设计的定制化YOLO架构,通过降低模型复杂度且不大幅牺牲性能,在移动和嵌入式人工智能应用中展现出了良好的效果。类似地,EfficientDet采用复合缩放策略来优化网络深度、宽度和分辨率,使其成为精度和效率都至关重大的医学成像任务的可行选择。
PART/3
新算法框架解析
数据集
据我们所知,Tryp数据集是首个、最全面且唯一公开可用的未染色厚血涂片显微镜图像集合,专门用于锥虫寄生虫检测。它包含3085张感染(阳性)血样的标注图像和93张未感染(阴性)血样的图像。这些图像通过两种不同的显微镜装置获取,即奥林巴斯IX83倒置显微镜和奥林巴斯CKX53显微镜,分辨率各异:1360×1024、1920×1080和720×404像素。 标注以寄生虫区域周围的紧密边界框形式呈现,通过Roboflow和Labelme的两阶段流程生成,确保了高度的一致性和质量。该数据集按照标注图像60:20:20的比例划分为训练集、验证集和测试集。 各集合中寄生虫实例的分布呈现出较大的变异性。训练集包含27,489个寄生虫实例,验证集包含8,697个实例,测试集包含9,094个实例。按图像数量归一化后,这些数据表明整个数据聚焦图像与寄生虫实例的比例约为14.6:1。 图1展示了该数据集的代表性图像选例。

图1
目标检测器
计算机视觉中的目标检测方法大致可分为单阶段和两阶段方法,每种方法在速度和精度之间存在不同的权衡。单阶段检测器,如YOLO和SSD,在一次前向传播中完成目标定位和分类。这种从完整图像直接回归边界框和类别概率的方式实现了较高的处理速度,使其适用于实时应用。不过,这种方法有时可能会牺牲定位精度,尤其是在检测小目标或密集聚类目标时。相比之下,以Fast R-CNN和Faster R-CNN等架构为代表的两阶段检测器,先通过初始阶段生成区域候选,再通过第二阶段的分类和边界框回归来优化这些候选。尽管这一两步流程一般会带来更高的计算成本和更长的推理时间,但往往能获得更优的定位精度。这些方法的选择最终取决于应用的具体需求,需要在对速度的需求和对精度的要求之间进行平衡。
Ghost卷积
Ghost卷积是一种降低标准卷积运算计算成本的创新方法。传统卷积层通过应用大量卷积核生成大量输出特征图,其中许多卷积核可能是冗余的。Ghost卷积的核心思想是,这些特征图中有很大一部分可以通过廉价的线性运算来近似,而无需通过昂贵的卷积直接计算。
在实际应用中,该过程第一对输入特征图应用标准卷积,以生成一组紧凑的固有特征图。这些固有特征图捕捉了输入的本质特征。Ghost卷积并非直接计算所有期望的特征图,而是通过对固有特征应用廉价的线性变换来合成额外的(或称为“Ghost”)特征图。这种变换一般通过深度可分离卷积等操作来实现。
所提架构:YOLO-Tryppa
我们在设计YOLO-Tryppa架构时,主要围绕两个目标展开:一是增强血涂片图像中小寄生虫的定位精度,二是开发兼具轻量化和实时性能的模型。

为说明第一个目标的合理性,我们在图2中呈现了遵循COCO标准的目标面积分布。该分布清晰显示出对小目标的偏向性,其中78.4%的目标属于小目标类别(面积小于32²像素),其余21.8%属于中等尺寸目标类别(面积在32²到96²像素之间)。
基于我们之前的研究,针对小型寄生虫的检测器需要使用所选基础架构中骨干网络的低层。不过,这样做会因额外预测头的存在和浮点运算次数(GFLOPs)的增加,导致专用架构的参数数量上升。因此,为构建我们的YOLO-Tryppa,我们以YOLOv11m架构为起点,该架构在性能和实时能力之间实现了可靠的权衡。
随后,我们将模型架构中(包括子模块)的所有卷积层替换为Ghost卷积,但前两层除外,这与Cao等人的研究类似。接下来,我们添加一个名为P2的预测头,并引入一个源自C2特征图的新型分支,该分支专门用于小目标检测。最后,我们移除P5预测头,由于该预测头是为处理数据聚焦不存在的较大目标而设计的。
所提的YOLO-Tryppa架构在图3中以可视化形式呈现。

PART/4
实验及可视化
为确保实验间的公平性和可比性,我们第一使用与所提YOLO-Tryppa架构一样的实验设置,训练了大型和中型的YOLO架构(版本5、8和11)。采用这一策略不仅是为了保持公平性,也是为了研究增加参数数量(进而增加模型的复杂度和规模)是否能提升检测性能。所有分析的指标和实验详见表1。
表1

我们的实验表明,对于每个现成模型,其大型版本的性能都较差。值得注意的是,YOLOv8表现出最显著的变异性,中型模型的AP50达到68.4%,而大型模型仅为54.4%。尽管如此,基准模型在AP50方面仍比RetinaNet、Faster R-CNN和YOLOv7这三种架构高出5.4%。需要注意的是,在之前的最先进方法中,RetinaNet和Faster R-CNN都使用了更大的图像尺寸1333×800。
类似地,YOLO Para模型的结果趋势与现成模型类似,同时超越了得分最高的YOLOv8m和YOLOv11m。特别是,YOLO Para SP架构的AP50达到68.8%。不过,与两个最佳的现成模型相比,YOLO Para模型的GFLOPs约为其四倍。
最后,在AP50方面,YOLO-Tryppa成为性能最佳的模型,在保持原始训练、测试和验证数据集划分的五次运行中,平均得分71.3%,标准差为0.3。值得注意的是,尽管集成了计算需求较高的P2预测头,它仅需要1130万个参数(在所选架构中最少)和77.1 GFLOPs。由于计算成本较高,我们将详细评估限制在最终的YOLO-Tryppa架构上,使用中提供的原始训练、测试和验证划分进行了五次迭代。对于该架构,我们进行了单样本t检验以评估AP50结果的显著性。所有结果的p值均低于0.05,最高的为1.86×10⁻⁵。
基于五次迭代的平均混淆矩阵的详细分析显示,YOLO-Tryppa模型平均检测到约6426个锥虫寄生虫实例,同时漏检约2993个实例。此外,它将约2271个背景实例错误识别为寄生虫。这些数据表明,该模型实现了稳健的性能,具有较高的真阳性检测率,同时假阳性数量相对较低,凸显了其在寄生虫检测中的有效性。此外,我们对假阳性和假阴性的分析揭示了重大的临床意义。当背景元素被错误分类为寄生虫时,患者可能会接受不必要的后续检查并承受额外压力。相反,实际寄生虫的漏检可能会延误诊断和治疗,进而可能导致有害的健康后果。

图4
除定量评估外,我们还呈现定性分析,以进一步证明YOLO-Tryppa的有效性。图4展示了具有代表性的示例,其中该模型在低对比度、结构重叠和背景噪声等具有挑战性的条件下,成功定位了锥虫寄生虫。这些结果表明,该模型能够捕捉细微的局部特征,这主要得益于专用的P2预测头,它降低了假阳性并确保了准确检测。 从这些示例中可明显看出一个趋势:尽管两种模型都存在预测不足的情况,但YOLO-Tryppa通过检测更多寄生虫,始终优于其现成的同类模型。这一改善在图4中直观可见,且在定量上得到了最高召回率的支持。
YOLO-Tryppa框架取得的成果不仅凸显了锥虫寄生虫检测能力的进步,还在理论和实践方面具有重大意义。从理论角度来看,我们的发现有助于深化关于深度学习中架构修改影响的认知,尤其是在增强小目标检测方面。这一见解为特定任务的定制化卷积神经网络领域增加了深度,表明有针对性的调整可带来显著的性能提升。在实践层面,YOLO-Tryppa在诊断场景中的有效应用凸显了将自动化技术整合到医疗保健中的必要性,尤其是在资源有限的地区。该框架的高效性和准确性可加快诊断流程,可能改善被忽视热带病患者的健康结局。此外,此类系统的实施可减轻医疗专业人员的工作负担,使他们能够专注于更复杂的医疗挑战。
有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


