进展1:一套针对多种疾病的可信辅助诊断系统
摘要:医学图像自适应增强及模型自主优化
临床场景中医学图像退化普遍存在,需要图像增强改善成像效果,提高临床判断效果。然而,医学图像的噪声多变,现有图像增强算法主要基于预先开发的静态模型,部署后不具有继续优化的能力,难以持续提供有效的增强结果,且无法充分利用临床数据信息。为此,iMED团队针对自适应图像增强和模型自主优化开展了一系列研究工作,包括噪声自适应图像增强(TMI 2022),结构一致性引导的可泛化图像增强(MIA 2023),以及无源域自适应的模型自主优化(TMI 2024),使图像增强模型能够在临床应用中结合测试数据自主优化,边做边学不断提高图像增强效果。

进展2:一套高可信智能癌症影像数据分析系统
摘要:多模态医学影像的分割、合成及特征学习
多模态医学影像分析在现代医疗中至关重要,不同模态影像提供互补信息,为精准诊断、治疗计划和术后监控提供支持。数据稀缺、模态缺失、域间差异及类别混淆等难题限制了AI技术应用。CVIP研究组围绕该方向提出一系列创新方法,包括动态对比学习分割框架(Pattern Recognition, 2024)、任务相似性一致性半监督分割方法(TMI, 2023)、域适配无监督影像合成方法(MICCAI, 2022)、以及梯度引导模态解耦策略(AAAI, 2024)等方法,有效助力稳健鲁棒的多模态医学影像分析。

进展3:一套智能可信远程体征健康数据采集监测分析系统
摘要:智能远程慢性疾病体征等健康数据可信监测系统
1、基于音乐的呼吸率检测系统:最近的研究表明,可以利用声学信号进行高精度、低能耗的呼吸监测。然而,现有技术要求扬声器发射超声波信号,虽然成年人听不见,但儿童、宠物甚至植物可能受到影响。本项目提出利用日常声音信号(如音乐或广播音频)来检测呼吸,而不是超声波。我们设计了一个呼吸检测系统,通过估计信道脉冲响应(CIR)来得出呼吸频率。研究了信号的符号间干扰(ISI)及其最小化策略,并提出了解决扬声器和麦克风间多径效应和采样频率偏移的技术。通过实验验证,结果显示,使用不同音频信号时,系统能实现较高的呼吸检测精度,平均误差小于0.5 BPM。
2、用于肺功能评估的耳机式全肺量测系统
肺量计是评估肺功能的黄金标准,但移动设备无法提供流量-体积 (F-V) 曲线,且缺乏吸气测量。本项目介绍了基于耳机的 EarSpiro 解决方案,通过解读气流声音生成 F-V 曲线,包括呼气和吸气测量。EarSpiro 利用卷积神经网络 (CNN) 和循环神经网络 (RNN) 捕捉气流声音与气流速度之间的复杂关系,并采用基于聚类的分割算法追踪微弱的吸气信号。此外,EarSpiro 结合迁移学习和解码器网络,仅通过少量真实肺功能指标,便可适用于日常使用。在对 60 名受试者的实验中,EarSpiro 的呼气和吸气流量估计平均误差分别为 0.20L/s 和 0.42L/s,F-V 曲线的估计误差为 0.61L/s 和 0.83L/s,四种常见肺功能指标的平均估计误差为 7.3%。
3、基于柔性传感器的血压监测系统
血压监测对健康管理至关重要。传统的血压计使用加压方式,导致不适且无法进行连续监测。光电容积描记法监测器也容易受到光干扰。为了解决这些问题,我们提出了一种新型的腕戴式血压监测系统。该系统通过柔性传感器从手腕收集脉搏波信号,并进行预处理以去除干扰。通过特征提取,我们获得了有效特征,并采用结合 Transformer 模型和微调技术的个性化适应性估计框架来提高血压估计的准确性。通过对36人的实验验证,FlexibleBP符合AAMI标准,估计误差为收缩压2.61mmHg、舒张压1.37mmHg,标准差分别为5.59mmHg和5.75mmHg。该研究为开发更先进、用户友好的可穿戴血压监测系统迈出了重要一步。
4、通过手机声学传感实现的房颤检测系统
心房颤动 (AF) 由于心房内不规则的电脉冲引起,早期监测 AF 对预防病情恶化至关重要。尽管动态心电图监测仪检测准确,但高成本限制了广泛应用。现有的基于移动设备的 AF 检测系统存在适用性问题。为解决这些问题,我们提出了一种新型智能手机 AF 检测系统,该系统利用扬声器和麦克风,通过多通道脉搏波探测方法捕捉微小心脏活动,并引入三级脉搏波净化管道以提高信号质量。我们还基于 ResNet 网络模型实现准确检测。通过智能手机收集了23名参与者的数据,实验结果表明,系统在 AF 检测中表现优秀,准确率为97.9%、精确率96.8%、召回率97.2%、特异性98.3%、F1 分数为97.0%。
5、基于深度摄像头的呼吸训练指导
对于慢性阻塞性肺病 (COPD) 患者,呼吸练习对增强肺功能至关重要。先前的非接触式感测方法存在诸多假设和限制。为此,我们提出了一种基于深度摄像头的新型呼吸练习评估系统,旨在克服现有方法的局限。系统首次将呼吸模式和肺容量视为相关测量,并通过多任务学习框架联合估计,显著提升了呼吸模式分类的性能。为了实现无需校准的肺容量测量,系统设计了适用于所有肺容量的估计,并借助轻量级轮廓分割模型提升精度。我们与临床中心合作,针对22名健康受试者和14名患者进行实验,结果表明,DeepBreath 在呼吸指标估计精度上优于以往研究,且更具实际应用性。

进展4:一套面向病理数据的可信特征提取方法
摘要:高性能计算以及复杂条件下图像处理
临床场景中普遍存在标签数据稀缺、数据质量参差以及计算量巨大的问题,DBGroup团队聚焦这些关键挑战展开了深入研究。针对标签稀缺问题,团队提出了创新的图像识别方案(ACM MM 2023),并开发了应对属性偏差的图像修复技术(IJACA 2023),为解决复杂数据环境中的识别与修复难题提供了全新思路。与此同时,团队在高性能计算平台上开展了系统性研究,包括探索异构计算架构的高效性与可靠性(SOCC 2022,SIGMOD 2023-2025, VLDB 2024),并设计了支持复杂计算任务的可视化诊断工具(TVCG 2023, VLDB 2023, TKDE 2024),实现了对系统瓶颈的精确定位与优化。
