ICASSP(International Conference on Acoustics, Speech, and Signal Processing)是IEEE信号处理学会(IEEE Signal Processing Society)主办的旗舰国际会议,也是信号处理领域全球规模最大、最具影响力的学术会议之一。会议涵盖音频处理、语音技术、图像处理、生物医学信号、传感器阵列、机器学习、人工智能等广泛主题。ICASSP每年举办一次,是IEEE信号处理协会(SPS)的旗舰会议,被列入中国计算机学会CCF-B类推荐国际学术会议。ICASSP 2026将于2025年5月4日至8日在西班牙巴塞罗那召开 。
近期,QLUNLP本团队三篇论文被接收。详细介绍如下:
论文1:Seeing is Believing: Comprehensive Self-reflective Evaluation System for Large Multi-modal Models
作者:胡国城、郑超群*、管红娇、 崔惠、 吴士伟、鹿文鹏
单位:齐鲁工业大学(山东省科学院)、山东省计算中心(国家超级计算济南中心)、山东亿云信息技术有限公司

摘要:随着大型多模态模型的迅猛发展,对它们的评估需求也越来越紧迫。传统的评估方法通常只盯着一两种孤立的能力,远不能满足实际需求。我们真正需要的是一个更全面、更立体的系统。在这篇论文中,我们推出了自反思评估系统(SRES),它巧妙地将视觉、语言和鲁棒性这些维度融合成一个整体框架,能进行多角度评估和深入的多模态剖析。特别值得一提的是,这个系统内置了一个自反思机制,能让模型自主优化过程,动态调整输出,确保结果更稳定可靠。我们还创新性地把“自反思频率”作为评估模型鲁棒性的新指标,这能更直观地反映模型的抗干扰能力。为了验证和支撑该评估系统,我们专门构建了一个基准数据集,涵盖了352个子任务,系统地测试了15款顶尖的大型多模态模型,提供了一个精细、可扩展的对比基础。
论文2:Biomed-R2: Joint Diversity Retrieval and Evidence Reasoning for Biomedical Question Answering
作者:管红娇、李传龙、张维玉、廉颖、郭建彬、鹿文鹏
单位:齐鲁工业大学(山东省科学院)、山东省计算中心(国家超级计算济南中心)、山东第一医科大学第一附属医院、北京中科闻歌科技股份有限公司

摘要:传统的检索增强生成(RAG)及其变体在处理生物医学问答(QA)问题时,存在患者对齐不足、证据整合薄弱以及推理脆弱等问题。为了应对这些挑战,我们提出了两阶段RAG框架Biomed-R2。第一阶段通过语义感知的查询多样化和基于事实的知识抽取,实现患者对齐的检索。第二阶段通过迭代的证据验证,强化证据一致性推理,确保生成连贯且基于事实的答案。在三个基准测试集上的实验结果表明,Biomed-R2优于现有最先进的RAG变体,为知识密集型应用奠定了基础。
论文3:Radiology Report Generation Via Multi-path Modeling with Medical Language Priors and Semantic Guidance
作者:刘侠、赵龙
单位:齐鲁工业大学(山东省科学院)、山东省计算中心(国家超级计算济南中心)

摘要:根据放射学图像自动生成报告对疾病识别与临床决策具有关键作用,逐渐成为缓解放射科医生工作负担的重要研究方向。然而,该任务仍面临两个关键挑战:医学语言的高度专业性与结构化特征导致模型专业语言表达能力不足;长文本生成中易出现语义漂移与上下文不连贯。为此,本文提出一种双模块增强的放射学报告生成框架,引入多路径注意力融合模块(MPAF) ,利用医学领域预训练语言模型Bio_ClinicalBERT 注入高质量的医学语言先验,协同自注意力、交叉注意力实现三重信息动态融合,提升专业术语的建模与表达能力。设计语义引导单元(SGU)构建随时间演化的语义状态,结合双门控机制与动态归一化策略,增强跨时间步的语义一致性和上下文连贯性。两个模块协同嵌入解码器,有效缓解了语义信息不足与上下文建模薄弱的问题。实验结果表明,所提方法在IU X-ray 与MIMIC-CXR 数据集上取得练好性能,生成报告在准确性与完整性方面具有显著优势。
论文1第一作者胡国城同学是QLUNLP团队2024级硕士研究生,导师为郑超群、鹿文鹏。郑超群博士,硕士生导师,山东省高等学校青年创新团队负责人,从事多媒体信息检索和多模态大模型的研究工作,在国际顶级期刊和会议上发表学术论文12篇,主持国家自然科学基金青年项目1项、山东省自然科学基金青年项目1项,指导学生多次发表顶会顶刊论文。
论文2主要由QLUNLP团队2024级硕士研究生李传龙同学完成,导师为管红娇。管红娇博士,副教授,硕士生导师,博士毕业于哈尔滨工业大学计算机科学与技术专业;长期从事机器学习和自然语言处理领域研究,主要研究方向为医疗健康信息处理、医疗大模型;主持国家自然科学基金青年项目1项、山东省自然科学基金青年项目1项。
论文3第一作者刘侠同学是QLUNLP团队2024级硕士研究生,导师为赵龙。赵龙,博士,硕士生导师,博士毕业于武汉大学计算机科学与技术专业,长期从事生信数据挖掘、医疗多模态大模型、医疗图像处理等方向的研究工作。主持国家自然科学基金青年项目1项、山东省自然科学基金2项。