自然语言处理

医疗健康信息处理

医疗健康信息处理主要研究如何对医疗健康领域中海量、异构、多模态的数据进行高效建模、分析与理解，重点关注医学自然语言、结构化电子病历、医学影像及多源健康数据的智能处理方法。该方向融合自然语言处理、机器学习、知识表示与推理等关键技术，致力于从复杂医疗数据中挖掘高价值信息，为临床决策支持、医学研究和医疗健康管理提供智能化支撑。

研究内容涵盖医学自然语言处理基础理论与方法、医疗大模型与智能体、医疗知识图谱构建与推理、医疗信息检索与问答、疾病诊断与辅助决策，以及多模态医疗数据的联合分析与挖掘。通过将人工智能技术与医学知识深度结合，提高医疗健康信息处理的准确性、可解释性与实用性。

本方向具有显著的交叉学科特征，涉及计算机科学、医学、统计学、语言学与认知科学等多个领域。相关研究成果可广泛应用于智能诊疗系统、临床决策支持系统、医学文献分析、健康管理与精准医疗等场景，对提升医疗服务效率、改善医疗质量以及推动智慧医疗与健康信息化发展具有重要意义。

成果展示：

扁仓中医大模型：与山东中医药大学附属医院联合研发，被山东省发改委认定为山东省人工智能赋能重点领域高质量发展的重点模型，被第四届全国大模型智能生成大会（LMG 2025）评选为亮点海报论文。
中文对话式患者导诊系统：在全国数字健康创新应用大赛“基于大模型的就医导诊模型评估”任务上，取得开源模型第一名。

大语言模型与智能体

大语言模型与智能体方向主要研究基于大规模预训练语言模型的人类语言理解、知识建模与智能决策方法，探索具备语言认知、推理规划与自主执行能力的智能系统构建机制。该方向以大语言模型为核心，关注其在复杂语义理解、多轮交互、逻辑推理和任务驱动场景中的能力建模与优化，致力于推动人工智能系统从单一语言生成向具备综合认知与行动能力的智能体演进。

研究内容涵盖大语言模型的增量预训练与对齐理论、指令学习与微调方法、复杂语言推理与生成机制，以及语言模型与外部知识、工具和环境的协同工作模式。同时，围绕智能体系统的构建，重点研究基于语言模型的任务分解、规划与执行策略、自主决策与反馈学习机制，以及多智能体协作与人机协同交互方法，实现面向真实复杂问题的持续感知、动态决策与智能执行。

本方向具有鲜明的交叉学科特征，融合计算机科学、人工智能、认知科学、语言学与系统工程等多个领域的研究成果。相关技术可广泛应用于智能对话与问答系统、智能办公与科研助手、自动化软件开发、智能决策支持系统以及复杂业务流程自动化等场景。

成果展示：

千医牍智ICD智能编码系统：与山东第一医科大学第一附属医院联合研发，将ICD编码任务分解为多个阶段，由轻量化大模型智能体协同完成，实现疾病（ICD-10）与手术操作（ICD-9-CM-3）的联合智能编码。
扁仓中医大模型：与山东中医药大学附属医院联合研发，被山东省发改委认定为山东省人工智能赋能重点领域高质量发展的重点模型，被第四届全国大模型智能生成大会（LMG 2025）评选为亮点海报论文。
CHECKWHY: Causal Fact Verification via Argument Structure：引入Toulmin宏观论证结构理论，揭示了证据组合在验证因果关系的机制，构建了首个因果事实验证数据集CHECKWHY，对提升大模型逻辑推理能力具有重要意义。获得ACL 2024杰出论文奖、领域主席奖。

数据挖掘与推荐系统

数据挖掘与推荐系统主要研究如何对互联网、工业生产、商业服务及日常生活领域中海量、高维、动态的数据进行高效采集、预处理、挖掘与应用，重点关注数据中隐藏模式、关联规则、用户偏好及趋势特征的智能提取方法。该方向融合数据挖掘、机器学习、深度学习、信息检索及用户行为分析等关键技术，致力于从复杂异构数据中挖掘潜在价值、刻画用户需求，为个性化服务、决策优化和业务升级提供智能化支撑。

研究内容涵盖数据挖掘基础理论与方法、推荐系统核心算法与架构、用户行为建模与偏好学习、多源数据融合挖掘，以及推荐系统的可解释性、公平性与隐私保护。重点研究负序列数据挖掘技术、医疗健康推荐算法，提高序列分析与推荐系统的准确性。

本方向具有显著的交叉学科特征，涉及计算机科学、数学、统计学、信息管理学、行为科学等多个领域。相关研究成果可广泛应用于负序列数据挖掘、个性化推荐、医疗风险预测、智能搜索引擎、药物推荐等场景。

成果展示：

Efficiently Mining High-utility Repeated Negative Sequential Patterns：首次将重复负序列模式与高效用结合，通过HURSpan挖掘高效用重复正序列模式、NSPGwl生成并计算候选负序列模式效用。
Time-aware Medication Recommendation via Intervention of Dynamic Treatment Regimes：将动态治疗方案的干预过程引入药物推荐任务，构建多患者协同引导图和时间感知机制，解决传统方法难以区分不同治疗阶段用药差异的问题。
Semantic Relation Guided Dual-view Contrastive Learning for Session-based Recommendations：针对现有会话推荐方法忽略物品间语义关系（替代/互补）且未能解耦用户意图与物品属性的问题，提出语义关系引导的双视图对比学习框架，通过意图-属性解耦器有效消除干扰，提升推荐性能。

多模态认知计算

多模态认知计算主要研究如何使计算机能够协同建模和理解来自不同模态的信息，如文本、图像、音频、视频及其组合形式，探索跨模态语义表示、关联建模与高效检索的基础理论与关键方法，是当前人工智能在认知智能与多模态理解层面亟需突破的核心研究方向之一。该方向致力于解决多模态数据在语义鸿沟、模态异构、标注稀缺与大规模高效计算等关键挑战。

研究内容涵盖多模态表示学习与语义对齐、多模态哈希与跨模态检索、半监督与弱监督多模态学习、多模态相关性建模与标签关联增强、多模态在线与自适应学习、隐私保护与联邦多模态学习、多任务与结构化多模态建模等关键问题。

本方向是计算机科学、人工智能、模式识别、信息检索与认知科学等多学科交叉的前沿研究领域。通过将多模态认知计算与大数据处理、社交媒体分析、隐私计算及智能感知等技术深度融合，为人工智能技术在智能检索、智慧医疗、社交媒体分析、智能推荐与安全多媒体应用等场景中的落地应用提供关键技术支撑，有效推动多模态智能计算理论发展与相关产业应用进步。

成果展示：

Prototype-Based Federated Multi-Modal Hashing for Safe and Efficient Multi-Modal Retrieval：提出联邦多模态哈希框架，通过原型通信和原型增强策略，在保护数据隐私的同时，实现高效多模态数据融合，缓解联邦学习中的类别不平衡与统计异构性问题。
Comprehensive Self-reflective Evaluation System for Large Multi-modal Models：构建多模态模型自反思评估系统，通过视觉、语言、稳健性三维指标体系和双通道自反思机制，实现对多模态模型的综合能力评估。
Radiology Report Generation Via Multi-path Modeling with Medical Language Priors and Semantic Guidance：提出融合医学语言先验与语义引导的多路径框架，通过双流特征交互和显式语义对齐策略，实现精准的放射学报告生成。