近日,第40届人工智能领域国际权威学术会议“AAAI人工智能大会”AAAIConference on ArtificialIntelligence (AAAI)公布了2026年论文录用结果,北京工业大学计算机学院4篇论文被录用。

明奇研究员与方娟教授团队论文“Hilbert Curve-Encoded Rotation-Equivariant Oriented Object Detector with Locality-Preserving Spatial Mapping”入选主轨道(Main Track),第一作者为青年教师明奇,通讯作者为方娟教授。在遥感旋转目标检测与几何感知视觉建模领域,现有旋转目标检测方法在复杂场景下常面临特征提取不充分、角度回归精度不足等难题。对此,研究团队从特征空间映射机理与旋转等变性的角度出发,创新性地利用空间填充曲线的局部保持性理论优势,提出一套高精度旋转目标检测的端到端解决方案。团队提出的新型旋转等变目标检测框架——Hilbert curve-Encoded Rotation-Equivariant Oriented Object Detector(HERO-Det),充分展示了团队在遥感旋转目标检测与几何感知视觉建模领域的最新研究成果。
马伟教授团队与香港科技大学(广州)、香港科技大学师生合作的2篇计算机视觉领域学术论文成功入选AAAI。其中,“DualScope: Capturing Critical Spatial and Temporal Cues for Distracted Driving Activity Recognition”入选主轨道(Main Track),“RealNet: Efficient and Unsupervised Detection of AI-Generated lmages via Real-Only Representation Learning”被人工智能社会影响轨道(Al for Social lmpact Track)录用。

在真实场景中精准识别汽车驾驶员的分心行为,是提升道路与行人安全的关键环节。现有研究方法易受无关场景信息和冗余帧信息干扰,致使复杂驾驶环境中鲁棒性不足。论文“DualScope: Capturing Critical Spatial and Temporal Cues for Distracted Driving Activity Recognition”聚焦驾驶行为识别瓶颈问题,提出全新框架DualScope,通过空间、时间双维度协同捕捉行为关键信息:在空间维度,DualScope融合位置感知知识与细粒度视觉细节,增强模型对驾驶员头部、手部等行为相关区域的感知能力;在时间维度,模型采用多组件模块实现短期运动与长期行为模式的高效捕捉,并通过显著动态特征引导模型聚焦于关键行为变化。大量实验结果表明,DualScope的识别精度显著优于已有方法,充分证明了团队研究在双维度捕捉分心驾驶行为关键线索的优势。

“RealNet: Efficient and Unsupervised Detection of Al-Generated lmages via Real-0nly Representation Learning”聚焦AI生成图像检测核心难题,针对已有检测方法在新型生成模型/生成范式下泛化能力不足,现有检测器架构复杂、部署受限等问题,提出了无监督框架RealNet。该框架创新性地专注于真实图像学习解耦的伪造表征空间,有效缓解检测对语义内容和模型专属模式的过拟合,显著提升检测的泛化能力与实际应用价值。实验结果显示,RealNet在平均准确率和平均精度上较现有方法分别提升4.51%和3.93%,且凭借轻量化的无监督设计有效控制计算成本。在此基础上,团队还构建了医学相关的伪造图像数据集,进一步验证该方案在高风险、跨领域场景下的可靠性,使RealNet成为兼具实用性与可扩展性的AI生成图像检测优秀解决方案。

张晓丹副教授团队论文“MoEA-Net: Modality-Incremental Expert Aggregation Network for Retinal Prognostic Prediction”被AAAI2026录用,论文第一作者为学院硕士研究生王华。视网膜预后预测在追踪年龄相关性黄斑变性(AMD)和糖尿病黄斑水肿(DME)等疾病的进展过程中具有重要意义。临床上通常依赖医生通过光学相干断层成像(OCT)、眼底照相等多模态影像来判断视网膜结构与功能变化,但该过程耗时且依赖人工经验,易受主观偏差影响。对此,论文提出一种统一的多模态视网膜预后预测框架MoEA-Net。该框架引入增量式低秩适配层为每个模态设计独立的知识增量结构,实现模态不均衡和模态缺失场景下的动态自适应学习;提出的时空感知专家模块能够捕捉视网膜影像中的空间解剖结构与时间动态变化,增强模型对细微病变进展的感知能力。通过这两种途径,实现模态间有效融合与模态内时空感知的统一建模,有效提升视网膜疾病的智能预后预测性能。
AAAI会议是国际人工智能领域最具影响力的学术盛会之一,由人工智能促进协会(The Association for the Advancement of ArtificialIntelligence)主办,长期引领人工智能研究的前沿方向。本次论文录用体现了学院在自动驾驶、图像生成、多模态学习、遥感图像解译、医学领域等方面的科研积累与创新能力。下一步,学院将持续提高师生教学科研服务保障水平,为产出高质量科技成果、助力学校“双一流”建设作出积极贡献。
文字:明奇、马伟、张晓丹
编辑:曹雨
审核:黄荟宇