数字所2023年度代表性论文汇编

来源:发布时间:2024-04-23

      2023年度,数字所累计发表论文 362 篇,JCR Q1/Q2期刊论文 194 篇,其中IEEE 期刊论文 74 篇(含4篇IEEE T-PAMI, 8篇IEEE IoT, 2篇IEEE TNNLS等);CCF-A类会议论文 43 篇,其中 10 篇发表于计算机视觉顶级会议CVPR、5篇发表于人工智能顶级学术会议 AAAI。年度累计 37 篇学术论文入选ESI高被引论文,3篇论文获深圳市科学技术协会优秀论文奖。现根据各中心研究方向,推选8篇代表性论文成果与大家分享。

1、高效视频基础表征模型

       数字所多媒体研究中心王亚立团队提出“统一变形器”模型,通过长短时关系统一建模,解决了视频表征中存在的局部冗余和长时依赖问题,形成高辨别、轻运算的视频基础表征模型。该模型在图像分类、行为识别、物体检测、实例分割、场景检测、姿态估计6大类核心图像、视频任务上取得领先性能。

图片

 统一变形器框架

该成果全文信息:

Li Kunchang; Wang Yali; Zhang Junhao; Gao Peng; Song Guanglu; Liu Yu; Li Hongsheng; Qiao Yu. UniFormer: Unifying Convolution and Self-Attention for Visual Recognition.IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE(TPAMI),2023.(Q1,IF=23.6)

2、多模态蛋白表征方法及其迁移性量化

     数字所生物医学信息中心殷鹏/胡帆团队提出一种多模态蛋白质表征方法,通过融合多种蛋白质模态,包括序列、结构、基因本体和细粒度领域知识等信息来实现对蛋白的高效表征,在多项蛋白相关的下游任务(如蛋白稳定性预测等)取得优异表现。并提出一种基于最优传输的特征空间表示度量,可有效捕捉任务间的分布差异,并预测任务间的适应性。成果有助于更好地理解蛋白质的性质和功能,为计算生物学领域的研究提供新的工具和方法

多模态蛋白表征框架及数据

该成果全文信息:

Hu F., Hu Y., Zhang W., Huang H., Pan Y., & Yin P. . A Multimodal Protein Representation Framework for Quantifying Transferability Across Biochemical Downstream Tasks. Advanced Science, 2023. (Q1, IF=15.1)

3、中国代表性城市日极端温度预测

      高性能计算中心李晴岚研究员团队选择多元线性回归、支持向量回归、梯度提升回归树(GBRT)、长短期记忆和多层感知器(MLP)来预测哈尔滨、西安、北京、拉萨,上海、贵阳、广州、深圳、海口的极端气温,通过沿用前一天极端气温预测和美国全球预报系统(GFS)预测来评估,MLP模型表现最佳。与持续性预报相比,5个模型和GFS均显示出对日最高气温的预报能力。但对于每日最低温度,GFS表现比持久性模型差。研究可为气象灾害预警等提供可靠的数据支持

该成果全文信息:

Hongyu An, Qinglan Li, Xinyan Lv, Guangxin Li, Qifeng Qian, Guanbo Zhou, Gaozhen Nie, Lijie Zhang, Linwei Zhu. Forecasting daily extreme temperatures in Chinese representative citiesusing artificial intelligence models.WEATHER AND CLIMATE EXTREMES,2023. (IF=8)

4、数据驱动和机理建模:两种建模范式的一致性和不确定性分析

      数字所空间信息中心陈劲松研究员团队深入阐释了机理建模和数据驱动两种建模范式在农田生产潜力模拟中的一致性和不确定性。发现不同建模范式的模拟一致性自上游变量到下游变量呈递减趋势,模拟不确定性存在叠加传播效应;像元级机理建模是大尺度农业模拟的可靠方法,同时强调了采用更细粒度观测数据训练智能学习模型的必要性。成果可为多源遥感智能建模提供理论指导,对于推动大尺度农业模型发展、保障国家粮食安全具有重要意义。

基于数据驱动与机理建模的模拟流程框架

该成果全文信息:

Wang J, Chen J, Zhang J, Yang S, Zhang S, Bai Y. Consistency and uncertainty of remote sensing-based approaches for regional yield gap estimation : A comprehensive assessment of process-based and data-driven models. Field Crops Research. 2023. (Q1, IF=5.8)

5、体外膜肺氧合(ECMO)的高性能流体力学形状优化算法及应用

      数字所工程与科学计算中心陈荣亮团队提出了一种高性能流体力学形状优化算法。通过设计自由流-多孔介质流耦合模型、切应力输运湍流模型、滑动网格以及溶血预测方法,算法可精准、快速获取ECMO的血流动力学指标,并进行有针对性的流体力学形状优化。该算法成功应用于我国首台国产自主ECMO的离心血泵、纤维膜等核心部件的形状设计,在保证供血条件下,显著降低了溶血指数,提高了氧交换效率,保障了ECMO的生物相容性和整体性能。

POF

体外膜肺氧合(ECMO)的高性能流体力学形状优化

该成果全文信息:

Chen W, Zheng H, Yan Z, Chen R. Shape design of an artificial pump-lung using high-resolution hemodynamic simulation with high-performance computing. Physics of Fluids. 2023.(Q2, IF=4.6)

6、工作负载感知的NUMA服务器页表自动复制关键技术研究

      数字所异构智能计算中心喻之斌研究员团队提出一种NUMA服务器页表复制自动化的方法,其通过感知工作负载,决策页表复制的开关,首次实现页表复制自动化。将源码实现并合并至Linux内核,平均提高工作负载性能1.82倍,在进程迁移情况下最高提升6.69倍。该工作首次将页表复制技术应用于华为云服务器,减轻了当前服务器性能受NUMA效应影响巨大的痛点,具有落地华为欧拉操作系统的潜力。基于该工作的合作项目被评为“华为云2023年度十大优秀技术合作奖”

该成果全文信息:

Hongliang Qu, Zhibin Yu. WASP: Workload-Aware Self-Replicating Page-Tables for NUMA Servers. The 29th ACM International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS), 2024.(CCF A类会议)

7、延迟信道反馈下的MIMO广播信道广义自由度

      数字所云计算中心王帅团队解决了信息论领域的一个open problem,即如何从数学上严格刻画延迟反馈下MIMO广播通信的广义自由度边界。团队通过构造虚拟通信功率与链路得到了广义自由度外界,利用干扰噪声混合重传得到了广义自由度内界,综合两者得到了MIMO广播通信系统中的广义自由度边界定理。该成果有望指导自主驾驶汽车系统的多模态数据回传,以及集群机器人之间的可靠信息交互。

MIMO广播通信的广义自由度边界定理及其应用

该成果全文信息:

T. Zhang, S. Wang, Y. Xu, R. Wang, P. C. Ching, and H. V. Poor, The Generalized Degrees-of-Freedom Region of the Two-User MIMO Broadcast Channel with Delayed CSIT. IEEE Transactions on Information Theory, 2023. (CCF-A, 信息论顶刊)

8、基于渐进式可组合专家的图文多模态对话预训练模型

      数据所高性能数据挖掘重点实验室杨敏团队提出一种基于渐进式可组合专家的多模态对话预训练模型,引入一种新的分而治之的预训练策略,将复杂的多模态对话任务划分为若干个子功能,这些子功能可以以更简单的方式进行学习。通过有效地组合各子功能的解决方案,从而能够快速给出不同下游多模态对话任务的解决方案。该模型参数量仅为338M,可在单机上运行,性能超过T5-3B等大模型,在四类多模态对话任务上取得最佳性能。

图文多模态对话预训练模型框架

该成果全文信息:

Yunshui Li, Binyuan Hui, ZhiChao Yin, Min Yang, Fei Huang and Yongbin Li. PaCE: Unified Multi-modal Dialogue Pre-training with Progressive and Compositional Experts. The Annual Meeting of the Association for Computational Linguistics (ACL), 2023. (CCF-A类会议)