中国科学院深圳先进技术研究院数字所异构智能计算体系结构与系统研究中心在工作负载感知的NUMA服务器页表自动复制关键技术研究方面取得重要进展,相关成果“WASP: Workload-Aware Self-Replicating Page-Tables for NUMA Servers ”被计算机体系结构顶级会议ASPLOS (Architectural Support for Programming Languages and Operating Systems,CCF-A类会议)2024录用为长文。博士生曲虹亮为第一作者,喻之斌研究员为第二和通讯作者。
该项研究致力于准确预测页表复制对workload的影响,提出了一种层级决策机制,为自动化开启/关闭页表复制提供依据。workload的特性和系统中混部程序对workload获得的页表复制收益有重要的影响。WASP是首个研究页表复制自动化的方法。WASP提出了两项创新技术。首先,它确定了一组关键指标,这些指标在大多数处理器架构上都可获得,并可用于指示是否应启用/禁用页表复制。其次,WASP基于这些指标设计了一种分层和渐进的机制,以自动启用/禁用特定工作负载的页表复制,从而提高该负载的性能。WASP在arm64 和 x86_64架构的服务器上都进行了实验。实验结果表明,WASP在多NUMA节点情况下可以将工作负载的性能提高1.82倍,在进程迁移情况下可以提高6.69倍。此外,WASP可以自动将流行数据中心应用程序的整体性能提高1.36倍。这表明WASP可以在云数据中心中得到实际应用。
WASP工作流程

WASP 决策机制

WASP与最先进页表复制程序Mitosis对比(多NUMA节点场景)

WASP与最先进页表复制程序Mitosis对比(进程迁移场景)
ASPLOS (Architectural Support for Programming Languages and Operating Systems)是由ACM举办的计算机体系结构领域的顶级会议,与HPCA, ISCA, MICRO并称为计算机体系结构领域的“四大顶会”。 参会对象包括微体系结构、云计算、计算机系统等领域的研究人员或学生。