Sorry, your browser cannot access this site
This page requires browser support (enable) JavaScript
Learn more >

工程实践:实现单机 GPU/CPU 混部 这篇文章记录了我们在 GPU 训练机器上实现 CPU 任务混部的完整过程。读完之后,你会了解:GPU 训练任务的数据加载链路(DataLoader → 共享内存 → 锁页内存 → DMA → GPU HBM)中哪些环节对 NUMA 敏感;为什么 Linux 的 First-Touch 内存策略在混部场景下会产生问题,以及如何通过 MPOL_INTE...