对GPU进行性能优化时,cudagraph是绕不开的话题。
不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。
NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。
本文尝试从底层原理出发,根据文档 和 …。
哈梅内伊称伊朗绝不接受任何「强加的和平或战争」,接下来他将如何反击?
哈梅内伊称伊朗绝不接受任何「强加的和平或战争」,接下来他将如何反击?...(144 )人阅读时间:2025-06-19 16:15:14
颈椎病的最佳治疗方法是什么?
颈椎病的最佳治疗方法是什么?...(144 )人阅读时间:2025-06-19 16:00:14
2025年了 Rust前景如何?
2025年了 Rust前景如何?...(144 )人阅读时间:2025-06-19 17:00:14
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?...(144 )人阅读时间:2025-06-19 16:30:14为什么《歌手》不请周杰伦、陈奕迅、王菲、张学友、孙燕姿、梁静茹、王力宏、林俊杰当节目嘉宾?
为什么《歌手》不请周杰伦、陈奕迅、王菲、张学友、孙燕姿、梁静茹、王力宏、林俊杰当节目嘉宾?...2020-02-212025年小米su7 性价比很低了,为何还不更新改款?
2025年小米su7 性价比很低了,为何还不更新改款?...2020-02-21做个web服务器,gin框架和go-zero怎么选?
做个web服务器,gin框架和go-zero怎么选?...2020-02-21Office 中为何还要保留 Access 数据库?
Office 中为何还要保留 Access 数据库?...2020-02-21