英伟达工程师修改Linux内核致AMD GPU性能下降,后又将其修复
IT之家 4 月 7 日消息,一名英伟达工程师近日在 Linux 内核中提交了一个修复补丁,解决了 AMD 集成和独立 GPU 硬件上出现的性能倒退问题。然而令人意外的是,这位工程师正是最初引入这一问题的“始作俑者”。
据 Phoronix 报道,这位英伟达工程师上周对 Linux 内核进行了修改,试图将 PCI 基地址寄存器(BAR)空间扩展至超过 10TiB。然而,这一旨在提升拥有大内存空间的系统性能的改动,却意外地将 AMD 的 GPU 错误地标记为“受限”,从而严重影响了其性能表现。所幸的是,这一问题很快被社区发现并得到修复。
据悉,此次性能衰退的根本原因是上周提交的一个旨在扩展 PCI BAR 空间的 commit。该 commit 在提升大内存系统潜力的同时,也间接降低了消费级 x86 设备上的内核地址空间布局随机化(KASLR)熵值。KASLR 是一项重要的安全特性,它通过在每次启动时随机化内核数据加载到内存中的位置来增强系统安全性。与此同时,该 commit 还人为地扩大了内核可访问的物理内存范围(direct_map_physmem_end),通常会扩展至 64TiB。
在 Linux 系统中,内存被划分为不同的区域(zone),其中一种是设备区域(zone device),可以与 GPU 相关联。此次问题的关键在于,当内核为 Radeon GPU 初始化设备区域内存时,一个名为“max_pfn”的关联变量(代表内核可寻址的总 RAM)被人为地增加到了 64TiB。
由于 GPU 很可能无法访问整个 64TiB 的地址范围,这导致系统错误地将“dma_addressing_limited ()”标记为 True。该变量实际上限制了 GPU 只能使用 DMA32 区域,该区域仅提供 4GB 的内存,这就解释了性能大幅下降的原因。
幸运的是,这一问题很快被发现并得到了修复。英伟达工程师迅速提交了修复补丁,解决了这一性能倒退问题。根据 Linux 内核的开发流程,该修复补丁预计将在 Linux 6.15-rc1 合并窗口关闭前(即今日)被合并。
这一事件也体现了开源社区的协作精神。尽管 AMD 和 Nvidia 在 GPU 市场上是竞争对手,但在开源领域,他们共同遵循“谁破坏,谁修复”的原则。据IT之家了解,Linux 内核作为开源项目,接受来自全球开发者的贡献,并通过严格的代码审查机制确保代码质量。这种合作模式不仅推动了技术的进步,也促进了不同技术阵营之间的交流与合作。
随着修复补丁的合并,预计 Linux 6.15 稳定版将在六到八周后发布,大约在 5 月底或 6 月初。届时,用户将能够体验到修复后的系统性能,而 AMD 和 Nvidia 的 GPU 硬件也将更加稳定地运行在 Linux 平台上。
相关推荐
-
成本几分钱,如何1年狂赚100亿? 都说生意不好做,没想到2025年,有公司靠卖卡片一年就能赚100亿元。 日前,集换式卡牌领域龙头企业卡游向港股递交上市申请,其招股书数据格外吸睛:2024 年收入达100亿元,同比增长278%;毛利率71.3%,盈利成绩远超同行,甚至盖过潮玩界明星企业泡泡玛特。 同样因为踩上风口而成绩亮眼,
实时讯息 05-26
-
特朗普威胁停止向哈佛大学拨款,要求交出留学生名单! 据央视新闻报道,当地时间 5 月 25 日,美国总统特朗普威胁称,联邦政府将可能不再继续向哈佛大学提供新的拨款,并要求校方提供所有国际学生的姓名及国籍信息,以便进一步审查。美国政府 5 月 22 日宣布取消美国哈佛大学获得的学生和交流学者项目资质,禁止该校招收国际学生。哈佛大学 23 日就此禁令起诉
实时讯息 05-26
-
王立新谈国家身份塑造与美国外交政策 王立新(章静绘)北京大学历史系王立新教授的新著《帝国的叙事话语:国家身份塑造与冷战时期美国外交政策》于近期由北京大学出版社出版。这是继《踌躇的霸权:美国崛起后的身份困惑与秩序追求》之后,王立新教授在“国家身份”这一课题上所做的更加全面和深入的讨论。国家身份是想象的自我,通常涉及三个核心问题,即“我们
实时讯息 05-25
-
一加Ace5至尊版首发“电竞三芯” 引领游戏硬件解决方案新变革 【ZOL中关村在线原创新闻】近日,一加手机正式推出一加 Ace5 至尊版,该机型凭借首发搭载的“电竞三芯”技术,打造出行业首个游戏全链路芯片级硬件解决方案,为玩家带来前所未有的极致流畅游戏体验,并顺利通过行业首个“泰尔电竞游戏流畅性认证”。一加 Ace5 至尊版所配备的“电竞三芯”由性能芯、触控芯与
实时讯息 05-22
-
大庆市让胡路区这一纪念馆顺利通过国家一级博物馆评估!
实时讯息 05-21