在AI的幫助下,Google正將內部工作負載遷移至 Arm架構

谷歌近日宣布,它正將大約 3萬個生產型軟體包移植到 Arm 架構,並且計劃將它們全部轉換完畢,以便可以在自己的 Axion 矽片和 x86 處理器上運行。
這家搜尋與廣告的網路巨頭在上週發表了題為「倉庫規模的指令集遷移」的預印論文中記錄了這一行動。 https://arxiv.org/pdf/2510.14928Google在一篇文章中透露說,其旗下重要應用程式 YouTube、Gmail 和 BigQuery 已經在 x86 和 Axion Arm CPU 上運行,有大約 30000 個應用程式將繼續運行。
這兩份文件中都解釋了Google的遷移過程。
Google工程研究員 Parthasarathy Ranganathan 和開發者關係工程師 Wolff Dobson表示說,遷移過程始於一個假設,「我們將花時間研究架構差異,例如浮點漂移、並發性、平台特定運算符等內在函數以及性能。」「起初,我們遷移了一些關鍵工作,例如 F1、Spanner 和 Bigtable,採用了典型的軟體並每週開門的「在早期階段,我們發現了上述問題的證據,但遠沒有我們預期的那麼多。
事實證明,現代編譯器和類似清理工具的工具已經解決了大部分意外問題。」
谷歌開發團隊的負責人稱把大部分時間花在了以下工作上:修復因過度擬合現有 x86 伺服器而失敗的測試;更新複雜的構建與發布系統,通常針對「最古老」的生產系統配置針對最古老的系統解決問題;
顯然,這是一個巨大的程式碼集合,谷歌可以將其現有的自動化工具投入使用 – 然後建立一個名為「CogniPort」的新 AI 工具來完成這些事情。
「CogniPort 會根據建置和測試錯誤進行操作,」Ranganathan 和 Dobson 這樣補充說。
「如果在流程的任何環節,Arm 庫、二進製文件或測試未能構建,或者測試因錯誤而失敗,代理就會介入並自動修復問題。
作為第一步,我們已經使用 CogniPort 的藍圖編輯模式生成無法進行簡單更改的遷移提交。」谷歌發現,該AI代理在特定條件下的成功率約為 30%,並且在測試數據、特定平台方面的最佳條件修復。
這並不有特別大的成功率,谷歌稱至少還有另外 70,000 個軟體包需要移植。該公司的目標是近快徹底完成這項工作,以便其著名的 Borg 叢集管理器(以Kubernetes 為基礎)能夠以有效利用 Arm 伺服器的方式分配公司內部工作負載。
這樣做完,不僅會節省資金,因為谷歌聲稱其基於 Axion 的機器比 x86 實例的性價比高出 65%,並且能源效率高出 60%。
這些數字以及谷歌代碼遷移項目的規模表明,這家網路巨頭在未來幾年將捨棄更多的 x86 處理器。
作者:場長
相關網址:https://cloud.google.com/blog/topics/systems/using-ai-and-automation-to-migrate-between-instruction-sets/


Posted

in

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *