當前位置:首頁(yè) > 原創(chuàng ) > 劉巖軒
[導讀]從ChatGPT到AI手機、AI PC,AI正在各種不同型態(tài)的設備上落地。而作為幾百億臺移動(dòng)設備和嵌入式設備的計算核心的供應商,Arm也敏銳捕捉到了這一新的重大機遇,持續在全線(xiàn)的新產(chǎn)品中增加AI的功能和特性,助力實(shí)現設備端的AI賦能。

從ChatGPT到AI手機、AI PC,AI正在各種不同型態(tài)的設備上落地。而作為幾百億臺移動(dòng)設備和嵌入式設備的計算核心的供應商,Arm也敏銳捕捉到了這一新的重大機遇,持續在全線(xiàn)的新產(chǎn)品中增加AI的功能和特性,助力實(shí)現設備端的AI賦能。

近日,Arm在北京召開(kāi)了發(fā)布會(huì ),Arm終端事業(yè)部產(chǎn)品管理副總裁JamesMcNiven向記者介紹了其新推出的CPU超大核“Cortex-X925”、GPU“Immortalis-G925”以及全新的終端計算子系統(CSS for Client)。


Arm Cortex-X925:?jiǎn)尉€(xiàn)程每時(shí)鐘指令 (IPC) 性能實(shí)現最大同比增幅

眾所周知,Arm的CPU命名體系在過(guò)去經(jīng)歷了多次變化,以適應其不斷擴展的產(chǎn)品線(xiàn)和技術(shù)發(fā)展。最初,Arm的處理器以簡(jiǎn)單的數字和字母組合命名,如 ARM1、ARM2 等。數字的變化代表著(zhù)處理器的世代和技術(shù)進(jìn)步。2004年Arm推出了Cortex品牌,標志著(zhù)一個(gè)新的命名和產(chǎn)品策略開(kāi)啟。其中面向性能需求較高的CPU Core被命名為Cortex-A。從Cortex-A5一直到Cortex-A78,每一代的性能逐步提升。而在2020年,為了給最高端的智能手機和其他計算密集型設備提供極致計算性能,Arm又推出了Cortex-X系列作為Cortex-A系列的補充。從Cortex-X1到Cortex-X4,依舊是延續了Arm每代際之間的雙位數性能提升。而今年的CPU超大核,已經(jīng)不再命名為Cortex-X5,而是被命名為“Cortex-X925”。

據James介紹,今年改名是因為Cortex-X925實(shí)現了自Cortex-X系列推出以來(lái)、歷代產(chǎn)品中最高的每時(shí)鐘周期指令數(IPC)增幅,希望通過(guò)這一命名更清晰地展示其與前代產(chǎn)品的差異。Cortex-X925結合了新設計帶來(lái)的微架構改進(jìn)及頻率提升,在Geekbench中單線(xiàn)程性能提高了36%。以人工智能性能為例,與去年的Cortex-X4 CPU相比,詞元首次響應時(shí)間提高了41%,大型語(yǔ)言模型(LLM)的初始響應能力顯著(zhù)增強。這些成就實(shí)現得益于其微架構的顯著(zhù)演進(jìn)——Arm帶來(lái)了迄今為止最寬的解碼和矢量設計,最終實(shí)現了50%TOPS增長(cháng)。此外,通過(guò)更強的可配置性和更大的私有L2緩存,保留了經(jīng)過(guò)CPU的指令和數據。同時(shí),Arm的RTL和物理設計團隊也進(jìn)行了進(jìn)一步的協(xié)作,針對最新的3nm工藝優(yōu)化了頻率和效率。

此外,和超大核X925一同發(fā)布的還有大核Arm Cortex-A725,更新后的小核A520,以及更新后的DSU-120,確保新的產(chǎn)品可以覆蓋最廣泛的消費電子設備。


Arm Immortalis G925: AI能力增強同時(shí)功耗降低

據悉,今年發(fā)布的新款I(lǐng)mmortalis-G925 GPU是Arm“迄今為止性能最高、效率最高的 GPU”。與上一代G720相比,它在圖形應用程序上的速度提高了37%,復雜物體的光線(xiàn)追蹤性能提高了52%,AI和ML工作負載提高了34%,同時(shí)功耗降低了30%。

值得一提的是,G925也針對AI相關(guān)的用例進(jìn)行了優(yōu)化。在超級采樣任務(wù)中,開(kāi)發(fā)者可以使用神經(jīng)網(wǎng)絡(luò )對圖像進(jìn)行向上拓展,其性能可提高近30%。而在其他圖像處理任務(wù),如分割和分類(lèi)速度提升了 41%。此外,該GPU還可用于語(yǔ)言處理和語(yǔ)音轉文本任務(wù),速度比其前代產(chǎn)品高出50%。

在游戲玩家最為關(guān)注的光追方面,G925上也得到了進(jìn)一步的增強,據了解,在渲染與 G720 具有相同保真度的光線(xiàn)追蹤透明度時(shí),G925的速度提高了 27%,但如果開(kāi)發(fā)者選擇略微降低質(zhì)量,GPU性能將提高52%,而內存流量將減少57%。

將光追引入移動(dòng)設備是Immortails的使命,而Arm一直致力于讓開(kāi)發(fā)者盡可能輕松地在移動(dòng)設備上實(shí)現游戲主機級內容。據James介紹,Arm正在與Epic Games合作,確保他們的桌面平臺渲染器能夠在其Immortails GPU上快速高效地運行。今年,Arm還將持續開(kāi)展全球范圍內的開(kāi)發(fā)者教育活動(dòng),以確保游戲開(kāi)發(fā)者能夠將更多精彩內容帶入到移動(dòng)設備中。

此外,和Immortalis-G925一同發(fā)布的全新GPU還包括Mali-G725和Mail-G625,分別針對高端市場(chǎng)和入門(mén)市場(chǎng)。


Arm終端計算子系統(CSS for Client):首次提供Arm CPU和GPU物理實(shí)現

將全新的CPU、GPU以及內部高速互連IP相結合,就組成了Arm最新的終端計算子系統(CSS for Client)。作為Arm TCS的全新?lián)Q代升級,Arm終端計算子系統(CSS for Client)是Arm首次在終端領(lǐng)域提供基于A(yíng)rm CPU和GPU優(yōu)化設計的物理實(shí)現解決方案。這讓構建和部署基于A(yíng)rm架構的解決方案變得更加簡(jiǎn)單,讓客戶(hù)能夠確保萬(wàn)無(wú)一失。

為了給業(yè)界提供卓越的性能表現,Arm融合了最新的Armv9.2CPU(Arm Cortex-X925、Arm Cortex-A725和Arm Cortex-A520)和Immortalis GPU,以及最新版本的CoreLink系統互連和系統內存管理單元(SMMU),并對內存及SoC其他組成部分的計算路徑進(jìn)行了深度優(yōu)化。據James介紹,Arm終端計算子系統已經(jīng)準備就緒,可直接被納入Arm合作伙伴的SoC設計中。通過(guò)充分利用領(lǐng)先代工廠(chǎng)的3nm工藝優(yōu)勢,Arm力求提供更多價(jià)值,以物理實(shí)現的形式提供IP。Arm終端計算子系統將幫助客戶(hù)加速實(shí)現高性能、高效率及縮短產(chǎn)品上市時(shí)間。

值得一提的是,Arm終端計算子系統不僅僅是一個(gè)硬件平臺方案,而是一個(gè)融合了軟硬件協(xié)同優(yōu)化的系統設計方案??梢酝ㄟ^(guò)軟件和工具組合在 終端CSS 上進(jìn)一步優(yōu)化性能和功耗,Arm終端CSS結合了軟件以及世界上最大的移動(dòng)設備生態(tài)系統,提供一個(gè)AI優(yōu)化計算平臺所需的計算性能和效率,將成為新一代終端AI產(chǎn)品和服務(wù)的基石。

Arm終端CSS的完整解決方案會(huì )針對不同用例或某些測試基準來(lái)設定目標,并將其分解到單個(gè)IP當中。以游戲《原神》為例,Arm先從系統層面進(jìn)行分析,然后針對GPU、圖形性能、CPU 等設定提升的目標,將各類(lèi)游戲機制和計算能力推向極限。每個(gè)單一IP的性能提升都為終端 CSS 的整體性能添磚加瓦。

為了讓開(kāi)發(fā)者能夠充分利用Arm終端CSS的性能優(yōu)勢,Arm發(fā)布了全新的面向 AI 的 KleidiAI,以及面向計算機視覺(jué)的 KleidiCV。Kleidi其實(shí)是一組高度優(yōu)化的機器學(xué)習 (ML) 軟件內核,并且為開(kāi)發(fā)者提供了實(shí)現Arm CPU最佳性能的路徑,幫助其解鎖未來(lái)Armv9架構的創(chuàng )新和性能。

據James介紹,當前AI和機器視覺(jué)領(lǐng)域的諸多解決方案,大多是基于CPU構建而來(lái);70% 的第三方安卓ML工作負載都運行在CPU上。因此,CPU性能越高,開(kāi)發(fā)者就能越快地將功能推出,并專(zhuān)注于下一個(gè)創(chuàng )新。而Kleidi的作用正是如此——這些小型、高度優(yōu)化的內核,旨在集成到涉及AI或計算視覺(jué)的任何地方。它們可使開(kāi)發(fā)者在部署到任何Arm CPU上時(shí)均能獲得優(yōu)異性能。舉例來(lái)說(shuō),基于Cortex-X925的Kleidi技術(shù)運行最新Llama 3和Phi-3 LLM的速度要比參考實(shí)現快2.9倍,而且只用不到24小時(shí)就能實(shí)現。

“我們的最終目標,是讓我們的合作伙伴,以及我們的生態(tài)系統能夠不斷創(chuàng )新、實(shí)現差異化并更快地進(jìn)入市場(chǎng)?!盝ames總結到,“Arm 終端 CSS 帶來(lái)了 Armv9.2 的能效優(yōu)勢,憑借物理實(shí)現和持續的軟件優(yōu)化,它將徹底革新開(kāi)發(fā)者和消費者的體驗。我們很高興能夠提供面向未來(lái) AI 的平臺,Arm 平臺是這一未來(lái)的基石?!?

本站聲明: 本文章由作者或相關(guān)機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀(guān)點(diǎn),本站亦不保證或承諾內容真實(shí)性等。需要轉載請聯(lián)系該專(zhuān)欄作者,如若文章內容侵犯您的權益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

為了更好地滿(mǎn)足AI實(shí)際用例的需求,今年Arm推出了一系列先進(jìn)的解決方案,包括面向消費電子設備的全新計算子系統——Arm終端計算子系統(CSS),內涵基于A(yíng)rm第五代GPU架構構建的全新GPU和最新的Armv9.2 CPU...

關(guān)鍵字: ARM AI

在下述的內容中,小編將基于用FIFO實(shí)現超聲測厚系統A/D與ARM接口設計。如果這是您想要了解的內容之一,不妨和小編共同閱讀這篇文章哦。

關(guān)鍵字: FIFO 超聲測厚系統 ARM

業(yè)內消息,近日Arm公司官宣推出全新的基于A(yíng)rm v9架構的CPU、GPU IP,以及設計軟件工具,以幫助智能手機更好地處理人工智能(AI)任務(wù),并加速AI應用。

關(guān)鍵字: ARM 芯片IP 黑鷹 超大核 Cortex-A725

最新消息,昨天北京開(kāi)源芯片研究院官宣 ,2024 年 5 月 21 日開(kāi)芯院通過(guò)線(xiàn)上會(huì )議的方式,向會(huì )員單位正式發(fā)布了全球首個(gè)開(kāi)源大規模片上互聯(lián)網(wǎng)絡(luò )(Network on Chip,NoC)IP—— 研發(fā)代號“溫榆河”。這...

關(guān)鍵字: ARM 壟斷 開(kāi)源 片上互聯(lián)網(wǎng)絡(luò ) 溫榆河

據《日經(jīng)新聞》報道,軟銀旗下英國芯片制造商Arm計劃到2025年銷(xiāo)售AI芯片。該公司專(zhuān)門(mén)成立一個(gè)AI芯片部門(mén),并將在2025年春季之前制造出原型產(chǎn)品,并于秋季開(kāi)始大規模生產(chǎn)。

關(guān)鍵字: 軟銀 AGI ARM AI芯片

業(yè)內消息,近日日本軟件銀行集團(SoftBank Group)旗下安謀國際科技公司(Arm)計劃研發(fā)人工智能(AI)芯片,先成立一個(gè)AI芯片部門(mén),目標是明年春季建立AI芯片原型產(chǎn)品,然后將量產(chǎn)工作交由代工廠(chǎng)制造,預估20...

關(guān)鍵字: ARM AI芯片

Arm CPU正在從根本上推動(dòng)AI變革,并造福地球。Arm架構是未來(lái)AI計算的基石。?

關(guān)鍵字: ARM AI

近日,Arm推出了Arm? Ethos?-U85神經(jīng)網(wǎng)絡(luò )處理器(NPU)和Arm Corstone?-320物聯(lián)網(wǎng)參考設計平臺,旨在滿(mǎn)足海量的數據處理和大規模計算,加速推進(jìn)邊緣AI的發(fā)展進(jìn)程。

關(guān)鍵字: ARM

為了趕超云計算市場(chǎng)上的競爭對手,谷歌正試圖通過(guò)定制的Arm服務(wù)器芯片降低云計算服務(wù)成本。

關(guān)鍵字: 谷歌 ARM 定制芯片

嵌入式開(kāi)發(fā)作為一個(gè)融合了計算機軟硬件和系統工程的綜合性領(lǐng)域,其成功與否往往取決于三個(gè)核心要素的有效整合與協(xié)調。這三個(gè)要素分別是:硬件平臺的選擇與設計、軟件開(kāi)發(fā)及其優(yōu)化、以及系統級的設計與集成。深入理解并熟練掌握這三個(gè)方面...

關(guān)鍵字: 嵌入式開(kāi)發(fā) ARM
關(guān)閉