Tag: NCP-AIN

  • 純粹程式設計者:氛圍程式設計究竟有沒有用處?

    導讀:曾經,有些程式設計純粹主義者認為 BASIC 語言有害,而現在的人工智慧甚至連 BASIC 都無法做到。一個前景光明的項目,必然需要一支團隊 —— 這是公認的事實。這支團隊必須由經驗豐富、判斷力強、具備分析邏輯能力和良好人際溝通技巧的優秀開發者組成。而AI 編碼在其中的定位仍存在巨大爭議。但企業 IT 領域對 「氛圍程式設計」(Vibe Coding) 的態度卻十分明確:要嘛是在推銷它,要嘛是對它敬而遠之。原因很簡單。程式碼產生工具的賣點是 “透過自然語言指令快速出結果”,無需使用者掌握程式碼工作原理的專業知識。這一點在某種程度上確實成立,精心挑選的兩分鐘演示也確實令人印象深刻。從這方面來看,氛圍程式設計與已經存在了 30 年的低程式碼 / 無程式碼運動甚為相似。但氛圍程式隨後便會暴露致命缺陷:它具有不確定性。低程式碼 / 無程式碼平台的介面對使用者輸入的回應是一致的。無論是調整字體,還是徹底換一個全新思路重新開始,迭代優化都能順利推進。而氛圍程式設計則可能在相同指令下,不同時間給出截然不同的結果。想要調整結果,很大程度上取決於 AI 如何解讀你的需求,以及它對自己最初想法的執著程度 —— 通常這種執著還相當強烈。更別提當你的工具不斷改變時,如何維護一個沒有人類完全理解的程式碼庫了。如果 30 年後低程式碼 / 無程式碼領域都沒有出現太多成熟的生產級應用,那麼氛圍程式設計的前景無疑更加黯淡。即便氛圍程式設計實現了其最基本的功能 —— 快速生成原型來探索想法 —— 也會遭遇 「原型無法捨棄」 的問題,最終演變成難以控制的 「怪物」。一旦某個原型看起來能運行,來自外部的壓力通常會迫使團隊立即在此基礎上進行開發。這種情況在任何環境下都已經夠糟糕了,而 “氛圍” 根本無法應對這種局面。不過,在某個方面,氛圍程式確實擁有其他工具難以比擬的吸引力。自從開機就能直接進入 BASIC 解譯器的家用電腦時代以來,新手用戶終於能透過簡單輸入就能實現一些功能了。林納斯・托瓦茲(Linus Torvalds)上週將它視為一大優勢,認為這與當年從電腦雜誌背面抄錄程序的日子頗為相似。這話並不是沒有道理 —— 如果你經歷過那個年代,就會記得修正數百行晦澀代碼中的邏輯錯誤或打印錯誤是多麼可怕的經歷 —— 但這幾乎完全偏離了核心問題。當年的 BASIC 語言也遭遇了與如今氛圍程式設計類似的批評,被認為會助長糟糕的程式設計習慣,催生結構混亂、難以理解、無法維護的程式碼。程式界泰斗埃德加・迪傑斯特拉(Edsger Dijkstra)在《GOTO 語句有害論》中就提出了這一觀點,而這句話在數十年間一直被廣泛引用。這就好比說,那些拿起樂器只是想試試身手的孩子,或是被沒有正規訓練背景的老師教導的孩子,永遠只能做出糟糕的音樂。通常情況下確實如此,但大多數優秀的音樂家都是這樣起步的。音樂的起源就如此。如果你發現自己熱愛它,就會不斷進步。而BASIC 語言的情況也是如此。但氛圍程式設計卻沒有這樣的成長路徑。這並非完全是它的錯。在現代運算環境中,要實現 “有用的功能”,就需要編寫包含 API、複雜結構的程式碼,核心邏輯之外還充斥著無數繁瑣的附加部分。透過反覆調整指令來 “瞎折騰”,無法建立起編寫程式碼所必需的內在理解框架;而沒有了那種突然頓悟帶來的多巴胺獎勵 —— 這種獎勵正是許多人早期程式設計經歷的動力源泉 ——…

  • 英偉達H20 GPU晶片關鍵知識

    在當下科技發展浪潮中,英偉達GPU晶片已然成為眾多前沿領域的核心驅動力,而H20 GPU晶片憑藉其獨特優勢,在市場中嶄露頭角。接下來將從晶片架構、參數、友商競爭比較、產業應用和場景等多個維度,全方位呈現H20 GPU晶片的相關知識。一、晶片架構1.Hopper架構:H20採用英偉達先進的Hopper架構,基於台積電4N製程製造,擁有超過800億個電晶體,為其強大性能奠定硬體基礎。 2.創新技術支撐:Hopper架構具備五項突破性創新技術,為H20強大效能提供動力支持,全面提升晶片運算、處理能力。 3.第三代Tensor Core:支援FP32、FP16和INT8等多種精度計算,能根據不同應用場景靈活切換計算精度,顯著提升計算效率。 4.運算彈性:在深度學習訓練中,可依模型需求選擇適當精度運算,如在初期快速迭代模型時,可採用較低精度運算加速訓練。 5.第二代RT Core:專為即時光線追蹤技術設計,相較於前代在效能與效率上顯著提升,讓渲染效果更逼真。 6.光線追蹤應用:在3D遊戲開發、影視特效製作等領域,可快速渲染複雜光影效果,提升視覺體驗。 7.CUDA核心升級:擁有大量CUDA核心,相較於上一代產品,CUDA核心數量增加50%,大幅提升運算吞吐量。 8.平行計算優勢:科學計算中的分子動力學模擬、氣像模擬等場景,可平行處理大量數據,縮短計算時間。 9.多精度運算能力:能在高精度科學計算與低精度深度學習推理等不同場景中自由切換,滿足多樣化任務需求。 10.應用場景切換:從航太領域的軌道計算,到網路領域的影像辨識推理,都能憑藉多精度計算快速適應。二、參數亮點(一)儲存與頻寬11.大容量內存:擁有96GB的HBM3高效能內存,相比H100的80GB HBM3內存 ,容量更大,可存儲更多數據。 12.資料儲存優勢:處理大規模資料集時,如訓練超大型語言模型,能儲存更多中間結果,減少資料讀寫次數。 13.高頻寬傳輸:GPU顯存頻寬達到4.0TB/s,高於H100的3.4TB/s ,資料傳輸速度更快。 14.加速資料處理:在深度學習訓練中,能快速將資料傳輸至運算核心,減少等待時間,提升整體運算效率。 15.記憶體頻寬協同:大容量記憶體與高頻寬相互配合,為高效能運算提供堅實保障,確保資料的快速讀取與儲存。 (二)算力性能16.FP8算力:FP8性能為296TFLOPs,在一些對低精度計算要求高的場景,如特定的深度學習推理任務中表現出色。 17.FP8應用:在智慧安防攝影機的即時影像辨識中,可快速處理視訊串流數據,辨識目標物體。 18.FP16算力:FP16性能為148TFLOPs ,雖然相比H100的理論性能有差距,但在大語言模型推理方面有獨特優化。 19.大模型推理優勢:透過最佳化設計,在大語言模型推理時比H100快20%以上 ,可快速回應使用者提問。 20.多精度算力支援:同時支援TF32 Tensor Core(74TFLOPS)、FP32(44TFLOPS) 、FP64(1TFLOPS)等不同精度計算。 21.科學計算精度適配:在物理模擬、化學分子結構計算等科學計算場景中,依任務需求選擇適當精度,確保計算準確性。 22.算力綜合表現:多種精度算力協同,使H20能在不同領域、不同類型的計算任務中發揮作用。 23.異構運算支援:與CPU等其他運算單元配合,在複雜運算系統中實現異構運算,提升整體運算效能。 (三)其他參數24.功耗優勢:熱設計功耗400W,低於H100的700W ,功耗控制良好,降低資料中心散熱成本。 25.散熱成本降低:對於大規模資料中心,可減少散熱設備投入與營運成本,提升能源利用效率。 26.高速互聯功能:支援NVLink 900GB/s高速互聯功能,方便資料中心進行高密度部署與擴充。 27.叢集擴展:在建構大規模運算集群時,多塊H20晶片可透過NVLink高速互聯,實現高效能資料傳輸與協同工作。 28.闆卡形態與相容性:採用SXM闆卡形態,相容於英偉達8路HGX伺服器規格,方便在現有伺服器架構中部署。 29.MIG功能:具備7路MIG(多執行個體GPU)功能,可將GPU資源細粒度劃分,滿足不同使用者對運算資源的多元需求。 30.資源彈性分配:在雲端運算環境中,可依使用者任務大小與需求,靈活分配GPU資源,提高資源利用率。三、產品競爭比較(一)與英偉達H100比較31.核心算力差距:在核心算力上,H20與H100有較大差距,H20的FP16算力僅為H100的15%左右 。 32.記憶體頻寬優勢:但H20在記憶體容量和頻寬上更具優勢,96GB的HBM3記憶體以及4.0TB/s的頻寬高於H100。33.場景優勢互補:在大語言模型推理場景下,H20針對性的最佳化使其表現優於H100,而H100在大規模深度學習等場景更佔優勢。 34.適用任務著重:H20較適合垂類模型訓練、推理等對算力要求相對較低的任務,H100則適用於大型複雜模型訓練。 35.價格與成本考量:通常H20價格相對較低,對於成本敏感、對算力需求並非頂級的企業或項目,H20是較經濟的選擇。 (二)與華為昇騰910B對比36.性能對比:H20性能約為H100的15%-30% ,略超昇騰910B,但無法支援萬億級大模型訓練。 37.能源效率比優勢:昇騰910B在功耗和能源效率比方面優勢明顯,國產昇騰910B實算力達320TFLOPS,單卡功耗相對較低。 38.散熱方式:昇騰910B散熱方式更節能,如採用風冷即可滿足散熱需求,而H20部分集群可能需要液冷。 39.生態系差異:H20依賴英偉達成熟的CUDA生態,軟體資源豐富;昇騰910B建構了本土的CANN框架生態,也不斷改進。 40.應用場景著重:在對能耗要求高、對成本敏感且對模型規模要求不特別大的場景,昇騰910B有競爭力;而在對CUDA生態依賴度高的場景,H20更合適。 (三)市佔率與競爭態勢41.英偉達市場地位:英偉達憑藉長期的技術累積與生態優勢,在高效能運算與資料中心市場佔有重要地位。 42.H20市場角色:H20作為英偉達針對特定市場需求推出的產品,在滿足部分顧客算力需求的同時,也豐富了其產品線。…

  • 英偉達:5 兆美元市值在望?

    如大家所知,英偉達(NvidiA)宣稱它已獲美國政府批准,恢復向中國銷售其 H20 人工智慧(AI)晶片。此舉標誌著川普政府先前實施的出口限制政策發生戲劇性逆轉。 H20 晶片:中國 AI 市場的金鑰 專為符合美國出口管制設計的 H20 圖形處理器(GPU),是英偉達在華可合法銷售的最強 AI 晶片。作為 2022 年出口限制及 2023 年政策收緊後的應對方案,該晶片系 H100 的降級版本:在滿足國家安全閾值的同時,仍支持騰訊、阿里巴巴及字節跳動等企業關鍵的 AI 推理任務。 中國企業爭相搶購 H20 晶片,據報自 1 月以來訂單額高達 180 億美元,凸顯中國市場對高性價比 AI 解決方案的迫切需求。此次白宮撤銷 4 月禁令,為英偉達重啟這一龐大市場鋪路。 中國科技巨頭已透過英偉達白名單流程提交申請,確保許可獲批後訂單可立即交付。 5 兆美元市值在望? 公告引發的股價飆升,印證了投資人對英偉達重返中國的樂觀預期。該公司 CEO 曾將中國市場形容為「規模龐大、活力充沛且極具創新力」。先前 H20 禁令導致英偉達損失 150 億美元銷售額及 55 億美元庫存減值,恢復出貨可望挽回可觀收入。 分析師預估,2025 年英偉達或將出貨 100 萬至 120 萬支 H20 GPU,帶來數十億美元新增收入。配合專為智慧工廠數位孿生應用設計的新型 RTX Pro GPU,此舉將進一步鞏固英偉達在中國 AI…