Mindblown: a blog about philosophy.
-
AI叢集設計重點:規模、效率與彈性
本文聚焦 AI 叢集的網路架構設計與互聯技術選擇,系統分析 AI 流量特性、叢集架構差異及關鍵互聯方案,提出 「端點調度」 與 「交換器調度」 兩大設計路徑。一、AI 叢集的網路需求與流量特性1. AI 叢集的核心訴求:規模、效率與彈性 隨著 AI 模型向萬億參數級演進,集群對網路提出三大極致需求:超大規模擴展:需支撐百萬級 XPU(GPU/NPU)協同,單機櫃到跨數據中心的全場景互聯;高效低延遲:XPU 間透過集合通信(Collectives,如 All-Gather、All-Reduce)頻繁交互參數,要求延遲通過集合通信(Collectives,如 All-Gather、All-Reduce) XPU、機架功率差異、混合負載(訓練 / 推理),避免 「單點瓶頸」 拖累整體效能(叢集效能由最慢節點決定)。 三、AI 集群的兩大核心網路設計路徑Arista 提出兩種主流 AI 叢集網路架構,分別適應不同規模與異質需求,核心差異在於 「流量調度責任歸屬」:1. 端點調度架構(Endpoint Scheduled/NSF)(1)核心邏輯調度責任由 XPU 端點(如 NIC/DPU)承擔,網路僅負責基礎轉發,依賴端點實現負載平衡與擁塞控制,本質是 「乙太網路原生架構的最佳化延伸」。 (2)關鍵特性拓撲與元件:採用扁平化 Spine-Leaf/Super Spine 架構,交換器僅提供高頻寬(如 800G 連接埠)與高連接埠數(Radix),無複雜調度功能;端點依賴:NIC 需支援動態負載平衡(DLB)、自適應路由(Adaptive功能;避免單鏈路擁塞;優點:架構簡單,佈線靈活,相容於現有乙太網路生態,適合中小規模叢集(≤10K XPU);限制:NIC 廠商鎖定(需專用功能),大規模叢集中端點調度複雜度高,易出現負載不均。 Arista 整理了 6 類 800G 互聯技術,覆蓋 “機櫃內 – 跨機櫃 –…
-
通訊新員工入行,哪些技能最實用?
PPT Office三件組(PPT/Word/excel),是非常非常非常重要的技能。 絕大部分在校大學生,只懂一些Office的皮毛。就算是職場人,真正熟練Office的也不多。Office是個博大精深的東西,一定要專門去系統性學習。網路課程很多,一定要好好學。我個人建議花錢報班,絕對受益終身。PPT,是通訊人用的最多的軟體之一,也很可能是花時間最多的軟體之一。向領導報告,需要PPT;和客戶交流,需要PPT;給同事培訓,需要PPT;參加行業會議,需要PPT。 PPT無所不在,利用率極高。其實,PPT本質上考驗的是設計能力、美感能力、表達能力、溝通能力、思考能力。它不是一門技術,而是一門藝術。有時候,你辛苦工作一年,不如人家一篇PPT的作用大。 Word和Excel,同樣是博大精深。現在它早已不是簡單的文字和表格了,是通往資料分析、python、人工智慧的一條路徑。熟練Office,會大大提升自己的工作效率。 █ AI這個就不用多說了吧。AI可以大幅提升工作效率。不管是寫材料、做PPT、做表格、查資料、做紀要,還是完成一些流程性、複雜性的工作,都可以藉助AI。努力將自己的日常工作透過AI解決,可以省很多事。擁抱AI是大勢所趨。身為通訊專業從業人員,有餘力的話,建議再深入一點,學習一些開源專案的開發與部署,搞搞副業也有可能有大收穫。 █ 類UNIX作業系統目前,通訊崗位大量的工作都是基於類UNIX系統的。大部分的通訊現網設備,都是採用類UNIX系統作為網路管理和系統運作平台。除了通訊崗位外,雲端運算、大數據、人工智慧相關崗位,使用的工作環境基本上也是類UNIX系統。所以,熟練這類系統的使用能力,是資訊通訊(ICT)相關專業畢業生的最基本要求,非常非常非常重要。具體來說,首先要熟練相關基本命令的使用。其次,要具備此類系統的安裝與配置能力。更進一步的,要具備常見問題的處理能力。大家可以自己在電腦上裝虛擬機器(VMWare),重複安裝數十遍CentOS,Redhat,Ubuntu。然後在這些系統上,逼迫自己從搭建ftp、web、防火牆、負載平衡等基礎服務開始,逐漸完成複雜服務功能,試著自行搗鼓虛擬化、容器、分散部署、核心開發。總之,自己對類UNIX系統的使用,要跟Windows一樣精熟。這個技能也是用一輩子的。 █ 數通網絡 所有通訊專業的同學,都必須熟練數通網路的基本技能,至少要到HCIP的等級。基本的中小型企業網路的部署能力,肯定要具備。 VLAN劃分、網路設計、數通設備的常用資料修改操作,都是基礎。複雜路由協定(OSPF、BGP、ISIS),盡量掌握,至少要搞懂是怎麼回事,工作原理是怎樣的。學習數通,不是為了成為網工。很多情況下,在日常工作中,都會遇到IP組網相關的問題。具備基本的路由交換知識與技能,可以自行解決許多問題,節省大量的時間。數通知識也很可能牽扯到終端,還有系統。懂數通,有利於終端機和系統的相關工作最最基本的,自家的網路出問題了,或美女同事的網路出問題了,你要搞得定吧?不然你還好意思說自己是學通信的? █ 程式語言 雖然現在都說AI會取代程式設計師,但我還是覺得程式設計是一個理科生的基本技能。 雖然通訊不是電腦軟體專業,但務必請掌握至少一門程式語言(目前建議是Python,最容易上手)。 通訊崗位的基本工作並不會強制用到程式設計能力。但是,掌握程式語言,懂得如何編程,對深入理解通訊產品和雲端產品來說幫助很大。在和研發人員溝通的時候,你懂編程,能夠依照程式設計的邏輯去思考,會很有利(吵架增加贏的機率)。任何一項技能,都是打開一個新世界的窗戶。程式語言是軟體世界的窗戶,未來是軟體的天下。懂了吧?而且,程式設計是一個效率工具。會程式設計的話,可以自己寫一些工具,大幅提升工作效率。以前在開局和割接時,我們就很羨慕那些會編程的,有時候自己寫一些簡單的腳本,節省了大量的時間和精力。我們這些不會編程的,只能機械地手工勞動,或求助他人,效率差異很大。除了工程專案之外,在日常工作中,程式設計能力幫助也很大,可以提升日常工作效率(快速處理一些枯燥的工作),甚至參與工作流程和平台的完善。會程式設計的話,也可以搞很多副業,給自己創造收入(也大幅增加了跳槽機會)。 █ 拍照、繪圖、影音處理 拍照水準很重要,不是為了裝逼,主要是一個美學和創造美的能力的問題。這年頭,如果基本的照片都拍不好,關鍵時候就拖後腿,被人鄙視。繪圖也是,現在繪圖的場景很多,需要懂得如何進行構圖、配色,包括組網圖、架構圖。這個技能很常用。 不是特別鑽研的話,photoshop不要學了。現在很多P圖工具和海報設計工具,都是傻瓜化的,基本的目的都能夠實現。前面提到AI,這些也都可以交給AI做。音視頻處理,是重要的附加技能。雖然我們平時好像是搞通訊專業的工作,但越來越多接觸音視訊。有時候,領導者會有這類任務(宣傳)的需求,你要是擅長這類工作,會被領導者和同事另眼先看。AI生成是一個方面,傳統製作方式也需要掌握。 █ 專案管理 大學現在都不教,但是專案管理很重要。 學習專案管理,不是讓你真的去當專案經理。專案管理是一種思路,是教你怎樣把一件複雜的事情做好的能力。有專案管理思維的人,做事情考量會非常全面、非常科學。對一般人來說,屬於降維打擊了。產品思維也是一樣,建議自己找課程,認真學習。它也不是為了做產品,是為了讓你換位思考,為了讓你擺脫學生思維。 █ 財務知識 財務和金融知識是現代社會人必備的技能。但是,大學面對理工科的教育裡面,忽略了這部分的培養。從淺的來說,這個知識涉及你的財務報銷。從深的來說,你不理財,財不理你,現實生活中很多地方,都需要財務知識,懂一點,不容易被騙。你賺錢能力再強,不懂金融,可能還是會被割韭。還有一點,現在通訊和雲端牽涉到很多工程項目執行,也需要財務基礎知識。還有工程的概預算,這是許多理工科畢業生的盲點。很多年輕人畢業時不懂,工作時,都要現學,比較吃虧。提前學一些,會比較有幫助。對了,除了概預算之外,許多工程規範和施工流程的知識,建議也自學一下,不管是工程崗還是技術崗,這些在通訊實際工作中很有用。 █ 摜蛋建議學會,挺有用的,真的。現在職場對喝酒能力沒有以前那麼高,但是一些業務愛好能力的要求高了。例如漚蛋、羽球、跑步等。 █ 最後的話嗯,目前想到的暫時是上面這些。看上去寥寥幾條,其實內容已經很多了。上面這些知識和能力,真正掌握起來,是有很大難度的。考研升學或從事專業研究,對專業知識(高等數學、訊號與系統、數位訊號處理)的要求很高。我今天所提到的這些技能,主要針對的是一般就業人口。這些能力比專業知識更重要。說實話,除了少數研發崗位之外,大部分通訊專業年輕人進入工作崗位後,都不會接觸學校裡學的專業知識。有時候,掌握一些基礎的技能,反而對自己的職場發展有更大的幫助。
-
英偉達H20 GPU晶片關鍵知識
在當下科技發展浪潮中,英偉達GPU晶片已然成為眾多前沿領域的核心驅動力,而H20 GPU晶片憑藉其獨特優勢,在市場中嶄露頭角。接下來將從晶片架構、參數、友商競爭比較、產業應用和場景等多個維度,全方位呈現H20 GPU晶片的相關知識。一、晶片架構1.Hopper架構:H20採用英偉達先進的Hopper架構,基於台積電4N製程製造,擁有超過800億個電晶體,為其強大性能奠定硬體基礎。 2.創新技術支撐:Hopper架構具備五項突破性創新技術,為H20強大效能提供動力支持,全面提升晶片運算、處理能力。 3.第三代Tensor Core:支援FP32、FP16和INT8等多種精度計算,能根據不同應用場景靈活切換計算精度,顯著提升計算效率。 4.運算彈性:在深度學習訓練中,可依模型需求選擇適當精度運算,如在初期快速迭代模型時,可採用較低精度運算加速訓練。 5.第二代RT Core:專為即時光線追蹤技術設計,相較於前代在效能與效率上顯著提升,讓渲染效果更逼真。 6.光線追蹤應用:在3D遊戲開發、影視特效製作等領域,可快速渲染複雜光影效果,提升視覺體驗。 7.CUDA核心升級:擁有大量CUDA核心,相較於上一代產品,CUDA核心數量增加50%,大幅提升運算吞吐量。 8.平行計算優勢:科學計算中的分子動力學模擬、氣像模擬等場景,可平行處理大量數據,縮短計算時間。 9.多精度運算能力:能在高精度科學計算與低精度深度學習推理等不同場景中自由切換,滿足多樣化任務需求。 10.應用場景切換:從航太領域的軌道計算,到網路領域的影像辨識推理,都能憑藉多精度計算快速適應。二、參數亮點(一)儲存與頻寬11.大容量內存:擁有96GB的HBM3高效能內存,相比H100的80GB HBM3內存 ,容量更大,可存儲更多數據。 12.資料儲存優勢:處理大規模資料集時,如訓練超大型語言模型,能儲存更多中間結果,減少資料讀寫次數。 13.高頻寬傳輸:GPU顯存頻寬達到4.0TB/s,高於H100的3.4TB/s ,資料傳輸速度更快。 14.加速資料處理:在深度學習訓練中,能快速將資料傳輸至運算核心,減少等待時間,提升整體運算效率。 15.記憶體頻寬協同:大容量記憶體與高頻寬相互配合,為高效能運算提供堅實保障,確保資料的快速讀取與儲存。 (二)算力性能16.FP8算力:FP8性能為296TFLOPs,在一些對低精度計算要求高的場景,如特定的深度學習推理任務中表現出色。 17.FP8應用:在智慧安防攝影機的即時影像辨識中,可快速處理視訊串流數據,辨識目標物體。 18.FP16算力:FP16性能為148TFLOPs ,雖然相比H100的理論性能有差距,但在大語言模型推理方面有獨特優化。 19.大模型推理優勢:透過最佳化設計,在大語言模型推理時比H100快20%以上 ,可快速回應使用者提問。 20.多精度算力支援:同時支援TF32 Tensor Core(74TFLOPS)、FP32(44TFLOPS) 、FP64(1TFLOPS)等不同精度計算。 21.科學計算精度適配:在物理模擬、化學分子結構計算等科學計算場景中,依任務需求選擇適當精度,確保計算準確性。 22.算力綜合表現:多種精度算力協同,使H20能在不同領域、不同類型的計算任務中發揮作用。 23.異構運算支援:與CPU等其他運算單元配合,在複雜運算系統中實現異構運算,提升整體運算效能。 (三)其他參數24.功耗優勢:熱設計功耗400W,低於H100的700W ,功耗控制良好,降低資料中心散熱成本。 25.散熱成本降低:對於大規模資料中心,可減少散熱設備投入與營運成本,提升能源利用效率。 26.高速互聯功能:支援NVLink 900GB/s高速互聯功能,方便資料中心進行高密度部署與擴充。 27.叢集擴展:在建構大規模運算集群時,多塊H20晶片可透過NVLink高速互聯,實現高效能資料傳輸與協同工作。 28.闆卡形態與相容性:採用SXM闆卡形態,相容於英偉達8路HGX伺服器規格,方便在現有伺服器架構中部署。 29.MIG功能:具備7路MIG(多執行個體GPU)功能,可將GPU資源細粒度劃分,滿足不同使用者對運算資源的多元需求。 30.資源彈性分配:在雲端運算環境中,可依使用者任務大小與需求,靈活分配GPU資源,提高資源利用率。三、產品競爭比較(一)與英偉達H100比較31.核心算力差距:在核心算力上,H20與H100有較大差距,H20的FP16算力僅為H100的15%左右 。 32.記憶體頻寬優勢:但H20在記憶體容量和頻寬上更具優勢,96GB的HBM3記憶體以及4.0TB/s的頻寬高於H100。33.場景優勢互補:在大語言模型推理場景下,H20針對性的最佳化使其表現優於H100,而H100在大規模深度學習等場景更佔優勢。 34.適用任務著重:H20較適合垂類模型訓練、推理等對算力要求相對較低的任務,H100則適用於大型複雜模型訓練。 35.價格與成本考量:通常H20價格相對較低,對於成本敏感、對算力需求並非頂級的企業或項目,H20是較經濟的選擇。 (二)與華為昇騰910B對比36.性能對比:H20性能約為H100的15%-30% ,略超昇騰910B,但無法支援萬億級大模型訓練。 37.能源效率比優勢:昇騰910B在功耗和能源效率比方面優勢明顯,國產昇騰910B實算力達320TFLOPS,單卡功耗相對較低。 38.散熱方式:昇騰910B散熱方式更節能,如採用風冷即可滿足散熱需求,而H20部分集群可能需要液冷。 39.生態系差異:H20依賴英偉達成熟的CUDA生態,軟體資源豐富;昇騰910B建構了本土的CANN框架生態,也不斷改進。 40.應用場景著重:在對能耗要求高、對成本敏感且對模型規模要求不特別大的場景,昇騰910B有競爭力;而在對CUDA生態依賴度高的場景,H20更合適。 (三)市佔率與競爭態勢41.英偉達市場地位:英偉達憑藉長期的技術累積與生態優勢,在高效能運算與資料中心市場佔有重要地位。 42.H20市場角色:H20作為英偉達針對特定市場需求推出的產品,在滿足部分顧客算力需求的同時,也豐富了其產品線。…
-
IS-IS網路設計核心:選擇「扁平」還是「分層」?一次講透!
在大部分企業網路的環境中,IS-IS路由協定可能用得比較少。但隨著IPv6和SRv6的不斷普及,在許多企業和政府單位開始使用IS-IS路由協定來取代原有的OSPF路由協定。那麼在初期規劃網路的時候該如何設計和規劃路由相關資訊呢? 01IS-IS的Level相關概念Level-1負責區域內的路由。L1路由器只學習本區域的拓樸結構,且只維護一個Level-1的連結狀態資料庫。對於要去其他區域的封包,L1路由器會將其傳送給最近的Level-1-2路由器。 Level-2負責區域間的路由。L2路由器學習整個骨幹區域的拓樸結構,維護一個Level-2的連結狀態資料庫。Level-2路由器共同構成網路的骨幹(Backbone),負責在不同區域之間傳遞路由資訊。Level-1-2參與Level-1和Level-2路由。它維護兩個LSDB:L1 LSDB和L2 LSDB。它是區域通往外部世界的“網關”,負責將本區域的L1路由資訊洩漏到L2,並將L2的路由資訊(透過預設路由或路由洩露)傳遞到L1。現在我們知曉了這三種Level的意義,那麼在設計組網的時候該如何規劃呢? 02方案一:扁平化設計(單Level-2設計)在現代化資料中心,為了追求極致的簡單性和低延遲,扁平化的Level-2設計是絕對的主流。 最優路徑需求: 資料中心內伺服器之間的東西向流量要求任何時候都是最優路徑。如果分層,Leaf作為L1,它可能會把流量發給「最近」的Spine(L1-2),但這個Spine可能不是通往目的Leaf的最優路徑上的那一個。規模可控: 一個資料中心Pod內的裝置數量(通常是幾百台)對於現代交換器的硬體能力(CPU/記憶體)來說是完全可以承受的。簡化故障排查: 所有設備擁有相同的LSDB,網路拓樸一目了然,故障排除非常簡單。避免次優路徑: 從根本上消除了由分層設計帶來的次優路徑問題,無需引入複雜且容易出錯的路由外流配置。缺點擴充性差: 所有路由器的LSDB都會變得非常大,包含全網所有裝置和連結的資訊。這會導致SPF運算消耗更多CPU和記憶體資源,限製網路規模。故障域大: 任何地方的拓樸變化都會觸發全網路的SPF運算,影響網路收斂速度與平穩性。 03方案二:分層設計(多Level設計)設計想法: 將網路劃分為一個骨幹區域(L2)和多個非骨幹區域(L1)。骨幹區域由所有L2和L1-2路由器構成,非骨幹區域內部是L1和L1-2路由器。例如:Area 49.0001 (北京總部): 作為核心骨幹區域。Area 49.0002 (上海中心): 作為一個非骨幹區域。Area 49.0003 (深圳中心): 作為另一個非骨幹區域。 優點路由資訊隱藏: L1層級的路由器無需維護龐大的全網LSDB,只需知道本區域拓撲和一條指向L1-2的預設路由。這大大減少了LSDB大小和SPF計算範圍。故障範圍可控: 一個區域內部的拓樸變化,只會造成本區域內的L1路由器和骨幹區域的L2路由器進行SPF計算,其他L1區域不受影響。這提供了更好的網路穩定性。缺點可能會產生次優路徑: 這是分層設計最典型的代價。 L1區域內的路由器要去另一個區域時,預設行為是將流量傳送給最近的L1-2路由器(基於區域內開銷)。但這個「最近的出口」可能並不是通往目的區域的最優出口。設計與管理更為複雜: 需要事先規劃區域邊界、部署路由外流策略,增加了設計與維運的複雜度。 04總結IS-IS的層間Level設計相較之下比OSPF的選擇多,相較於OSPF的一些特殊區域而言,IS-IS對於路由管理做得比較好一些。當效能和簡化是首要目標,且網路規模可控時,選擇扁平化的單Level-2設計。當面對大規模網絡,需要極強的擴展性和穩定性時,必須採用分層化設計。此時,設計的核心在於規劃一個連續的骨幹區域、合理劃分L1區域、審慎使用路由外流來優化路徑,並確保L1-2路由器的穩定性。
-
UALink 1.0標準詳解
UALink 1.0標準詳解UALink 1.0是用於加速器間通訊的開放產業標準,旨在滿足AI和HPC應用對高頻寬、低延遲互連的需求。以下是其核心要點: 技術特點 高速傳輸:支援每通道200GT/s資料速率,實際訊號速率達212.5GT/s,四通道配置下雙向頻寬可達800Gbps。靈活擴展:可配置為單通道(X1)、雙通道(X2)或四通道(X4),適應不同規模的加速器集群。低延遲最佳化:透過碼字交織等技術降低FEC延遲,連結往返延遲<1μs。相容性:基於乙太網路實體層(802.3),重複使用現有基礎設施,降低部署成本。系統架構 Pod設計:支援連接最多1024個加速器,形成縱向擴展的運算單元簇(Pod)。虛擬Pod:可透過交換器連接埠分區實現多租戶隔離,每個Pod內加速器有唯一ID。管理機制:由Pod控制器統一管理,支援REST API、遙測和故障隔離等功能。協定堆疊 物理層:基於802.3乙太網路PHY,支援200G/400G/800G速率,採用64b/66b編碼。資料鏈路層:將64位元組Flit打包為640位元組Flit,支援CRC校驗和鏈路級重傳。事務層:實現位址壓縮和串流傳輸,協定效率可達95%以上。協定層:提供直接讀/寫/原子操作語意,保持記憶體一致性。安全性 UALinkSec:支援端對端加密和認證,保護資料機密性和完整性,防範中間人攻擊和租用戶資料外洩。可信任執行環境(TEE):由租用戶控制的TEE(如Intel TDX、AMD SEV)負責安全配置。生態與應用 聯盟支持:由阿里巴巴、AMD、蘋果、AWS等70多家企業共同推動,目標打破NVIDIA NVLink的壟斷。應用場景:適用於AI訓練和推理、HPC等場景,支援大規模加速器集群的建構。UALink 1.0透過開放標準和技術創新,為資料中心加速器互連提供了高效能、低成本的解決方案,可望重塑AI和HPC領域的互連生態。
-
在AI的幫助下,Google正將內部工作負載遷移至 Arm架構
谷歌近日宣布,它正將大約 3萬個生產型軟體包移植到 Arm 架構,並且計劃將它們全部轉換完畢,以便可以在自己的 Axion 矽片和 x86 處理器上運行。這家搜尋與廣告的網路巨頭在上週發表了題為「倉庫規模的指令集遷移」的預印論文中記錄了這一行動。 https://arxiv.org/pdf/2510.14928Google在一篇文章中透露說,其旗下重要應用程式 YouTube、Gmail 和 BigQuery 已經在 x86 和 Axion Arm CPU 上運行,有大約 30000 個應用程式將繼續運行。這兩份文件中都解釋了Google的遷移過程。 Google工程研究員 Parthasarathy Ranganathan 和開發者關係工程師 Wolff Dobson表示說,遷移過程始於一個假設,「我們將花時間研究架構差異,例如浮點漂移、並發性、平台特定運算符等內在函數以及性能。」「起初,我們遷移了一些關鍵工作,例如 F1、Spanner 和 Bigtable,採用了典型的軟體並每週開門的「在早期階段,我們發現了上述問題的證據,但遠沒有我們預期的那麼多。事實證明,現代編譯器和類似清理工具的工具已經解決了大部分意外問題。」谷歌開發團隊的負責人稱把大部分時間花在了以下工作上:修復因過度擬合現有 x86 伺服器而失敗的測試;更新複雜的構建與發布系統,通常針對「最古老」的生產系統配置針對最古老的系統解決問題;顯然,這是一個巨大的程式碼集合,谷歌可以將其現有的自動化工具投入使用 – 然後建立一個名為「CogniPort」的新 AI 工具來完成這些事情。 「CogniPort 會根據建置和測試錯誤進行操作,」Ranganathan 和 Dobson 這樣補充說。 「如果在流程的任何環節,Arm 庫、二進製文件或測試未能構建,或者測試因錯誤而失敗,代理就會介入並自動修復問題。作為第一步,我們已經使用 CogniPort 的藍圖編輯模式生成無法進行簡單更改的遷移提交。」谷歌發現,該AI代理在特定條件下的成功率約為 30%,並且在測試數據、特定平台方面的最佳條件修復。這並不有特別大的成功率,谷歌稱至少還有另外 70,000 個軟體包需要移植。該公司的目標是近快徹底完成這項工作,以便其著名的 Borg 叢集管理器(以Kubernetes 為基礎)能夠以有效利用 Arm 伺服器的方式分配公司內部工作負載。這樣做完,不僅會節省資金,因為谷歌聲稱其基於 Axion 的機器比…
-
小團隊的大安全:Cisco Meraki 開啟零信任辦公室新紀元
當時間與空間對我們的限制越來越低,遠距協作已成為企業辦公室的新常態。然而,對於眾多小型企業而言,如何在保障業務資料安全的同時,實現高效協同辦公,卻是一道不小的難題。傳統網路設備配置複雜、維護成本高、安全隱患頻出,這些問題如同懸在頭頂的達摩克利斯之劍,時刻威脅著企業的安全與發展。在這樣的背景下,Cisco Meraki 全雲管理的零信任解決方案應運而生。專為 50 人企業打造「極簡、安全、可視化」的混合辦公網絡,為小型企業提供了一體化的「極簡、安全、可視化」辦公室網絡方案,讓企業專注於業務創新,而不是為網絡操心。 Cisco Meraki 的極簡網絡 Cisco Meraki 的核心元件,包括 Meraki MR36 Wi-Fi 6 AP、Meraki MS130-8P 交換器和 Meraki MX68 安全網關,構成了一個高效率、安全的網路基礎。這些設備不僅提供了高速無線體驗、穩定有線連接,還支援 PoE,簡化了佈線。內建防火牆與 VPN,保障企業內外網路通訊安全,而雲端集中管理則讓網路設備管理變得簡單直覺。Cisco Meraki 的解決方案,不僅簡化了網路部署,也提升了安全性。透過 Meraki Dash-board,隨時隨地查看與管理網路設備,輕鬆抵禦常見攻擊,保護企業核心資料。 VPN 支援保障遠距辦公安全,員工在外也能像在辦公室一樣安心工作。分級授權(Advanced Security)則可依業務需求選擇合適的安全功能,靈活應對不同階段的企業發展。 多場景下的靈活應用 在不同的業務場景中,網路的需求千差萬別,但 Cisco Meraki 總是能提供靈活的解決方案:◎ 新創公司:快速建立 IT 基礎,協助業務起跑。 Meraki 的極簡部署讓新創公司能夠在短時間內建立起高效的網路環境,專注於業務發展。◎ 小型辦公室:保障視訊會議、文件傳輸和日常協作的穩定體驗。 Meraki 的高速無線和穩定有線連接,確保了小型辦公室的高效協作。◎ 專業顧問公司:強化資料與隱私保護,贏得顧客信任。 Meraki 的高階安全功能,為專業顧問公司提供了全方位的安全保障。 走向零信任的下一步 Cisco Meraki 已為小型企業打下了極簡與安全的網路基礎,但要真正實現零信任辦公,還需要邁向 SASE 架構:◎ 借助 Cisco ISE 統一有線、無線、VPN的接取策略;◎ 透過 Cisco Duo 實現多因子身分認證,杜絕憑證外洩風險;◎ 使用…
-
Agent三大痛點:知識庫+工作流程+Prompt工程
本文分為三個部分,介紹Agent三大痛點:知識庫+工作流程+Prompt工程。第一部分是知識庫,第二部分是工作流程,第三部分是Prompt工程。正文:一個好的AI Agent 的大概包括五大組件:大語言模型 (LLM)是基礎計算能力,日趨標準化;工具 (Tools)是能力擴展接口,透過MCP等協議日趨標準化;知識庫 (RAG)決定知識深度與專業性,減少模型“幻覺”,是企業知識的載體;工作流 (Workflow)決定知識深度與專業性,減少模型“幻覺”,是企業知識的載體;工作流 (Workflow) 決定知識深度設計精準的提示詞、編排可靠的工作流程,以及建構和維護高品質的知識庫,是設計AI Agent的三大痛點。 一、知識庫咱們先聊聊知識庫怎麼建。 1、知識收集 先說知識收集:你手邊的PDF、Word、PPT都算”知識原料”。例如你有個眼鏡產業的pdf報告,用minerU這種工具一掃,就能把裡面內容”扒”出來,變成系統能用的文字。就像你把一堆雜亂的書本整理成電子版,方便以後使用。 2、知識整理 知識整理是關鍵步驟:把內容切成小塊,就像切蛋糕一樣。可以按章節切,也可以按主題切,或是按固定字數切。切完後,給每塊加點”小標籤”,更方便找。例如”報告日期”、”關鍵字”,這樣以後找起來特別快。例如一份關於「專利糾紛」的報告,有以下小標籤: 標題:海外知識產權糾紛應對策略時間:2025年9月關鍵字:專利、法律反制、風險預警3、知識存儲 儲存方式有講究:現在主流是存成”向量”,就是把文字變成數字向量。這樣系統能理解意思,不是死記硬背關鍵字。例如你問”眼鏡產業趨勢”,系統能知道你問的是”趨勢”,而不僅僅是匹配”趨勢”這個詞。以下三種儲存方式,對應三種知識檢索方式: 例如問”怎麼處理客戶投訴”,語意找能定位到”客戶投訴處理指南”,關鍵字找能精準定位到”投訴處理流程”章節,關聯找還能發現”客戶服務最佳實踐”。 我傾向於採用混合儲存架構,即語義搜尋+圖搜索,對應就要使用向量資料庫(Milvus)和圖資料庫(Neo4j)。分為下面三個步驟: ① 資料模型設計:建立一個“人物關係網”+“特徵檔案庫”想像一下,你要整理一個超級詳細的社交網絡:Neo4j(圖數據庫)就像一張巨大的“關係網”,裡面記錄著每個人(節點)是誰、有什麼特點(屬性),以及他們之間是什麼關係(邊)。例如,小明是學生,喜歡編程,認識小紅。 Milvus(向量資料庫) 則像一個“特徵檔案庫”,不為每個人保存文字描述,而是儲存他們的“數字指紋”(向量)。例如,小明的特徵可能是 [0.25, 0.8, -0.1, …](電腦能看懂的數字串),代表他的興趣、能力等。 這樣做的好處:以後既能查關係(誰認識誰),也能透過「數字指紋」快速找相似的人(例如都喜歡程式設計的人)。 ② 向量化處理流程:為新資訊製作“數位指紋” 當有新資料(如一篇文章)進來時,系統會: a.預處理:先「拆解」文章,例如分成字或句子,去掉沒意義的字(如「的、了」),就像先把食材洗切好。b.轉成向量:用演算法(如 BERT)把這些內容變成電腦懂的「數位指紋」(向量)。這就像把一篇文章濃縮成一串特殊的密碼數字,其中相似的內容會有相似的密碼。c.同步儲存:把這個「數位指紋」存進 Milvus,同時把文章的關鍵資訊(如標題、作者)當作屬性存到 Neo4j。這樣兩邊數據能對應上。 ③ 索引優化:給資料庫加“快速查找目錄”就像書越厚越需要目錄,數據多了也要加「索引」來提速: a.Milvus 裡:用類似 HNSW 的演算法將「數位指紋」建立索引。想像成給所有指紋畫一張“地圖”,找相似指紋時不用一個個比對,直接按圖索驥,快很多。b.Neo4j 裡:給常用查詢條件加索引。例如常按「姓名」找人,就給姓名建索引,這樣找「小明」就不用翻遍整個資料庫。4、知識檢索 舉個例子你問“怎麼治療高血壓”,首先要快速找到醫學指南裡的關鍵字(比如“降壓藥”),還要理解“高血壓”和“心血管疾病”之間的關聯(比如並發症),甚至推薦“低鹽飲食”這種生活建議。 單純語意檢索可能漏掉「隱性關聯」(如高血壓和心臟病的關係),單純圖檢索可能找不到「新問題」(例如「新型降血壓藥」在圖裡沒存)。這就需要語義檢索(理解意思)和圖檢索(關聯關係)的組合拳,例如先用語義檢索找“高血壓治療方法”,再用圖表檢索找“這些方法的副作用”。具體做法:① 語意檢索:像「找相似人」一樣找答案把文字轉成「數字指紋」(向量),透過向量相似度找答案。例如「高血壓治療方法」和「心血管疾病治療」這兩個詞組,它們的向量會很接近,系統就能自動關聯。你問“怎麼處理客戶投訴”,語義檢索會匹配“客戶投訴處理指南”這類文檔,而不僅僅是死磕“投訴”這個詞。② 圖檢索:像「查人際關係網」一樣找答案把知識存成「關係網」(節點+邊)。例如「高血壓」是節點,它和「降血壓藥」「心臟病」「飲食建議」之間有邊(關係)。你問“高血壓有哪些併發症?”,圖檢索能直接跳到“心臟病”“腎臟病”這些關聯節點,還能推薦“低鹽飲食”這類關聯建議。③ 輔助檢索手段:動態權重與預計算a.根據問題類型調權重不是所有問題都適合用同一種檢索方式。例如關鍵字強相關的問題(「諾貝爾獎得主名單」),可以提升關鍵字權重到0.85,直接配對「名字」;又如開放性問題(如「AI的未來趨勢」),這時候就提升語意權重,找相似主題的分析報告。在技術實作上用意圖分析模型(例如判斷問題類型)即可,即時調整語意和關鍵字的權重比例。b.圖嵌入向量:讓圖表檢索“加速跑”圖檢索需要遍歷節點和邊,速度慢,我們可以透過預先計算每個節點的“向量指紋”,存在向量庫解決,這在上文中也提到過。舉個例子,在社交網絡中,先預計算每個人的興趣向量(比如[0.9, 0.2, 0.7]代表喜歡編程、電影、旅遊);接著找“和小明興趣相似的人”,直接比對向量,不用遍歷整個社交關係網。5、知識排序 排序策略主要包括: a.多階段重排序先用簡單演算法(如BM25)粗排,再用複雜模型(如交叉編碼器)精排b.上下文排序結合使用者歷史行為與即時對話內容,動態調整排序權重c.規則乾預排序根據業務規則(如安全攔截、時效性要求)進行最終篩選5、知識更新 知識庫就像一個有生命的“知識倉庫”,需要持續“保鮮”和“打理”,才能保證裡面的資訊不過時、不出錯。一個好的更新機制能讓這個倉庫自動或半自動地“補貨”和“清貨”,並減少人工折騰。 ① 自動偵測變化,觸發更新系統會像「哨兵」一樣盯著知識來源(例如文件、資料庫),一旦發現變動(如上傳了新文件、更新了日誌),就自動啟動處理流程。這就類似設定了自動提醒,檔案一改,後續的解析、儲存流程就跟著運作。 ②…
-
【軟體學習】非常好用的區域網路掃描軟體-存活主機
在網路維運的日常工作中,高效率的工具是解決網路問題的關鍵。今天要跟大家介紹一個實用的輕量級網路診斷工具 ——QuickPing,它能幫助我們快速偵測網路連線狀態,提升網路管理效率。 一、QuickPing 是什麼? QuickPing 是一款專注於網路診斷的工具,其核心原理是透過向指定伺服器或 IP 位址發送小型資料包(Ping),測量往返時間(RTT)和資料包遺失率,從而讓使用者清晰了解網路連線的穩定性和速度。它體積小巧,功能卻十分強大,是網路維運人員和對網路品質有要求的使用者的得力助手。二、QuickPing 的主要功能即時 Ping 測試:可快速向指定的 IP 位址或網域發送 Ping 請求,即時測量往返時間(RTT)和封包遺失率,讓用戶第一時間掌握網路連線狀態。多 IP 批次偵測:支援同時對多個 IP 位址或網域進行 Ping 測試。對於網路管理員來說,在排查機房網路故障時,可能需要同時偵測多個伺服器的網路連接,QuickPing 的這項功能可以大幅提高偵測效率,方便批量偵測多個目標的網路連接情況。歷史記錄檢視:它會詳細記錄每次 Ping 測試的結果。透過查看歷史數據,使用者可以分析網路連線在一段時間內的穩定性和變化趨勢。例如,網路維運人員可以透過查看一週內伺服器的 Ping 測試歷史記錄,判斷網路是否有週期性的波動問題。圖形化顯示:QuickPing 提供即時的圖形化介面,將 Ping 測試結果直觀呈現,包括 RTT 的波動和封包遺失情況。相較於枯燥的數字,圖形化展示讓使用者能更快速、更清楚地了解網路狀況。就像看股票走勢圖一樣,透過圖形能一眼看出網路的健康程度。自訂設定:允許使用者根據不同的測試需求,自訂 Ping 參數,如資料包大小、發送間隔、測試次數等。在不同的網路場景下,靈活調整參數可以取得更精確的測試結果警告通知:當網路連線出現問題時,QuickPing 可以設定警告通知,及時提醒使用者網路異常。對於伺服器監控場景,網路管理員可以設定當伺服器網路延遲過高或出現丟包時,QuickPing 透過郵件或簡訊通知相關人員,以便及時處理問題,確保伺服器的穩定運作。三、QuickPing 使用體驗軟體介面簡潔:開啟 QuickPing,會發現它的介面非常乾淨,總體積不到 1M,這意味著它不會佔用過多系統資源。 無論是在配置較低的辦公室電腦還是伺服器上,都能流暢運作。掃描速度快:選擇要 ping 的 IP 段後,直接點擊開始,速度令人驚嘆,幾秒後就能得到掃描結果。例如在掃描小型辦公室的區域網路 IP 段時,QuickPing 能在極短時間內完成掃描,大大節省了排除網路問題的時間。結果顯示直觀:掃描結果可以透過圖形化或列表兩種方式查看,非常直觀。綠色代表 IP 位址已被佔用,亮綠色代表本機。透過這種直覺的顏色標識,使用者可以快速了解區域網路內 IP 位址的使用情況。 設備資訊檢視便捷:在 QuickPing 中,也可以直接查看線上設備的各種資訊。這對機房管理員來說,在管理繁瑣的機房設備時,能快速取得設備的網路狀態等信息,十分實用。
-
2025年思科CCIE證書還值得考嗎?
資料來源:公眾號【網路技術乾貨圈】作者:圈圈ID:wljsghq今天想聊聊一個讓無數網路工程師又愛又恨的話題:思科CCIE(Cisco Certified Internetwork Expert)證書,2025年了,它還值得考嗎?作為曾經的“網絡界博士”,CCIE在全球網絡行業名聲赫赫,但近年來,國內華為HCIE崛起、雲技術井噴、AI網絡火爆,不少人開始質疑:這張證是不是過時了?數值不值得花大半年時間和幾萬塊去拼?我自己是CCIE持證人,2016年考試的路由交換方向,過程堪稱煉獄,8小時Lab實驗差點讓我懷疑人生。但拿到證後,職業確實開了掛:跳槽到外企,薪資翻倍,還參與了幾個跨國計畫。 這幾年,我也在觀察CCIE的含金量變化,結合朋友的經驗和2025年最新產業趨勢,今天就來全面扒一扒:CCIE的含金量、就業前景、優缺點,以及它是否還適合你。 CCIE是什麼?為什麼它曾是「王者證書」?先簡單介紹下CCIE。它是思科(Cisco)1993年推出的專家級認證,號稱網路工程師的頂峰。全球公認的IT領域最權威證書之一,持證者不到7萬人(截至2025年),稀缺性拉滿。考試分兩部分:2小時筆試(400美元,約2800元人民幣)及8小時Lab實驗(1600美元,約1.1萬人民幣),總成本加上培訓輕鬆破3萬。內容涵蓋網路設計、部署、最佳化、排障,深度和廣度都極高。方向有多個:企業基礎設施(EI)、安全、資料中心、無線、服務供應商等,最熱門是EI(原路由交換)。為啥它曾是「王者」?早年,思科設備幾乎壟斷全球網路市場,外商、國營企業、營運商都用。 CCIE持證人等於技術頂尖象徵,薪資動輒20k起,北上廣甚至50k+。我認識一個前輩,2008年拿CCIE,跳槽到銀行IT部,年薪直接80萬。那時候,CCIE是敲開大廠的「黃金鑰匙」。但2025年,情況變了。華為設備國內市佔率超50%,HCIE火熱;雲端運算讓網路架構變遷;AI和自動化減少傳統配置需求。 CCIE還香嗎?咱們從幾個維度分析。 CCIE在2025年的江湖地位先說結論:2025年,CCIE仍是網路領域的頂級證書,含金量高,但光環略有褪色。原因如下:全球認可度仍頂尖CCIE是國際標準,尤其在外企(IBM、Google、亞馬遜)和跨國專案中,思科設備仍是主流。持證人被視為能搞定複雜網路的專家。 2025年,思科更新考試內容,加入SD-WAN、自動化(Python/Ansible)、雲端集成,跟上潮流。知乎上有人總結:「CCIE代表你能從零設計企業級網絡,解決99%的問題。」我朋友小王,2023年拿CCIE EI,跳槽到一家美資雲服務商,負責AWS混合雲網絡,年薪60萬。國內華為佔優,但外企仍認思科。國內市場挑戰華為HCIE在國企、業者、銀行更吃香,因為設備普及。 CSDN文章提到:「華為設備市佔率高,HCIE性價比更高。」但思科在高階專案(如金融資料中心、國際化企業)仍有優勢。 2025年,SDN(軟體定義網路)和NFV(網路功能虛擬化)讓思科設備在雲端場景中保持競爭力。 CCIE持證人平均薪資在北上廣為30k-50k/月,HCIE略低但差距縮小.稀缺性與聲望CCIE考試難度極高,通過率約20%。 8小時Lab要求配置、排障、優化一個模擬企業網絡,考驗技術、邏輯和抗壓能力。全球唯一編號(終身保留)請持證人自備光環。圈裡流傳:「考CCIE不光是技術,還得有鋼鐵意志。」新技術的加持2025年,思科更新CCIE,融入AI驅動網路、零信任安全、5G邊緣運算。例如EI方向,新增Intent-Based Networking(意圖網路),適配智慧化趨勢。這讓CCIE保持前沿,但也意味著備考更難。總結:CCIE含金量依然高,國際市場尤其亮眼,但國內受華為衝擊,需結合職涯規劃選。 CCIE能帶你飛多高? CCIE的就業前景得看你想去哪裡。 2025年,網路工程師需求旺盛,數位轉型、5G、雲端讓網路架構更複雜。根據CSDN,CCIE在以下場景最吃香:外企與國際化專案思科設備在外企及海外專案占主導,像AWS、微軟Azure的骨幹網路常有思科身影。 CCIE持證人可做高級網路工程師、架構師。案例:我一同事拿CCIE Security,去了新加坡一家顧問公司,年薪折合人民幣100萬+。高階產業金融、能源、航空等產業需要高可靠網絡,思科設備常見。 CCIE在這些領域是「硬通貨」。知乎網友分享:「銀行資料中心招人,CCIE直接加分。」管理與轉型跳板CCIE不僅是技術證,還能轉管理或售前。搭配PMP(專案管理)或CISSP(安全性),可做網路架構師或CTO。我認識一隻大牛,CCIE+10年經驗,現在是某雲廠商技術總監,年薪200萬。薪資水平北上廣:CCIE起薪30k-50k,資深80k+。二線城市:20k-35k。海外:年薪10萬-20萬美元不等。是不是有點活在夢裡的感覺。對照HCIE:國內HCIE薪資略低5%-10%,但國企更認。挑戰與局限國內華為設備主導,CCIE在中小企業的機會較少。雲端運算讓傳統網路配置需求下降,工程師需學雲(AWS、Azure)。對比HCIE:該選誰?方面CCIEHCIE含金量全球頂級,外企認可國內高,國企運營商首選費用3萬-5萬2萬-4萬難度Lab極難,通過率20%筆試+面試+Lab,稍易就業外企、金融、數據中心國企、運營商、雲廠商前景國際化強,預計國內外廣,設備推薦:想獲得國內外產,兩者不衝突,可雙修。
Got any book recommendations?