透過 NVIDIA RTX PRO 6000 Blackwell GPU 加速的先進藍圖、視覺語言模型和合成資料生成擴充功能,提升各種環境的生產力與安全性。
物理 AI 正逐漸成為全球智慧城市、設施與工業製程的基礎。

NVIDIA 目前正利用基於物理 AI 的感知與推理技術,提升全球營運效能,合作的公司包括 Accenture、Avathon、Belden、DeepHow、Milestone Systems 與 Telit Cinterion。
透過不斷循環模擬、訓練與部署物理 AI的過程,提供各種尖端的工業自動化功能,讓城市與基礎建設更安全、更智慧也更高效。
舉例而言,物理 AI 應用可自動化執行工作人員原具潛在危險性的任務,例如操作重型機械。此外,物理 AI 還能改善交通運輸服務與公共安全,以及偵測工廠內有瑕疵的產品等。
這方面的需求比以往任何時候都更為迫切,數字正說明了這一切:

有能力感知、推理及採取行動的基礎建設,仰賴影片感測器與最新的視覺 AI 功能。NVIDIA Metropolis 平台簡化了從邊緣到雲端影片分析 AI 代理與服務的開發、部署及擴充過程,有助於開發者更迅速將視覺感知技術整合至設施,提高各種環境的生產力與安全性。
以下是五家推進物理 AI 發展的領先公司,以及 NVIDIA 於今日 SIGGRAPH 電腦繪圖大會上發表,讓這類技術得以實現的五項關鍵 NVIDIA Metropolis 更新。
五家推進物理 AI 發展的企業
全球專業服務公司 Accenture 正與領先的完整連接解決方案供應商 Belden 合作,透過打造可設置在工廠內大型機器人周圍的智慧型虛擬圍欄,防止與人類操作者發生事故,提高工作人員的安全。

影像由Accenture 和 Belden提供
智慧型虛擬圍欄是一種物理 AI 安全系統,採用 OpenUSD 技術的數位孿生和物理型模擬技術,為複雜的工業環境建模。這套系統採用電腦視覺技術的地圖建構與 3D 空間智慧,能靈活因應新式廠房環境中,人機互動的高變動性與多元情境。
Accenture 運用 NVIDIA Omniverse 平台和 Metropolis,打造及模擬這類智慧圍欄。Accenture 利用 Omniverse 打造了有機械手臂和作業人員移動的數位孿生場景。該公司先利用 Metropolis 訓練 AI 模型,再利用影片擷取技術與 NVIDIA DeepStream 軟體開發套件(SDK)的即時推理功能,將模型部署於邊緣。
Avathon 是工業自動化平台供應商,運用 NVIDIA Metropolis 適用於影片搜尋與摘要(VSS) 的 NVIDIA Blueprint,為製造和能源設施提供即時洞察,提高營運效率並加強工作人員安全。
印度燃油與交通領域的領導業者 Reliance British Petroleum Mobility Limited 在建設加油站期間採用了 Avathon 視訊智慧產品,以達成更高的安全合規標準、降低安全違規事件,並透過節省數千工時來提升生產力。
DeepHow 為製造業及其他產業的員工開發了「Smart Know-How Companion」。這款輔助工具採用 Metropolis VSS 藍圖,將主要工作流程轉換為精簡的多語言影片和數位指引,使職前訓練流程、安全性和廠房操作員的效率都得以改善。
飲料公司 Anheuser-Busch InBev 面對技能升級需求,以及資深員工紛紛退休,選擇採用 DeepHow 平台將標準作業程序轉換為簡單易懂的視覺化指引。這個平台將職前訓練時間縮短 80%,不僅大幅提高訓練的一致性,更改善了員工長期的學習成效。
Milestone Systems提供全球最大規模、專門用於管理複雜工業與城市部署中的 IP 影音感測器資料的平台,正透過旗下平台 Project Hafnia ,打造全球最大的真實世界電腦視覺資料庫。該平台功能豐富,能讓物理 AI 開發者取用自訂的視覺語言模型( VLM)。Milestone Systems 運用 NVIDIA NeMo Curator,打造了專為智慧交通運輸系統調整的視覺語言模型,可用於影片搜尋與摘要藍圖,協助開發能更妥善管理市區道路的 AI 代理。此外,Milestone Systems 還打算將全新的開放式可自訂 NVIDIA Cosmos Reason視覺語言模型用於物理 AI。
物聯網公司 Telit Cinterion 已將 NVIDIA TAO Toolkit 6 整合至旗下的 AI 視覺檢查平台。該平台使用 FoundationPose 這類視覺基礎模型搭配 NVIDIA 模型,不僅支援多模態 AI,更提供了高效能的推理能力。TAO 將低程式碼 AI 功能整合至 Telit 平台,讓製造商能為偵測瑕疵和品質控制,快速開發及部署準確的自訂 AI 模型。
NVIDIA Metropolis 的五項物理 AI 更新
NVIDIA Metropolis 的關鍵更新,強化了開發者更輕鬆快速打造物理 AI 應用的能力:
Cosmos Reason VLM
最新版 Cosmos Reason 是 NVIDIA 適用於物理 AI 的先進、開放、可自訂、並擁有70 億個參數的視覺語言模型,可支援 Metropolis 應用案例中的情境化影片理解與時間事件推理。其精巧的大小便於從邊緣到雲端的部署,非常適合自動化交通監控、公共安全、視覺檢測與智慧決策。
VSS Blueprint 2.4
VSS 2.4 可透過Cosmos Reason輕鬆快速擴充現有的視覺 AI 應用,為智慧型基礎設施提供強大的新功能。該藍圖的應用程式介面進一步擴充,讓使用者可更直接且彈性選擇特定的 VSS 元件與功能,以生成式 AI 強化電腦視覺流程。
全新的視覺基礎模型
NVIDIA TAO Toolkit 包含一套全新的視覺基礎模型,以及整合先進的微調方法、自我監督式學習與知識蒸餾功能,可最佳化在邊緣與雲端環境部署物理 AI 解決方案的作業。NVIDIA DeepStream SDK 包含全新的 Inference Builder,可順暢整合 TAO 6模型。
Advex AI、Instrumental AI 與 Spingence 等世界各地的公司,正運用這些新模型和 NVIDIA TAO,打造能將工業營運最佳化並提高效率的智慧解決方案。
NVIDIA Isaac Sim 擴充套件
NVIDIA Isaac Sim 參考應用的全新擴充套件,有助於解決視覺 AI 開發常見的難題,例如標籤資料有限與罕見的極端案例。這些工具模擬人機互動、生成豐富的物件偵測資料集,並且為訓練視覺語言模型建立以事件為基礎的場景以及圖像與說明文字配對,加快開發速度,並且提高 AI 在實際應用情境的效能。
更豐富的硬體支援
這些 Metropolis 元件現在可在 NVIDIA RTX PRO 6000 Blackwell GPU、NVIDIA DGX Spark 桌上型超級電腦,以及物理 AI 與人形機器人技術適用的 NVIDIA Jetson Thor 平台執行,讓使用者能夠在邊緣到雲端的環境開發及部署。
Cosmos Reason 1 與NVIDIA TAO 6.0 現已開放下載。立即註冊,即可在 VSS 2.4、Cosmos Reason VLM 微調更新與 NVIDIA DeepStream 8.0 推出時收到通知。