英偉達發布會:黃仁勳曬”AI核彈“
整合在Kubernets上的壹攬子軟件系統
這壹切都建立在Kubernetes這壹容器化應用程序之上。NVIDIA通過Kubernetes創建了壹個單壹的架構,可以運行所有這些軟件。Nim作為預構建的容器(containers),開發人員可以在其中直接選擇模型來構建利用自己數據的人工智能應用程序。在容器中配備了適用於語言和藥物發現等人工智能領域的行業標准應用程序編程接口以適應各類專有模型。
英偉達在博客文章中表示:“NIM針對每個模型和硬件設置利用優化的推理引擎,在加速基礎設施上提供最佳的延遲和吞吐量。”“除了支持優化的社區模型之外,開發人員還可以通過使用永遠不會離開數據中心邊界的專有數據源來調整和微調模型,從而獲得更高的准確性和性能。”
在模型支持方面,NIM微服務的可選項也很多。它支持Nvidia自己的模型合作庫,來自AI21Labs,Cohere等合作伙伴的模型,以及來自Meta、HuggingFace、StabilityAI和Google的開源模型。同時客戶可以通過NvidiaAIEnterprise平台以及MicrosoftAzureAI、GoogleCloudVertexAI、GoogleKubernetesEngine和AmazonSageMaker訪問NIM微服務,並與包括LangChain、LlamaIndex和Deepset在內的AI框架集成。這基本上就等於對所有市面上主流模型都完成了覆蓋。
在Nim的搭建過程中,利用NvidiaNeMoRetriever技術,公司的專有數據都可以被集成到這個微服務裡以供使用。最終用戶會得到壹個個NVIDIANeMo,這就是針對每個公司的專有Copilit。這個專有的NeMo會用對話機器人的形式幫助你檢索公司數據,如PPT,提供相關領域的技術支持。

NvidiaNeMoRetriever與微服務的結合
在發布會上,黃仁勳就展示了基於英偉達數據(Event)和芯片行業信息形成的NvidiaChipNeMo,它構建在開源的Llama2模型之上。利用英偉達的專有數據,它可以回答只有英偉達公司內部使用的CTL實驗細節問題。

這些NeMo還可以跨公司共用,也就是這套系統可以被視為工業大模型的GPTStore,行業公司可以使用其他公司或英偉達提供的行業基礎NeMo添加自己的數據即可獲得專有大模型。為此,英偉達還特意上線了ai.nvidia.com去承載這些NeMO。
這壹微服務使得傳統企業AI轉型變得極為易得,不論是構築專有模型,還是直接通過模型連接企業私有數據都變得快速方便。黃仁勳表示“成熟的企業平台坐擁數據金礦,他們掌握了大量可以轉化為副駕駛的數據,當你准備好運行這些人工智能聊天機器人時,你將需要壹個人工智能鑄造廠”。NIM正是這樣壹個鑄造廠。它幫助構建企業AI轉型的Copilot級產品,可以被視為公司AI化所需的基石。
[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
這壹切都建立在Kubernetes這壹容器化應用程序之上。NVIDIA通過Kubernetes創建了壹個單壹的架構,可以運行所有這些軟件。Nim作為預構建的容器(containers),開發人員可以在其中直接選擇模型來構建利用自己數據的人工智能應用程序。在容器中配備了適用於語言和藥物發現等人工智能領域的行業標准應用程序編程接口以適應各類專有模型。
英偉達在博客文章中表示:“NIM針對每個模型和硬件設置利用優化的推理引擎,在加速基礎設施上提供最佳的延遲和吞吐量。”“除了支持優化的社區模型之外,開發人員還可以通過使用永遠不會離開數據中心邊界的專有數據源來調整和微調模型,從而獲得更高的准確性和性能。”
在模型支持方面,NIM微服務的可選項也很多。它支持Nvidia自己的模型合作庫,來自AI21Labs,Cohere等合作伙伴的模型,以及來自Meta、HuggingFace、StabilityAI和Google的開源模型。同時客戶可以通過NvidiaAIEnterprise平台以及MicrosoftAzureAI、GoogleCloudVertexAI、GoogleKubernetesEngine和AmazonSageMaker訪問NIM微服務,並與包括LangChain、LlamaIndex和Deepset在內的AI框架集成。這基本上就等於對所有市面上主流模型都完成了覆蓋。
在Nim的搭建過程中,利用NvidiaNeMoRetriever技術,公司的專有數據都可以被集成到這個微服務裡以供使用。最終用戶會得到壹個個NVIDIANeMo,這就是針對每個公司的專有Copilit。這個專有的NeMo會用對話機器人的形式幫助你檢索公司數據,如PPT,提供相關領域的技術支持。

NvidiaNeMoRetriever與微服務的結合
在發布會上,黃仁勳就展示了基於英偉達數據(Event)和芯片行業信息形成的NvidiaChipNeMo,它構建在開源的Llama2模型之上。利用英偉達的專有數據,它可以回答只有英偉達公司內部使用的CTL實驗細節問題。

這些NeMo還可以跨公司共用,也就是這套系統可以被視為工業大模型的GPTStore,行業公司可以使用其他公司或英偉達提供的行業基礎NeMo添加自己的數據即可獲得專有大模型。為此,英偉達還特意上線了ai.nvidia.com去承載這些NeMO。
這壹微服務使得傳統企業AI轉型變得極為易得,不論是構築專有模型,還是直接通過模型連接企業私有數據都變得快速方便。黃仁勳表示“成熟的企業平台坐擁數據金礦,他們掌握了大量可以轉化為副駕駛的數據,當你准備好運行這些人工智能聊天機器人時,你將需要壹個人工智能鑄造廠”。NIM正是這樣壹個鑄造廠。它幫助構建企業AI轉型的Copilot級產品,可以被視為公司AI化所需的基石。
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
推薦:
英偉達發布會:黃仁勳曬”AI核彈“