IT之家7 月 30 日消息,英偉達(dá)官網(wǎng)公告顯示,亞馬遜云正式推出了由英偉達(dá) H100 Tensor Core GPU 驅(qū)動的新的 Amazon Elastic Compute Cloud(EC2)P5 實例。
據(jù)介紹,該服務(wù)允許用戶通過瀏覽器輕松擴展生成式 AI、高性能計算(HPC)和其他應(yīng)用。
NVIDIA H100 GPU 的一個重要特點是其對 Transformer 的優(yōu)化,這是許多最新的先進(jìn) AI 應(yīng)用所使用的關(guān)鍵技術(shù),可確保 H100 在這些應(yīng)用中提供更高的性能和效率。
IT之家查詢發(fā)現(xiàn),雖然 AWS 尚未就集成 AMD MI300 芯片到其云服務(wù)中作出任何公開承諾,但亞馬遜彈性計算云副總裁 Dave Brown 證實 AWS 正在積極考慮這一方案。
英偉達(dá)表示,開發(fā)人員和研究人員幾乎每天都在借助大型語言模型 (LLMs) 發(fā)掘 AI 的新應(yīng)用,而將這些新用例推向市場需要加速計算的效率。
NVIDIA H100 GPU 通過架構(gòu)創(chuàng)新提供超級計算級性能,包括第四代 Tensor Cores、用于加速 LLMs 的新 Transformer 引擎以及最新的 NVLink 技術(shù),可以帶極其可觀的性能。
據(jù)介紹,EC2 P5 實例非常適合訓(xùn)練和運行復(fù)雜 LLMs 和計算機視覺模型的推理。這些神經(jīng)網(wǎng)絡(luò)驅(qū)動著最復(fù)雜和計算密集型的生成式人工智能應(yīng)用程序,包括問答、代碼生成、視頻和圖像生成、語音識別等