在人工智能和智能機器新時代,深度學習正以與曆史上其他計算模型截然不同的方式改變着世界。互動語音、視覺搜索和視頻推薦是我們日常使用的衆多人工智能服務中的幾項。準确性和響應速度是決定用戶是否采用這些服務的關鍵因素。随着深度學習模型的準确性和複雜性越來越高,CPU 已經無法再提供響應靈敏的用戶體驗。NVIDIA Tesla P4 采用革命性的 NVIDIA Pascal™ 架構,專爲處理深度學習工作負載,啓用智能響應人工智能服務的外擴型服務器而打造,可顯著提升其運作效率。該顯卡可将任何超大規模基礎架構的延遲降低 15 倍,并可以提供比 CPU 高 60 倍的驚人能效。這使得我們開發了許多新的人工智能服務,這些服務在過去由于延遲限制而無法實現。

産品特點
通過實時推理提供快速響應的用戶體驗
響應速度是決定用戶是否使用互動語音、視覺搜索和視頻推薦等服務的關鍵因素。随着模型的準确性和複雜性越來越高,CPU 已經無法再提供響應靈敏的用戶體驗。NVIDIA Tesla P4 借助 INT8 運算能力提供高達 22 TOPS 的推理性能,可将延遲降低 15 倍。
爲低功耗外擴型服務器帶來更高效率
NVIDIA Tesla P4 憑借小巧的外形和 50W/75W 的功耗爲經過密度優化的外擴型服務器加速。該顯卡還可爲深度學習推理工作負載提供比 CPU 高 60 倍的驚人能效,滿足超大規模客戶對人工智能應用程序飛速增長的需求。
借助解碼引擎開發新的人工智能型視頻服務
NVIDIA Tesla P4 配備硬件加速解碼引擎,能對多達 35 路高清視頻流進行實時轉碼和推理,該解碼引擎可與進行推理的 GPU 并行運作。将深度學習集成到視頻管線後,客戶可以向用戶提供之前無法實現的智能創新型視頻服務。
使用 TENSORRT 和 DEEPSTREAM SDK 加快部署速度
NVIDIA Tesla P4 是爲優化部署到生産環境的深度學習模型而創建的庫。它通常以 32 位或 16 位數據的形式獲取接受訓練的神經網絡,并針對降低精度的 INT8 運算能力優化這些網絡。NVIDIA DeepStream SDK 利用 NVIDIA Pascal™ GPU 的強大功能,可以同時解碼和分析視頻流。
規格參數
NVIDIA® Tesla® P4規格 |
GPU 架構 | NVIDIA Pascal |
單精度浮點運算能力 | 5.5 TFLOPS |
整數運算能力 (INT8) | 22 TOPS(萬億次運算/秒) |
GPU 内存 | 8 GB |
内存帶寬 | 192GB/秒 |
系統接口 | PCI Express 半高外形 |
功耗 | 75W |
ECC保護 | 是 |
已使用頁面遷移引擎提升編程能力 | 是 |
針對數據中心部署優化服務器 | 是 |
硬件加速視頻引擎 | 1個解碼引擎,2個編碼引擎 |