Phi-3 Mini-128K-Instruct ONNX

(Be the first to comment)
Phi-3 Mini 是一款輕量級、最先進的開放模型,建構於 Phi-2 使用的資料集上,包含合成資料和經過篩選的網站,專注於極高品質、推論密集的資料。0
訪問

What is Phi-3 Mini-128K-Instruct ONNX?

微軟的 Phi-3 Mini-128K-Instruct ONNX 模型代表開放原始碼 AI 技術的尖端進展。這些模型專為透過 ONNX Runtime 提升推理能力,在包括 CPU、GPU 和行動裝置等各種平台和裝置上提供最佳化效能。Phi-3 Mini 模型特別是 128K 變體,專為高品質、推理密集型資料處理而設計,使其成為需要堅固指令遵循和安全措施的複雜任務的理想選擇。

主要特色:

  1. 最佳化效能:這些模型採用 ONNX 格式,可確保在從伺服器到手機等各種裝置上使用 ONNX Runtime 時能有效率地執行。此最佳化包括對 DirectML 的支援,可在配備 AMD、Intel 和 NVIDIA GPU 的 Windows 裝置上進行硬體加速。

  2. 跨平台相容性:透過支援 Windows、Linux 和 Mac 桌上型電腦以及行動裝置 CPU,Phi-3 Mini-128K-Instruct ONNX 模型提供廣泛的跨平台相容性,使其適用於各種應用。

  3. 進階量化技術:這些模型採用 Activation Aware Quantization (AWQ),有選擇地將最不重要的 99% 權重量化以維持精準度,與傳統量化方法相比,造成的精準度損失極小。

  4. 易於整合:新的 ONNX Runtime Generate() API 簡化將 Phi-3 Mini 模型整合到應用程式的流程,讓開發人員能輕鬆地將大型語言模型 (LLM) 納入其軟體中。

  5. 全面的文件和支援:提供詳細的文件和社群支援,包括使用模型的入門說明,確保使用者的開發過程順利。

用例:

  • 對話式 AI:Phi-3 Mini-128K-Instruct ONNX 模型非常適合聊天機器人和虛擬助理,可以處理複雜的查詢,並維持連貫、情境感知的對話。

  • 文字產生:這些模型擅長產生高品質、與情境相關的文字,適用於內容建立、摘要等。

  • 自然語言處理 (NLP):這些模型非常適合各種 NLP 任務,包括語言翻譯、情緒分析和資訊萃取。

目標受眾:

  • AI 開發人員和研究人員:非常適合從事 NLP 專案、AI 研究和開發智慧應用程式的人員。

  • 企業:適合尋求將進階 AI 功能整合到其產品或服務中的企業,特別是在客服和內容產生等領域。

  • 教育機構:有利於學術研究和教授進階 AI 和機器學習概念。

硬體需求:

  • 最低配置:DirectX 12 相容 GPU,Windows 至少具備 4GB 總 RAM,CUDA 的 SMs >= 70(例如 V100 或更新版本)。

  • 測試過的硬體:包括 RTX 4090 (DirectML)、1 個 A100 80GB GPU、標準 F64s v2(64 個 vcpu,128 GiB 記憶體)和 Samsung Galaxy S21。

效能指標:

  • 與 PyTorch 相比,這些模型在 ONNX Runtime 中展現出優異的效能,FP16 CUDA 的效能快達 5 倍,INT4 CUDA 快達 9 倍。

結論:

微軟的 Phi-3 Mini-128K-Instruct ONNX 模型代表 AI 模型最佳化和部署的重大進步。其多功能性、易於整合和高效能使其成為從對話式 AI 到複雜 NLP 任務等廣泛應用程式的絕佳選擇。藉由支援多個平台和進階量化技術,這些模型為 AI 領域的開發人員和企業提供強大且靈活的解決方案。


More information on Phi-3 Mini-128K-Instruct ONNX

Launched
Pricing Model
Free
Starting Price
Global Rank
Follow
Month Visit
<5k
Tech used
Phi-3 Mini-128K-Instruct ONNX was manually vetted by our editorial team and was first featured on 2024-04-25.
Aitoolnet Featured banner
Related Searches

Phi-3 Mini-128K-Instruct ONNX 替代方案

更多 替代方案
  1. ONNX Runtime:隨處皆能,加速執行 ML 模型。加速跨平台推論與訓練。支援 PyTorch、TensorFlow 等框架!

  2. Phi-2 是研究人員探索不同領域的理想模型,例如機制可解釋性、安全性改進和微調實驗。

  3. 探索 Local AI Playground,一款免費離線 AI 實驗應用程式。其功能包含 CPU 推論、模型管理等等。

  4. MiniCPM3-4B 是 MiniCPM 系列的第三代。MiniCPM3-4B 的整體效能超越了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,與許多近期 7B~9B 模型相當。

  5. Gemma 3 270M:輕巧高效能的 AI,專為特定任務打造。可微調以實現精準指令遵循,並支援低成本的裝置端部署。