What is Weco?
建構並優化機器學習管線通常涉及大量的、手動的迭代。尋找效能最佳的程式碼需要在實驗、調整和評估上投入大量時間。Weco 推出了一種系統化的方法,利用 AI 代理來自動化這個複雜的流程。在 AIDE (Agentic Iterative Design Engine,代理迭代設計引擎) 的驅動下,Weco 就像您的 AI 研究工程師,將您的評估基準轉化為一個自我改進的系統。它可以自主運行實驗,根據您指定的指標來改進您的程式碼,從而發現效能更高的解決方案。
AIDE 驅動的主要功能
🤖 自動化實驗: AIDE 有系統地產生並測試大量的程式碼變體,適用於 GPU 核心優化、模型開發和提示工程等任務,通常一夜之間可以運行數百個實驗。這讓您無需手動干預,即可探索廣闊的解決方案空間。
📊 指標驅動的優化: 您定義成功的標準——準確性、速度、成本或任何自訂指標。AIDE 迭代地改進程式碼,只專注於根據您的特定評估管線來提高效能,直到指標顯示出更好的解決方案。這種以評估為驅動的迴圈,在效能上明顯優於一次性的程式碼生成,正如 OpenAI 的 MLE-Bench 等基準測試所顯示的那樣,AIDE 獲得的獎牌數量是排名第二的自主代理的 4 倍。
🧠 廣泛的程式碼搜尋與領域理解: 與傳統的 AutoML 僅限於特定模型類別不同,AIDE 利用 LLM 來搜尋整個程式碼空間。它可以跨多個領域(NLP、CV、表格)應用方法,並結合金融或生物醫學等專業領域的背景知識,經常發現人類可能錯過的新方法(已在 METR 的 RE-Bench 中得到驗證)。
💡 自然語言引導: 雖然 AIDE 是自主運作的,但您可以使用自然語言提示來注入您的領域專業知識或特定需求,從而引導代理的搜尋過程,而無需進行複雜的超參數調整。
🛡️ 靈活且安全的執行: 產生的程式碼在由 Weco 管理的安全沙盒雲環境中運行,自動配置最佳的硬體(CPU、GPU)。對於有資料主權需求的情況,可以使用本地執行選項,讓您完全掌控。您保留對所有產生程式碼的完整智慧財產權。
⚙️ 語言和框架無關: 優化跨多種語言和框架的程式碼,包括 Python、PyTorch、TensorFlow,並針對從 CPU 和 GPU 到 TPU 和 Apple Silicon 的各種硬體。
實際應用案例
優化現有模型效能: 您有一個用於物件偵測的 PyTorch 模型,但延遲對於生產環境來說太高。您向 Weco 提供您的模型程式碼、評估資料集,並指定指標(例如,最大化 mAP,同時保持延遲低於 50 毫秒)。AIDE 會迭代模型架構、推論程式碼,並可能使用量化技術,從而交付符合您效能目標的優化程式碼。
加速自訂運算核心: 您的團隊依賴於一個自訂的 CUDA 或 Triton 核心來進行關鍵的預處理步驟,但它正成為瓶頸。使用 Weco,您可以提供核心程式碼和一個衡量其執行速度的基準。AIDE 會探索替代的實作方式、記憶體存取模式和平行化策略,旨在顯著縮短運行時間,就像它在 METR 的 RE-Bench 上超越人類專家進行 Triton 核心優化一樣。
開發高效能的表格模型: 開始一個新專案,使用大型表格資料集來預測客戶流失?向 AIDE 提供資料綱要描述和目標指標(例如,F1 分數)。AIDE 會產生端到端的管線,包括特徵工程(如果引導,可能會建立特定領域的指標)、模型選擇、訓練和評估程式碼,自主迭代以尋找效能最佳的解決方案,通常在幾分鐘內交付初始版本。
為何選擇 Weco?
Weco 提供了一種獨特的 ML 開發方法,透過自動化關鍵但通常繁瑣的優化週期。其優勢在於:
以使用者為中心的指標: 優化完全由您的資料、您的評估管線和您對成功的定義所驅動。
經驗證的有效性: AIDE 的能力已通過領先的基準測試(OpenAI MLE-Bench、METR RE-Bench)以及前沿 AI 實驗室和研究出版物的採用(例如,Sakana AI 的 AI Scientist-v2)得到驗證。它證明了以運算資源來換取卓越的程式碼品質。
靈活性: 適用於各種程式語言、ML 框架和硬體目標。
可擴展性: 旨在處理長時間的複雜優化任務,不斷改進解決方案。
Weco 使您和您的團隊能夠專注於更高層次的策略和問題解決,同時 AIDE 處理密集型的、指標驅動的實驗,這些實驗對於突破 ML 管線的界限至關重要。





