StarCoder

9 comments
StarCoder 和 StarCoderBase 是用於程式碼 (程式碼 LLM) 的大型語言模型,訓練時採用寬鬆的許可0
訪問

What is StarCoder?

StarCoderBase和StarCoder是大型語言模型(Code LLMs),是使用來自GitHub的許可的許可數據進行訓練。這些數據包括來自80多種編程語言、Git提交和問題、Jupyter筆記本以及Git提交的數據。

我們為1兆標記訓練了一個15B參數模型,與LLaMA類似。

我們為35B Python標記細化了StarCoderBase。結果是一個我們稱之為StarCoder的新模型。

StarCoderBase是一個在流行的編程基準測試中勝過其他開放代碼LLMs的模型。它還能夠匹配或超越像OpenAI的code-cushman001、最初為早期版本GitHub Copilot提供動力的Codex模型等封閉模型。StarCoder模型能夠處理超過8,000個標記的上下文長度比其他任何開放LLM都長。這允許各種有趣的應用。通過用一系列對話提示StarCoder模型,我們讓它們像技術助手一樣工作。


More information on StarCoder

Launched
2023
Pricing Model
Free
Starting Price
Global Rank
Country
Month Visit
<5k
Tech used
Amazon AWS CloudFront,cdnjs,Google Fonts,KaTeX,Gzip,OpenGraph,RSS,Stripe
StarCoder was manually vetted by our editorial team and was first featured on September 4th 2024.
Aitoolnet Featured banner

StarCoder 替代方案

更多 替代方案
  1. 使我們的文字轉換為 SQL 模型,在 5 個月內準確度提升 30%

  2. DeciCoder 1B 是經過訓練的僅解碼器程式碼補全模型,其使用了 10 億個參數,訓練資料為 Starcoder 訓練資料集中的 Python、Java 和 Javascript 子集。

  3. 此產品旨在協助程式設計師進行日常工作,同時提供極佳的學習體驗。

  4. 探索 Code Llama,這是一款先進的 AI 工具,可進行程式碼生成和理解。提升生產力、簡化工作流程,並賦予開發人員權能。

  5. 優化語言模型,提升效能,取得準確的結果。WizardLM 是編碼、數學和 NLP 任務的終極工具。