What is StarCoder?
StarCoderBase и StarCoder представляют собой крупные языковые модели (Code LLMs), обученные на данных с открытой лицензией из GitHub. Это включает данные из более 80 языков программирования, коммитов и проблем Git, блокнотов Jupyter и коммитов Git.
Мы обучили модель с 15 млрд параметров для 1 триллиона токенов, аналогичную LLaMA.
Мы доработали StarCoderBase для 35 млрд токенов Python. Результатом стала новая модель, которую мы назвали StarCoder.
StarCoderBase — это модель, которая превосходит другие открытые Code LLMs в популярных бенчмарках программирования. Она также соответствует или превосходит закрытые модели, такие как code-cushman001 от OpenAI, оригинальная модель Codex, которая использовалась в ранних версиях GitHub Copilot. Модели StarCoder способны обрабатывать больше входных данных с длиной контекста более 8000 токенов, чем любой другой открытый LLM. Это открывает возможности для множества интересных приложений. Предлагая модели StarCoder ряд диалогов, мы позволили ей выступать в качестве технического ассистента.
More information on StarCoder
StarCoder Альтернативи
Больше Альтернативи-
Увеличение точности нашей текстовой модели SQL на 30 процентных пунктов в течение 5 месяцев
-
DeciCoder 1B — это модель для автозаполнения кода, предназначенная только для декодирования, с 1 миллиардом параметров, обученная на подмножестве Starcoder Training Dataset, включающем Python, Java и Javascript.
-
Этот продукт разработан для помощи программистам в их ежедневной работе, а также для предоставления превосходного опыта обучения.
-
Познакомьтесь с Code Llama — инновационным инструментом ИИ для создания и понимания кода. Повысьте продуктивность, автоматизируйте рабочие процессы и расширьте возможности разработчиков.
-
Усовершенствуйте языковые модели, улучшите производительность и получите точные результаты. WizardLM — это универсальный инструмент для задач кодирования, математики и обработки естественного языка.