CogVLM & CogAgent 대체품 AI 플랫폼 Top 30

GLM-4.5V

GLM-4.5V: AI에 강력한 시각 지능을 불어넣으세요. 스크린샷으로 웹 코드를 생성하고, GUI를 자동화하며, 심층 추론을 통해 문서와 동영상을 분석합니다.

대형 언어 모델 무료

GLM-4.5V 대체품

0

glm-4v-9b

지푸 AI에서 출시한 GLM-4 시리즈의 최신 세대 사전 훈련 모델의 오픈소스 버전은 GLM-4-9B입니다.

대형 언어 모델 무료

glm-4v-9b 대체품

0

Qwen2-VL

Qwen2-VL은 알리바바 클라우드의 Qwen 팀에서 개발한 다중 모달 대규모 언어 모델 시리즈입니다.

대형 언어 모델 무료

Qwen2-VL 대체품

0

Yi-VL-34B

Yi Visual Language(Yi-VL) 모델은 Yi Large Language Model(LLM) 시리즈의 오픈 소스, 멀티모달 버전으로, 이미지에 대한 이해, 인식, 여러 차례의 대화를 가능하게 합니다.

대형 언어 모델 무료

Yi-VL-34B 대체품

0

GLM-4

MaaS 기반 개발의 새로운 패러다임, 유니버설 모델 서비스로 AI 활용하기

대형 언어 모델 프리미엄

GLM-4 대체품

6

Bagel

BAGEL: ByteDance-Seed에서 개발한 오픈 소스 멀티모달 AI. 이미지 및 텍스트를 이해하고 생성, 편집 가능. GPT-4o에 필적할 만큼 강력하고 유연하며, 이를 기반으로 고도화된 AI 앱 구축 가능.

대형 언어 모델 무료

Bagel 대체품

1

Aya Vision 8B

C4AI Aya Vision 8B: 이미지 이해를 위한 오픈 소스 다국어 비전 AI. 23개 언어로 OCR, 캡셔닝, 추론 기능 제공.

대형 언어 모델 무료

Aya Vision 8B 대체품

0

Cognee

RAG 성능을 한층 더 끌어올리세요! Cognee의 오픈 소스 시맨틱 메모리는 지식 그래프를 구축하여 LLM의 정확도를 향상시키고 환각 현상을 줄여줍니다.

개발자 도구 무료

Cognee 대체품

4

CM3leon

CM3leon: 텍스트와 이미지를 위한 다재다능한 멀티모달 생성 모델입니다. 게임, 소셜 미디어, 전자 상거래에서 창의성을 향상시키고 현실적인 비주얼을 만들어 보세요.

대형 언어 모델 무료

CM3leon 대체품

33

Mini-Gemini

미니-제미니는 이미지 이해, 추론, 생성과 동시에 2B에서 34B까지의 고밀도 및 MoE 대규모 언어 모델(LLM)을 지원합니다. 이 리포는 LLaVA를 기반으로 구축했습니다.

대형 언어 모델 무료

Mini-Gemini 대체품

0

CogVideoX

CogVideoX 모델은 상용 등급 애플리케이션의 요구를 충족하기 위해 고급 대규모 모델 기술을 기반으로 합니다.

대형 언어 모델 무료

CogVideoX 대체품

0

MiniCPM-Llama3-V 2.5

총 80억 개의 매개변수를 갖춘 이 모델은 GPT-4V-1106, Gemini Pro, Qwen-VL-Max, Claude 3와 같은 독점 모델을 능가하는 전반적인 성능을 제공합니다.

대형 언어 모델 무료

MiniCPM-Llama3-V 2.5 대체품

0

Cambrian-1

Cambrian-1은 비전 중심 설계를 갖춘 다중 모달 LLM 패밀리입니다.

대형 언어 모델 무료

Cambrian-1 대체품

6

CogVideoX-5B-I2V

Zhipu AI에서 개발한 CogVideoX-5B-I2V는 오픈소스 이미지-비디오 모델입니다. 이미지와 텍스트 프롬프트를 사용하여 6초 분량의 720×480 비디오를 생성합니다.

대형 언어 모델 무료

CogVideoX-5B-I2V 대체품

0

ChatGLM-6B

ChatGLM-6B는 62억 개의 변수(현재는 중국어 질의 응답 및 대화에 최적화되어 있음)를 갖춘 개방형 CN&EN 모델입니다.

대형 언어 모델 무료

ChatGLM-6B 대체품

0

InternLM2

InternLM2를 소개해드립니다. 오픈소스 모델을 탑재한 AI 툴입니다! 긴 맥락의 작업, 추론, 수학, 코드 해석, 창의적 글쓰기 분야에서 탁월합니다. 연구, 애플리케이션 개발, 대화 상호 작용에 대한 다목적 애플리케이션과 강력한 툴 활용 기능을 알아보세요. InternLM2로 AI 환경을 업그레이드하세요.

대형 언어 모델 무료

InternLM2 대체품

1

VoltAgent

VoltAgent: 강력하고 맞춤화된 AI 에이전트를 구축하기 위한 오픈 소스 TypeScript 프레임워크입니다. 제어력과 유연성을 확보하고, LLM, 도구, 데이터와 통합하세요.

개발자 도구 무료

VoltAgent 대체품

2

AutoGen

AutoGen으로 차세대 LLM 애플리케이션을 손쉽게 구축하세요. 개발을 간소화하고, 에이전트 및 인간과 대화하고, LLM 유틸리티를 극대화하세요.

개발자 도구 무료

AutoGen 대체품

11

DeepSeek-VL2

DeepSeek-AI에서 개발한 시각-언어 모델인 DeepSeek-VL2는 고해상도 이미지를 처리하고, MLA를 통해 빠른 응답을 제공하며, VQA 및 OCR과 같은 다양한 시각적 작업에서 뛰어난 성능을 자랑합니다. 연구원, 개발자 및 BI 분석가에게 이상적입니다.

대형 언어 모델 무료

DeepSeek-VL2 대체품

1

OmniParser V2

OmniParser V2는 LLM을 위한 GUI 자동화 문제를 해결합니다. UI 스크린샷을 토큰화하고, 소형 요소 감지 기능을 강화했으며, 추론 속도가 60% 더 빠르고, OmniTool과 통합되었습니다. 소프트웨어 테스팅, 웹 작업, 그리고 고객 지원에 이상적입니다.

대형 언어 모델 무료

OmniParser V2 대체품

1