What is Cloudflare AutoRAG?
내부 문서, 제품 사양, 지원 자료 등 특정 데이터를 정확히 이해하는 AI 애플리케이션을 구축하려면 검색 증강 생성(Retrieval-Augmented Generation, RAG)이라는 복잡한 과정을 거쳐야 하는 경우가 많습니다. RAG 시스템은 강력하지만, 기존에는 데이터 저장소, 벡터 데이터베이스, 임베딩 모델, LLM을 관리하고 색인 생성 및 검색을 위한 복잡한 코드를 다루어야 했습니다. 따라서 실제 애플리케이션 구축에 집중하기 어려웠습니다.
Cloudflare AutoRAG는 이 모든 과정을 간소화합니다. Cloudflare 인프라를 기반으로 구축된 완전 관리형 자동화 RAG 파이프라인을 제공합니다. Cloudflare R2 버킷과 같은 데이터 소스를 연결하기만 하면 AutoRAG가 데이터 처리 및 색인 생성부터 관련 정보 검색, 상황에 맞는 AI 응답 생성에 이르기까지 모든 작업을 처리합니다. 따라서 복잡한 인프라 관리나 지속적인 수동 업데이트에 매몰되지 않고도 애플리케이션에 특정 지식을 불어넣을 수 있습니다.
주요 기능
📥 자동 데이터 수집: Cloudflare R2 버킷에 직접 연결되어 다양한 파일 형식(PDF, 텍스트, HTML 등)을 자동으로 읽어 들입니다. AutoRAG에 데이터 위치만 지정하면 됩니다.
✂️ 스마트 콘텐츠 청킹: AI가 효과적으로 정보를 검색할 수 있도록 큰 문서를 더 작고 관리하기 쉬운 조각으로 자동 분할합니다.
🧠 지능형 임베딩: Workers AI에서 실행되는 효율적인 임베딩 모델을 사용하여 텍스트 조각을 벡터 표현으로 변환하여 의미론적 의미를 기반으로 데이터를 검색할 수 있도록 합니다.
💾 관리형 벡터 저장소 및 색인 생성: 전용 Cloudflare Vectorize 데이터베이스에 이러한 벡터를 안전하게 저장하고 관리하여 수동 설정 없이 검색 가능한 색인을 구축합니다.
🔄 지속적인 동기화: 연결된 R2 버킷에서 새로운 파일 또는 업데이트된 파일을 적극적으로 모니터링하고 콘텐츠를 자동으로 재처리 및 재색인하여 AI의 지식 기반을 최신 상태로 유지합니다.
💬 통합 LLM 생성: Workers AI 대규모 언어 모델을 원활하게 사용하여 검색된 정보와 사용자 쿼리를 기반으로 관련성 높고 근거 있는 응답을 생성하여 RAG 루프를 완료합니다.
실용적인 사용 사례
AutoRAG를 사용하면 더 스마트한 AI 애플리케이션을 빠르게 구축할 수 있습니다. 다음 시나리오를 고려해 보세요.
내부 지식 도우미: 직원들이 R2에 저장된 회사 정책, 프로젝트 문서 또는 기술 절차에 대해 질문할 수 있는 내부 챗봇을 배포한다고 상상해 보세요. AutoRAG는 봇이 일반적인 웹 지식이 아닌 검증된 내부 문서를만 기반으로 정확한 답변을 제공하도록 보장합니다.
상황 인식 고객 지원 봇: 미리 준비된 답변 이상의 기능을 제공하는 지원 봇을 구축하세요. R2를 통해 제품 설명서, FAQ 및 문제 해결 가이드를 제공하면 AutoRAG는 봇이 최신 정보를 자동으로 참조하여 특정 고객 질문에 정확하게 답변할 수 있도록 지원합니다.
웹사이트 콘텐츠 전체에 대한 시맨틱 검색: 자연어를 통해 웹사이트 콘텐츠를 쉽게 검색할 수 있도록 해야 하나요? Cloudflare의 Browser Rendering API를 사용하여 사이트 페이지를 HTML로 캡처하고 R2에 저장한 다음 AutoRAG를 연결할 수 있습니다. 그러면 사용자는 "기능 X는 어떻게 작동합니까?"와 같은 질문을 하고 웹 콘텐츠에서 직접 파생된 정확한 답변을 얻을 수 있습니다.
결론
Cloudflare AutoRAG는 일반적으로 검색 증강 생성을 구현하는 데 따르는 상당한 운영 부담을 제거합니다. 데이터 수집 및 처리부터 벡터 저장소 및 AI 응답 생성에 이르기까지 전체 파이프라인을 자동화하여 고유한 데이터를 활용하는 혁신적인 AI 애플리케이션을 만드는 데 집중할 수 있습니다. Cloudflare의 안정적이고 확장 가능한 인프라를 기반으로 구축된 AutoRAG는 더욱 지능적이고 상황을 인식하는 AI 경험을 구축할 수 있는 간소화된 경로를 제공합니다.
자주 묻는 질문(FAQ)
Q1: Cloudflare AutoRAG는 정확히 무엇인가요?
AutoRAG는 Cloudflare의 완전 관리형 서비스로, 검색 증강 생성(RAG) 파이프라인의 생성 및 유지를 자동화합니다. 데이터(초기에는 R2)에 연결하고, 색인 생성, 벡터 저장소(Vectorize 사용), 검색을 처리하고, Workers AI를 사용하여 데이터에 기반한 응답을 생성합니다.
Q2: 공개 베타 기간 동안 AutoRAG 비용은 얼마인가요?
AutoRAG 서비스 자체를 활성화하고 사용하는 것은 공개 베타 기간 동안 무료입니다. 그러나 AutoRAG는 계정 내에서 다른 Cloudflare 리소스(예: 스토리지를 위한 R2, 벡터 데이터베이스를 위한 Vectorize, 처리/생성을 위한 Workers AI)를 활용하며, 이는 표준 Cloudflare 사용량 요금에 따라 청구됩니다.
Q3: 베타 기간 동안 제한 사항이 있나요?
예, 베타 단계에서 리소스를 관리하기 위해 각 Cloudflare 계정은 최대 10개의 AutoRAG 인스턴스를 만들 수 있습니다. 각 인스턴스는 현재 연결된 R2 버킷에 저장된 최대 100,000개의 파일에 대한 색인 생성을 처리할 수 있습니다.
Q4: AutoRAG가 처리할 수 있는 데이터 유형은 무엇인가요?
현재 AutoRAG는 Cloudflare R2 버킷과 직접 통합됩니다. PDF, 텍스트 파일, HTML, CSV는 물론 이미지(비전 모델을 사용하여 텍스트 설명을 생성)를 포함하여 해당 버킷 내에서 발견되는 일반적인 파일 형식을 처리할 수 있습니다. 또한 Browser Rendering API를 사용하여 페이지를 R2에 먼저 저장하여 웹 콘텐츠를 수집할 수도 있습니다. 직접 URL 및 Cloudflare D1과 같은 다른 데이터 소스에 대한 지원도 계획되어 있습니다.
Q5: Vectorize 데이터베이스 또는 Workers AI 모델을 수동으로 설정하거나 관리해야 하나요?
아니요, 이것이 AutoRAG의 핵심 이점입니다. 필요한 Vectorize 데이터베이스 인스턴스를 자동으로 프로비저닝하고 관리하며 관리형 파이프라인의 일부로 임베딩 및 생성을 위해 Workers AI 모델의 사용을 오케스트레이션합니다. AutoRAG 서비스와 상호 작용하면 기본 구성 요소를 처리합니다.





