What is Turbopuffer?
turbopuffer는 과도한 인프라 비용 없이 엄청난 규모를 요구하는 현대 기업의 데이터 워크로드를 위해 설계된 고성능 검색 엔진입니다. turbopuffer는 저렴한 객체 스토리지를 유일한 상태 의존성으로 활용함으로써, 페타바이트 규모의 인덱스를 경제적으로 유지하는 핵심 과제를 해결하고 벡터 및 전문(full-text) 검색 기능을 효율적으로 결합합니다. B2B 및 엔터프라이즈 고객을 위해 특별히 개발된 이 플랫폼은 안정적인 10ms 미만의 웜(warm) 지연 시간을 제공하며, 다중 테넌트 환경을 위한 강력한 데이터 격리를 지원합니다.
주요 기능
turbopuffer는 컴퓨트(NVMe SSD 및 메모리 캐시)와 상태(객체 스토리지)를 분리하여 성능과 효율성을 모두 제공하도록 설계되었습니다. 이러한 아키텍처는 비용을 관리하면서 수십억 개의 문서를 처리할 수 있게 해줍니다.
🔍 통합 벡터 및 전문(Full-Text) 검색
단일 API 호출로 현대적인 하이브리드 검색의 강력한 기능을 활용할 수 있습니다. turbopuffer는 벡터 임베딩을 위해 중심점 기반의 근사 최근접 이웃(ANN) 인덱스인 SPFresh를 활용하고, 키워드 검색을 위해 역(inverted) BM25 인덱스를 사용합니다. 이러한 조합은 높은 재현율(recall)을 보장하고 후속 정제(refinement) 프로세스를 위한 강력한 후보군을 생성할 수 있게 하여, 탁월한 관련성을 기본적으로 제공합니다.
☁️ 객체 스토리지 네이티브 아키텍처
상태는 저렴한 객체 스토리지(예: S3 또는 GCS)에서만 관리되므로, 시스템이 수 조(trillions) 개의 문서까지 수평적으로 확장할 수 있습니다. 컴퓨트 노드는 NVMe SSD와 메모리 캐시를 활용하여 활발하게 검색되는 데이터만 캐싱합니다. 이러한 접근 방식은 자주 액세스되는 네임스페이스에서도 기존의 복제된 디스크 시스템과 비교하여 스토리지 비용을 크게 절감합니다.
✅ 강력한 일관성 및 내구성 (ACD)
데이터 무결성과 신뢰성은 무엇보다 중요합니다. turbopuffer는 원자성(Atomicity), 일관성(Consistency), 내구성(Durability)의 ACD 속성을 제공합니다. 쓰기 작업은 즉시 WAL(Write-Ahead Log)에 커밋되며, API 반환 시점에 내구성을 보장합니다. 기본적으로 후속 쿼리는 쓰기 작업을 즉시 확인하여, 안정적인 애플리케이션에 필수적인 강력한 일관성을 보장합니다.
🛡️ 엔터프라이즈급 격리 및 보안
B2B 다중 테넌시를 위해 설계된 turbopuffer는 객체 스토리지에서 각 클라이언트의 데이터를 자체 네임스페이스 접두사 내에 격리합니다. 높은 규정 준수가 필요한 기업 요구 사항을 위해, 당사는 단일 테넌시 클러스터, 고객 VPC 내로의 BYOC(Bring Your Own Cloud) 배포, 그리고 고객 관리 암호화 키(CMEK)를 통한 격리를 지원하여 고객이 데이터 암호화 키에 대한 완전한 제어권을 유지할 수 있도록 합니다.
활용 사례
turbopuffer는 높은 처리량, 엄청난 규모, 그리고 엄격한 데이터 격리가 요구되는 시나리오에서 총 소유 비용(TCO)을 최소화하면서 탁월한 성능을 발휘합니다.
1. 효율적인 1단계 검색
수백만 또는 수십억 개의 문서를 다룰 때, 범위를 빠르게 좁혀야 합니다. turbopuffer의 하이브리드 검색을 사용하여 수십 또는 수백 개의 관련 결과로 구성된 후보군을 효율적으로 생성할 수 있습니다. 이러한 기능은 재순위(re-ranking) 또는 정제(refinement)의 2단계에 의존하는 대규모 애플리케이션에 매우 중요하며, 초기 검색이 빠르고 포괄적임을 보장합니다.
2. 10ms 미만 지연 시간 워크로드 제공
검색 속도가 사용자 경험에 직접적인 영향을 미치는 사용자 대면 애플리케이션의 경우, turbopuffer는 인상적인 웜 쿼리 성능(p50=8ms)을 활용할 수 있도록 합니다. 사전 쿼리(pre-flight query)를 통해 중요한 네임스페이스 또는 특정 사용자 데이터 세그먼트를 "사전 워밍(prewarming)"하는 전략을 구현할 수 있으며, 이를 통해 후속 사용자 상호작용에서 낮은 웜 지연 시간만을 경험하도록 보장합니다.
3. 높은 규정 준수 데이터 저장 및 검색
PHI(Protected Health Information)와 같은 민감한 정보를 다루는 기업들은 turbopuffer의 보안 스택으로부터 이점을 얻을 수 있습니다. 당사는 고객 관리 암호화 키(CMEK)를 지원하며 SOC 2 Type 2 감사를 받습니다. HIPAA 규정 준수가 필요한 고객은 BAA(Business Associate Agreement)를 요청할 수 있으며, 이는 고객이 선택한 지역 내에서 안전하고 규정을 준수하는 데이터 호스팅을 위한 필수적인 프레임워크를 제공합니다.
turbopuffer를 선택해야 하는 이유?
turbopuffer의 독특한 아키텍처는 기존 검색 및 벡터 데이터베이스에 비해 명확한 운영 및 재정적 이점을 제공합니다.
탁월한 비용 효율적 성능
turbopuffer는 데이터가 캐시될 때(p50 웜 지연 시간 8ms) 인메모리 검색 엔진만큼 빠르도록 설계되었으며, 운영 비용은 훨씬 저렴합니다. 값비싼 복제 디스크 시스템 대신 대다수의 인덱스 데이터를 저렴한 객체 스토리지에 저장함으로써, 전체 스토리지 점유 공간과 인프라 지출을 획기적으로 줄일 수 있습니다.
객체 스토리지 효율성에 최적화
당사의 인덱싱 전략은 클라우드 스토리지 경제성에 근본적으로 최적화되어 있습니다. 중심점 기반의 SPFresh 인덱스는 인덱싱 및 쿼리 시 필요한 무작위 왕복 횟수와 쓰기 증폭을 최소화합니다. 이는 높은 지연 시간의 객체 스토리지와 상호작용할 때 그래프 기반 인덱스(예: HNSW 또는 DiskANN)의 일반적인 병목 현상입니다. 이러한 최적화는 더 빠른 콜드 스타트와 낮은 운영 비용으로 이어집니다.
간소화된 운영 및 안정성
객체 스토리지가 유일한 상태 의존성으로 기능하므로, 시스템 운영 및 유지 관리가 크게 간소화됩니다. 이 아키텍처는 모든 쿼리 노드가 어떤 네임스페이스의 데이터든 즉시 제공할 수 있으므로, 안정성과 고가용성(HA)을 향상시킵니다. 또한, 이 시스템은 높은 처리량(초당 10,000개 이상의 벡터)으로 대량의 쓰기 작업(추가, 업데이트, 삭제)을 처리하도록 설계되어, 인덱스가 항상 최신 상태를 유지하고 일관성을 보장합니다.
결론
turbopuffer는 가장 집약적인 엔터프라이즈 검색 애플리케이션이 요구하는 속도와 확장성을 제공하는 동시에, 객체 스토리지 중심 설계로 총 소유 비용을 근본적으로 절감합니다. 다중 테넌트 데이터를 위한 강력한 하이브리드 검색, 높은 일관성 및 대규모 확장성이 필요하다면, turbopuffer가 필요한 안정적이고 비용 효율적인 기반을 제공합니다.





