토픽

맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

코크로치DB, AI 시대 맞춤형 대규모 벡터 처리 기능 공개… 분산 SQL 새판 짠다

프로필
김민준 기자
댓글 0
좋아요 비화설화 0

코크로치랩스가 AI 기반 데이터 환경 대응을 위해 벡터 인덱싱과 운영 안정성을 강화한 코크로치DB 25.2를 출시했다. 기업용 분산형 SQL 구조에서의 벡터 데이터 효율 처리와 보안 기능까지 대폭 향상됐다.

 코크로치DB, AI 시대 맞춤형 대규모 벡터 처리 기능 공개… 분산 SQL 새판 짠다 / TokenPost Ai

코크로치DB, AI 시대 맞춤형 대규모 벡터 처리 기능 공개… 분산 SQL 새판 짠다 / TokenPost Ai

기업들이 인공지능(AI) 기술을 본격적으로 도입하면서 데이터 인프라에 대한 요구가 한층 복잡해진 가운데, 코크로치랩스(Cockroach Labs)가 이 같은 변화에 대응하기 위해 자사의 대표 제품인 코크로치DB(CockroachDB) 25.2 버전을 공개했다. 이번 업데이트는 기업 AI 환경에서 발생하는 대규모 벡터 데이터를 효과적으로 처리할 수 있도록 성능을 대폭 개선하고, 분산형 SQL 데이터베이스에서의 벡터 인덱싱 지원을 주요 강화 요소로 포함했다.

분산형 SQL 구조는 데이터 접근성과 복원력을 확보해야 하는 기업 환경에서 핵심적인 역할을 하고 있다. 특히 AI가 생성한 방대한 양의 정보가 단순한 저장을 넘어 실시간 응답성과 정확한 분석 기능까지 요구하게 됨에 따라, 그 중요성은 더욱 커지고 있다. 코크로치DB 25.2는 벡터 인덱싱 기능이 통합된 최초의 분산 SQL 플랫폼으로, 41%에 달하는 운영 효율 향상과 함께 운영 및 보안 기능 전반에 걸쳐 개선됐다.

코크로치랩스의 공동 창업자이자 최고경영자인 스펜서 킴벌(Spencer Kimball)은 이번 업데이트가 단순히 ‘AI를 위한 기능’이 아니라, AI 시스템이 작동 가능한 수준의 *운영 안정성* 확보를 중심에 두고 있다고 설명했다. 그는 “AI 자체보다 중요한 것은, AI가 시스템 내에서 지속적으로 작동할 수 있도록 하는 기반”이라며 현재 코크로치DB를 선택하는 대부분의 고객은 ‘생존 가능한 데이터베이스’를 찾고 있다고 강조했다.

현재 벡터 데이터베이스는 AI 학습과 검색 증강 생성(RAG) 같은 다양한 시나리오에 활용되고 있지만, 대부분의 제품은 단일 노드에서는 우수한 성능을 보이나, 여러 지역에 분산된 노드 간 통합 운영에는 한계를 드러낸다. 이를 해결하기 위해 코크로치DB는 마이크로소프트의 연구에서 개발된 SPANN 알고리즘에 기반한 C-SPANN이라는 분산 벡터 인덱스를 도입했다. 이를 통해 수십억 개에 달하는 벡터 데이터를 다차원 공간에서 고속으로 검색할 수 있도록 했다.

또한 새 버전에는 규제 대응 역량도 강화됐다. 행 수준 보안(row-level security)과 암호화 알고리즘 설정 기능이 새롭게 적용돼, 최근 EU의 DORA, NIS2 등 강화된 규제 요건을 충족할 수 있도록 설계됐다. 실제 코크로치랩스 조사에 따르면 IT 리더의 79%는 새 규제에 대해 준비가 미흡하다고 밝혔고, 연간 평균 22만 달러(약 3억 1,700만 원) 이상의 시스템 장애 비용을 우려하는 것으로 나타났다.

데이터 운영 환경 변화에 대한 시선도 주목할 만하다. 킴벌은 AI로 인한 데이터 트래픽 증가가 기존 분석형 빅데이터가 아닌 ‘운영형 빅데이터’로의 전환을 예고한다고 분석했다. 기존 빅데이터가 대용량 배치 처리에 초점을 맞췄다면, 운용형 빅데이터는 초단위 응답성과 시스템 일관성을 요구하며 실시간 애플리케이션 구동의 근간이 된다. 특히 사람보다 빠른 속도로 API를 호출하는 AI 에이전트의 등장은 데이터베이스 부하를 기하급수적으로 증가시킬 것으로 예상된다.

성능 측면에서도 새로운 기능이 눈에 띈다. ‘버퍼된 쓰기(buffered writes)’는 ORM 기반 처리에서 발생하는 과도한 네트워크 트래픽을 줄이며, 로컬 SQL 코디네이터 내에서 데이터를 처리해 응답 속도를 높인다. 또 다른 핵심 기능인 ‘기본 쿼리 계획(generic query plans)’은 반복되는 쿼리 구조의 계획을 캐싱함으로써 수백만 건의 트랜잭션을 실행하는 환경에서 재사용성을 높이고 효율을 끌어올렸다.

킴벌은 "단일 노드 환경과 달리 분산 시스템에서는 각 노드의 지연 시간 차이로 인해 쿼리 계획 캐싱이 쉽지 않다"며, 이번 업데이트가 이를 극복하기 위한 중요한 발걸음이라고 설명했다.

AI 도입을 본격화하고 있는 기업들이 분산형 데이터베이스 도입을 주저하고 있다면, 코크로치DB 25.2는 하나의 명확한 선택지를 제시한다. 전통적인 SQL 처리와 벡터 기반 AI 처리의 융합이 가능한 플랫폼은 앞으로 다가올 *에이전틱 AI(agentic AI)* 시대에 기업들의 데이터 인프라 수준을 한 단계 끌어올리는 데 기여할 것으로 기대된다. 이번 업데이트는 단순한 기술 발전을 넘어, AI 기반 업무 환경에서 ‘신뢰할 수 있는 데이터 플랫폼’이 갖춰야 할 조건을 제시하는 사례라 할 수 있다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1