오픈서치 3.0 출시… GPU 벡터 검색으로 AI 성능 9.5배 향상

| 김민준 기자

AI 기반 데이터 분석 도구로 주목받는 오픈서치(OpenSearch)가 성능을 대폭 개선한 3.0 버전을 출시하며 인공지능 워크로드 시장 공략에 나섰다. 이번 업데이트는 GPU 기반 벡터 검색 기능과 다양한 신기능을 탑재해, 고속 데이터 검색 처리와 AI 알고리즘의 정밀도 향상을 동시에 이루겠다는 전략이다.

오픈서치는 아마존웹서비스(AWS)가 2021년 엘라스틱서치와의 라이선스 갈등을 계기로 선보인 오픈소스 프로젝트다. 한때 엘라스틱서치의 대체재로 비교적 주목받지 못했지만, AI가 새로운 산업 표준으로 떠오르면서 오픈서치도 강력한 분석 엔진으로 재조명되고 있다.

오픈서치를 총괄하는 오픈서치 소프트웨어 재단(OpenSearch Software Foundation)은 이번 3.0 버전이 기존 1.3 버전에 비해 약 9.5배의 성능 향상을 이뤘다고 설명했다. 특히 벡터 검색 최적화가 핵심이다. 벡터 검색이란 정형화되지 않은 데이터를 수학적으로 정규화해 AI 모델이 학습할 수 있도록 돕는 핵심 기술로, 생성형 AI 챗봇, 추천 시스템, 하이브리드 검색 등에 필수적이다.

3.0에서는 엔비디아의 고성능 GPU를 활용해 대규모 벡터 연산을 가속화하고, 전체 인덱스 작성 시간을 줄여 운영비를 절감하는 것이 가능해졌다. 이 기능은 아직 실험적인 상태이나, 적용 가능성은 매우 높다는 평가다.

또한 이번 업데이트에는 앤스로픽(Anthropic)의 모델 컨텍스트 프로토콜을 지원하는 기능이 포함돼, 외부 데이터와 LLM(대규모 언어 모델) 간 연동성이 높아졌으며, 중복 벡터 데이터를 제거해 저장 효율 강화도 실현했다. 동시에 gRPC 기반의 원격 프로시저 호출 기능을 실험 도입해, 후속 확장을 위한 데이터 전송 효율 개선까지 고려됐다.

이외에도 아파치 카프카에서 직접 데이터를 당겨오는 풀 기반 수집 방식, 읽기/쓰기 기능 분리로 검색 인덱싱 성능을 높이는 기술, 아파치 칼사이트(Apache Calcite)를 통한 쿼리 작성 간소화 등 다양한 구조적 개선도 이뤄졌다. 핵심 엔진 루씬은 10버전으로 업그레이드됐고, 자바 런타임도 최소 21버전으로 상향돼 최신 개발 기능들이 지원된다.

오픈서치 재단 이사회 의장 칼 메도우스는 “기업 검색 시장은 2030년까지 89억 달러(약 12조 8,000억 원) 규모로 성장할 것으로 전망된다”며 “AI의 고도화를 위해 범용성 있는 데이터 분석 플랫폼의 수요가 지속 증가할 것”이라고 밝혔다.

이번 발표는 단순한 기능 업그레이드를 넘어, 오픈서치가 벡터 DB와 AI 통합의 개방형 대안으로 새롭게 자리매김할 가능성을 보여준다는 점에서 시장의 주목을 받고 있다.