AI 평가의 새로운 패러다임을 제시하겠다는 목표 아래, 스타트업 얍(Yupp)이 암호화폐 인센티브 구조를 기반으로 한 AI 모델 평가 플랫폼을 정식 출범했다. 얍은 이번에 안드리센 호로위츠의 암호화폐 투자 부문인 a16z 크립토가 주도한 시드 펀딩 라운드를 통해 3,300만 달러(약 475억 원)를 유치하며 출발선에 섰다. ‘버 사라이 랩스(Ber Sarai Labs Inc.)’라는 공식 법인명을 사용하는 얍은 AI 커뮤니티와 사용자 모두에게 실질적인 참여 혜택을 제공하는 생태계 구축을 선언했다.
얍의 기본 작동 방식은 간단하지만 다층적이다. 사용자들이 단일 AI 응답만을 받는 대신, 두 개 이상 다양한 AI 모델의 반응을 제공받음으로써 다양한 의견을 비교하고 최적의 결과를 선택할 수 있도록 설계되어 있다. 이를 통해 사용자는 AI의 편향성을 줄이고 더 신뢰도 높은 결과를 얻게 되며, 이에 대한 피드백은 얍 플랫폼 내 다양한 AI 성능 향상을 위한 원천 자료로 활용된다.
현재 얍은 오픈AI의 챗GPT(ChatGPT), 앤트로픽의 클로드(Claude), 구글(GOOGL)의 제미니(Gemini)는 물론 메타(META)의 라마(LLaMA) 등 500개 이상의 상용·오픈소스 모델들을 통합해 제공하고 있다. 공동 창업자 겸 CEO인 판카즈 굽타(Pankaj Gupta)는 “개별 피드백은 한계가 있지만, 수백만 명의 글로벌 사용자로부터 축적된 평가 데이터는 AI 개발자들에게 매우 강력한 시그널이 된다”고 강조했다.
얍은 단순히 피드백을 수집하는 것에서 그치지 않는다. 플랫폼을 오래 사용할수록 더 많은 보상을 제공하는 구조를 도입했다. 이용자들은 피드백을 남기면 '얍 크레딧(Yupp Credits)'이라는 보상 토큰을 적립할 수 있고, 이 토큰은 추후 다른 암호화폐로 전환이 가능하다. 피드백의 질이 높을수록 더 많은 크레딧이 주어지기 때문에 정교한 평가 참여를 유도하는 시스템이다.
얍은 AI 분야의 고질적인 문제, 즉 모델의 정확성과 활용 가능성을 어떻게 객관적으로 판단할 수 있을까 하는 고민에서 출발했다. 이를 해결하기 위해 얍은 ‘VIBE(바이브) 지표’라는 이름의 평가 기준을 마련해, 모델 간의 성능을 비교하는 리더보드를 베타 버전으로 선보였다. 사용자의 응답과 피드백을 집계해 모델을 순위화함으로써, 개발자들이 어떤 모델이 어떤 용도에 적합한지를 빠르게 파악할 수 있도록 지원한다.
이번 투자는 a16z 외에도 구글의 최고 과학자인 제프 딘(Jeff Dean), 트위터 공동 창업자 비즈 스톤(Biz Stone), 핀터레스트 공동 창업자 에반 샤프(Evan Sharp), 퍼플렉시티 CEO 아라빈드 스리니바스(Aravind Srinivas), 투자 플랫폼 크레드의 CEO 쿠날 샤(Kunal Shah), 코인베이스 벤처스 등 총 45명 이상이 참여하며 눈길을 끌었다.
a16z 측은 성명에서 “암호화 기술은 AI 평가의 불투명한 영역에 소유권과 투명성을 도입할 수 있는 강력한 수단”이라고 강조하며, 블록체인이 피드백 데이터의 출처를 명확히 하여 위·변조를 방지하고, 사용자 기여에 대한 포상을 자동화할 수 있다는 점을 높이 평가했다.
전 세계적으로 AI 기술이 빠르게 발전하고 있는 만큼, 얍은 사용자 중심 피드백을 통해 다수의 AI 모델이 공존하는 시장에서 신뢰도 높은 모델 식별과 개발 가속에 기여하겠다는 구체적인 방향성을 제시하고 있다. AI와 암호화폐라는 두 축이 어떤 시너지를 낼 수 있을지, 얍의 행보에 관심이 쏠린다.