미국 새너제이에서 열린 NTT리서치의 연례 행사 ‘업그레이드’에서는 AI가 소프트웨어 개발의 구조 자체를 바꾸고 있다는 진단이 나왔다. 특히 AI 코드 편집기 커서(Cursor)는 이제 AI가 코드를 대신 써주는 수준을 넘어, 기업의 개발 방식과 성과 지표, 조직 운영까지 다시 설계해야 할 시점이라고 강조했다.
이번 대담에는 NTT벤처캐피털 공동창업 파트너 밥 고엘(Vab Goel), NTT리서치 최고마케팅책임자 크리스 쇼(Chris Shaw), 커서 최고운영책임자 조던 토폴레스키(Jordan Topoleski)가 참석했다. 주제는 ‘연구에서 현실로’였다. 기술 시연에 그치지 않고 실제 고객이 쓰는 생산 단계까지 AI를 끌어올리는 데 초점이 맞춰졌다.
조던 토폴레스키는 가장 큰 변화로 소프트웨어 개발 생명주기의 ‘병목 이동’을 꼽았다. 과거에는 코드를 직접 작성하는 일이 가장 많은 시간을 잡아먹었지만, 이제는 기획과 설계, 테스트, 리뷰가 더 큰 제약이 되고 있다는 설명이다. 그는 AI가 전체 코드의 60%에서 80%를 생성할 수 있게 되면서, 기업은 ‘얼마나 많은 코드를 썼는가’보다 그 코드가 ‘얼마나 안전하고 품질이 높으며 사업 성과로 이어지는가’를 봐야 한다고 말했다.
실제 수치도 제시됐다. 토폴레스키에 따르면 12개월 전만 해도 커서를 쓰는 일반 기업 고객이 운영 환경에 반영한 코드 가운데 AI가 만든 비중은 평균 6% 수준이었다. 지금은 이 수치가 60%를 넘는다. 커서 내부에서는 여러 에이전트를 병렬로 돌리는 ‘클라우드 에이전트’ 도입 이후, 운영 반영 코드의 97.3%를 AI가 작성하는 단계까지 올라왔다.
이 같은 증가는 단순한 생산성 향상에 그치지 않는다. 한 대형 보험사는 커서 도입 후 주간 코드 배포량이 약 15만 줄에서 80만 줄 수준으로 늘었다고 소개됐다. 문제는 여기서 생긴다. AI가 코드 작성 속도를 높일수록 기존의 코드 리뷰, CI/CD, 배포 승인 체계가 이를 감당하지 못하게 된다. 결국 병목은 ‘작성’에서 ‘검증과 운영’으로 이동한다.
AI 개발도구의 진화… 자동완성에서 ‘에이전트 오케스트레이션’으로
토폴레스키는 AI 기반 소프트웨어 개발 흐름을 세 단계로 정리했다. 첫 단계는 ‘자동완성’이다. 개발자가 최근 10~15분 동안 한 작업을 바탕으로 다음 코드를 예측하는 방식으로, 생산성을 10%에서 15% 높이는 효과가 있었다는 설명이다.
두 번째는 ‘에이전트’ 단계다. AI가 일종의 페어 프로그래밍 동료처럼 작동하면서 전체 코드베이스를 훑고, 대규모언어모델(LLM)을 활용해 필요한 코드를 생성하고 반영한다. 이 단계에서는 생산성 향상 폭이 35%에서 40% 수준으로 커졌다고 했다.
세 번째는 ‘클라우드 에이전트’다. 여러 에이전트를 클라우드 환경에서 동시에 실행해 더 긴 작업을 맡길 수 있는 구조다. 이 경우 개발자의 역할은 직접 코드를 쓰는 사람에서 여러 AI 작업 흐름을 관리하는 ‘오케스트레이터’에 가까워진다. 토폴레스키는 개발자가 이제 여러 에이전트를 조율하는 관리자처럼 일하게 된다고 설명했다.
투자 대비 효과는 모델보다 ‘리더십’이 좌우
이번 대담에서 반복해서 나온 핵심은 도구보다 조직이다. 토폴레스키는 AI 도입의 투자 대비 효과는 어떤 모델을 쓰느냐보다 경영진이 얼마나 분명한 원칙을 제시하느냐에 달려 있다고 봤다. 현장 개발자들이 가장 궁금해하는 것은 ‘AI를 잘 쓰면 승진하는가, 아니면 일자리를 잃는가’라는 점인데, 이에 대한 명확한 메시지가 없으면 도입 속도도 떨어질 수밖에 없다는 것이다.
그는 실무적인 해법으로 해커톤, 실험 전용 시간, 별도 테스트 환경 제공을 제안했다. 개발자들이 일상 업무 압박에서 잠시 벗어나 AI 도구를 직접 써보고 실패도 경험해야 장기적으로 정착이 가능하다는 얘기다.
커서는 품질과 신뢰 확보를 위해 ‘버그 모드’ 기능도 운영하고 있다고 밝혔다. 여러 개의 대규모언어모델을 연속적으로 돌려 버그, 품질 문제, 잠재 위험을 코드 작성 단계에서 미리 찾아내는 방식이다. 토폴레스키는 이 기능이 발견한 문제 가운데 약 60%를 해결할 수 있다고 설명했다. AI가 코드를 빠르게 늘릴수록 이런 자동 검증 계층이 필수라는 의미다.
커서, ‘개념검증’ 넘은 실제 시장… 포천 500의 70%가 사용
밥 고엘은 커서를 AI 소프트웨어 개발 분야에서 가장 인상적인 ‘응용 AI’ 기업 중 하나로 평가했다. 그는 많은 AI 서비스가 아직 개념검증(POC) 단계를 벗어나지 못하고 있지만, 소프트웨어 개발 분야만큼은 이미 본격적인 운영 단계에 진입했다고 짚었다.
고엘이 공개한 수치도 눈길을 끈다. 설립 3년 차인 커서는 연간 매출 환산 기준 20억달러를 기록했다고 소개됐다. 원화로는 약 2조9588억원 규모다. 또 포천 500대 기업의 약 70%가 커서를 사용 중이며, 주간 활성 개발자 수는 200만명을 넘는다고 밝혔다. AI 서비스 대다수가 실험과 파일럿에 머무는 사이, 커서는 실제 생산 현장에 깊이 침투했다는 주장이다.
이번 발언들을 종합하면 AI 소프트웨어 개발 시장은 더 이상 미래 이야기가 아니다. 이미 산업 규모로 확대됐고, 경쟁력의 핵심은 모델 성능 자체보다 이를 조직에 어떻게 녹여내느냐다. 코드 양을 늘리는 것만으로는 차별화가 어렵고, 품질 관리와 보안, 배포 체계, 개발자 역할 재정의까지 함께 가야 한다는 뜻이다.
결국 AI 개발의 승부처는 ‘더 많은 코드’가 아니라 ‘더 나은 결과’에 있다. 기업이 AI를 통해 실질적인 성과를 내기 위해서는 개발 속도뿐 아니라 장애율, 고객 체감 품질, 기능 채택률 같은 사업 지표와 연결해 판단해야 한다. AI 소프트웨어 개발은 이미 현실이 됐고, 이제 남은 과제는 이를 감당할 조직과 운영 체계를 만드는 일이다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

