AI 모델 개발사 앤트로픽(Anthropic)이 80페이지 분량으로 구성된 '클로드 헌법(Claude Constitution)'의 최신 버전을 발표했다. 이번 문서는 합성 훈련 데이터 생성과 피드백 순위에 활용되며, AI 정렬 기준의 핵심 규범으로 작동하게 된다.
기존의 단순한 나열 방식에서 벗어나 원칙과 그 이유를 함께 설명함으로써, 다양하고 새로운 시나리오에 대한 AI 모델의 대응력을 높이는 데 초점을 맞췄다. 주요 구성은 '광범위한 안전성 > 윤리 > 지침 준수 > 진정한 지원' 순으로 정리되어 있다.
특히 생물학 무기 개발 등 민감 사안에 대한 명확한 제한을 포함했고, 미덕, 심리적 안전성, 모델 자기 인식 파트를 추가해 정렬 프레임워크의 투명성을 높였다. 해당 문서는 크리에이티브 커먼즈 CC0 1.0 라이선스로 누구나 활용할 수 있도록 공개됐다.




