엔트로픽(Anthropic)이 자사의 인공지능(AI) 코딩 도구 '클로드 코드(Claude Code)'의 핵심 소스코드 일부를 실수로 유출하면서, 기술 경쟁력과 보안 신뢰도에 타격을 입었다고 월스트리트저널(WSJ)이 1일 보도했다. 

이번 사건은 단순한 내부 실수를 넘어, AI 산업 전반의 경쟁 구도와 보안 리스크를 동시에 드러낸 사례로 평가된다.

"보안 침해 아닌 인적 오류"... 8,000건 삭제 요청

앤스로픽은 이번 유출이 해킹이 아닌 "배포 과정에서 발생한 인적 오류"라고 밝혔다. 유출된 자료에는 고객 데이터나 AI 모델의 핵심 수학 구조(가중치)는 포함되지 않았다고 설명했다.

그러나 회사는 사태 확산을 막기 위해 코드 공유 플랫폼 깃허브(GitHub)에 8,000건 이상의 삭제 요청을 제출했다가, 이후 범위를 96건으로 축소했다.

'AI 조종법' 공개... 경쟁사에 설계도 제공

이번 유출의 핵심은 단순 코드가 아니라, AI를 코딩 에이전트로 작동시키는 '지침(harness)'이 포함됐다는 점이다.

엔트로픽 로고
(엔트로픽. 자료화면)

이 지침은 AI 모델을 어떻게 유도하고 제어하는지를 보여주는 핵심 기술로, 개발자들이 클로드를 효과적으로 활용하도록 만드는 '노하우'에 해당한다.

결과적으로 경쟁사와 스타트업들은 복잡한 역설계(reverse engineering) 없이도 클로드 코드의 기능을 모방할 수 있는 '설계도'를 확보하게 됐다는 분석이 나온다.

해커 악용 가능성도 제기... 보안 리스크 확대

유출된 정보는 해커들에게도 새로운 공격 단서를 제공할 수 있다는 우려가 제기된다.

AI 시스템의 작동 방식과 취약점을 분석해 악용하거나, AI를 사이버 공격에 활용하도록 조작할 가능성도 배제할 수 없다는 것이다.

다만 일부 보안 전문가들은 "이미 역설계가 가능한 수준의 정보였기 때문에 위험성은 제한적"이라는 평가도 내놓고 있다.

'드리밍·위장 기능' 등 내부 기술 드러나

유출된 코드에서는 클로드 코드의 다양한 내부 기능도 확인됐다.

AI가 작업 내용을 주기적으로 정리하는 '드리밍(dreaming)' 기능과, 일부 상황에서 AI임을 숨기도록 하는 '위장 동작' 지침 등이 포함된 것으로 나타났다.

또 향후 출시될 기능과 모델에 대한 단서도 일부 포함돼 있어, 제품 전략까지 노출됐다는 지적이 나온다.

기업가치 3,800억 달러 앞두고 '악재'

앤스로픽은 최근 기업가치 3,800억 달러 수준의 투자 유치를 추진하며 IPO 가능성까지 거론되는 상황이었다.

특히 클로드 코드의 인기 확산으로 기업 고객 기반을 빠르게 확대해 왔던 만큼, 이번 유출은 신뢰도 측면에서 타격이 불가피하다는 분석이다.

"망신이지만 치명적이지는 않다" 평가도

일부 전문가들은 이번 사건을 "당혹스러운 실수"로 평가하면서도, 장기적으로는 큰 위협이 아닐 수 있다고 보고 있다.

AI 소프트웨어는 지속적으로 업데이트되기 때문에 유출된 코드의 가치가 빠르게 낮아질 수 있고, 핵심 알고리즘이 노출되지 않았다는 점도 이유로 꼽힌다.

그럼에도 이번 사건은 AI 산업에서 '기술 우위'뿐 아니라 '운영·보안 관리'가 경쟁력의 핵심 요소로 떠오르고 있음을 보여주는 사례로 평가된다.