2026.06.30 10:43 PM
By 이재경
파운데이션 모델 기업들 사이에서 에이전트(agentic) 기능 탑재가 업계 기본값이 되어가는 가운데, 앤트로픽(Anthropic)이 자사 중간급 모델의 더 강력하고 에이전트 친화적인 버전인 '클로드 소넷 5(Claude Sonnet 5)'를 출시했다고 테크크런치(TechCrunch)가 30일 보도했다.
앤트로픽은 공식 블로그 게시물을 통해 "이 모델은 계획을 세우고, 브라우저와 터미널 같은 도구를 사용하며, 불과 몇 달 전까지만 해도 더 크고 비싼 모델이 필요했던 수준으로 자율적으로 작동할 수 있다"고 밝혔다.
이러한 설명은 오픈AI(OpenAI)와 구글(Google)이 최근 자사 모델을 출시하면서 내세운 홍보 방향과 맥락을 같이한다. 오픈AI는 지난주 'GPT-5.6 Sol'을 프리뷰 형태로 출시했으며, 이 역시 해당 회사의 가장 에이전트 중심적인 모델로, 사용자가 장기 자율 작업을 여러 하위 에이전트에 분산시킬 수 있다.
구글의 '제미나이 3.5 플래시(Gemini 3.5 Flash)'는 지난 5월 출시됐으며, 대화형 챗봇에서 벗어나 최소한의 인간 개입으로 실제 업무를 계획하고, 구축하고, 반복 수행하는 에이전트 도구로의 전환을 표방했다.
소넷 5의 출시는 에이전트 기능이 이제 모든 가격대에서 기본 기대치로 자리 잡았음을 확인해준다. 앞으로 차별화 포인트는 누가 에이전트 작업을 가장 잘 하느냐가 아니라, 얼마나 저렴하게, 그리고 인간의 감독 없이 얼마나 안정적으로 수행할 수 있느냐가 될 전망이다.
소넷 5는 오퍼스 4.8(Opus 4.8)에 근접한 성능을 훨씬 낮은 비용으로 제공한다고 앤스로픽은 강조했다. 클로드 소넷 5는 이번 주 화요일부터 무료 및 프로(Pro) 요금제의 기본 모델로 설정되며, 모든 구독 플랜에서 이용 가능하다.
출시 가격은 오는 8월 31일까지 입력 토큰(input token) 100만 개당 2달러, 출력 토큰(output token) 100만 개당 10달러이며, 이후에는 각각 3달러와 15달러로 인상될 예정이다. 이는 오퍼스 4.8은 물론 오픈AI의 GPT-5.5, 구글의 제미나이 3.1 프로(Gemini 3.1 Pro)보다도 저렴한 수준이다. 다만 구글의 제미나이 3.5 플래시보다는 여전히 비싸다.
앤스로픽에 따르면, 새 모델은 지난 2월 출시된 전작 소넷 4.6(Sonnet 4.6)과 비교해 추론, 도구 활용, 소프트웨어 코딩, 지식 업무 등 에이전트 성능 전반에서 눈에 띄는 향상을 보인다.
한 벤치마크 결과를 보면, 소넷 5는 에이전트 코딩 부문에서 63.2%를 기록했다. 이는 오퍼스 4.8의 69.2%에는 미치지 못하지만, 소넷 4.6의 58.1%보다는 높은 수치다. 지식 업무 벤치마크에서는 소넷 5가 오퍼스 4.8을 오히려 소폭 앞지르기도 했다. 오퍼스 4.8은 미묘한 판단 결정이나 심층 리서치 같은 어려운 문제 해결에 강점을 가진 모델로 알려져 있다.
앤트로픽은 "오퍼스 4.8은 여전히 이러한 작업에서 더 높은 정확도를 원하는 이용자를 위한 최선의 선택"이라면서도 "소넷 5는 개발자들에게 이전보다 훨씬 높은 품질을 훨씬 낮은 가격에 제공하는 옵션"이라고 설명했다. 또한 "소넷 5와 오퍼스 4.8 사이에서 사용자는 비용과 성능의 적절한 균형을 찾기 위해 노력 수준을 조정할 수 있다"고 덧붙였다.
블로그 게시물에 인용된 테스터들에 따르면, 소넷 5는 이전 모델 버전들이 중도에 멈추곤 했던 복잡한 작업을 끝까지 완수하는 데 탁월하며, "명시적으로 요청받지 않아도 스스로 결과물을 점검한다"고 전해졌다.
비즈니스 자동화 플랫폼 재피어(Zapier)의 수석 엔지니어 다니엘 셰퍼드(Daniel Shepard)는 성명을 통해 "클로드 소넷 5에 두 가지 작업을 동시에 맡겼다. 세일즈포스(Salesforce) 계정 등급 업데이트와 기업 고객 대상 출시 공지 발송이었는데, 처음부터 끝까지 완료해냈다"고 말했다. 그는 "전에는 중간에 멈추곤 했던 작업"이라며 "일상적인 자동화 업무에는 두말할 필요도 없는 선택"이라고 평가했다.
안전성 측면에서도, 소넷 5는 악용 협조나 기만 같은 '바람직하지 않은 행동(undesirable behaviors)'의 발생 빈도가 전작보다 낮아, 에이전트 환경에서 보다 안전하게 활용할 수 있다. 악의적인 요청을 거부하고 프롬프트 인젝션(prompt-injection) 공격 시 하이재킹 시도를 회피하는 능력도 향상됐다. 또한 소넷 4.6 대비 환각(hallucination)과 아첨적(sycophantic) 반응 빈도도 낮아졌다.
다만 오퍼스 4.8 및 클로드 미토스 프리뷰(Claude Mythos Preview)와 비교했을 때는 정렬 오류(misaligned behavior) 방지 측면에서 동일한 수준에는 미치지 못한다. 앤스로픽은 블로그 게시물에서 "평가 결과, 현재 오퍼스 모델들에 비해 위험한 사이버보안 작업을 수행하는 능력이 훨씬 낮은 것으로 나타났다"고 밝혔다.
AI 기반 앱 빌더 러버블(Lovable)의 공동창업자 파비안 헤딘(Fabian Hedin)은 성명에서 클로드 소넷 5가 "안전하지 않은 요청을 명확하고 일관되게 거부한다"고 말했다. 그는 "러버블에서 우리는 수백만 명의 개발자들에게 강력한 도구를 쥐여주고 있다"며 "언제 거절해야 하는지 아는 모델은 어떻게 만들어야 하는지 아는 모델만큼이나 중요하다"고 강조했다.
※ 이 기사는 8월 31일 이후 출력 토큰 가격이 100만 개당 15달러임을 정정한 내용을 반영해 업데이트됐다.