<3줄 요약>
- Anthropic이 업그레이드된 Claude 3.5 Sonnet과 새로운 모델 Claude 3.5 Haiku를 소개
- Claude 3.5 Sonnet은 코딩 등의 능력이 크게 향상되었고, Claude 3.5 Haiku는 비용과 속도 면에서 우수
- 이와 함께 실험적인 컴퓨터 사용 기능을 베타 공개하며, 개발자들의 피드백을 기다리고 있음
소프트웨어 엔지니어링 분야의 선두주자, Claude 3.5 Sonnet
- SWE-bench Verified 벤치마크에서 성능이 33.4%에서 49.0%로 향상되어 공개된 모델 중 가장 높은 점수
- TAU-bench 벤치마크에서도 소매 도메인은 62.6%에서 69.2%, 항공 도메인은 36.0%에서 46.0%로 개선
- GibLab, Cognition, The Browser Company 등 주요 고객들이 새로운 Claude 3.5 Sonnet의 성능을 높이 평가
가성비와 속도를 겸비한 최신 기술, Claude 3.5 Haiku
- Claude 3 Opus를 능가하는 성능을 같은 비용과 유사한 속도로 제공
- 특히 코딩 과제에서 뛰어난 성과를 보이며, SWE-bench Verified에서 40.6% 기록
AI 시스템의 컴퓨터 사용 기능 베타 공개
- 사람과 같은 방식으로 화면을 보고, 커서를 움직이고, 버튼을 클릭하는 등의 기능 제공
- 개발자들이 반복적인 작업 자동화, 소프트웨어 구축 및 테스트, 개방형 과제 수행 등에 활용할 수 있음
- 현재 기능은 아직 실험적이며 오류가 발생할 수 있으므로, 개발자들의 피드백을 통해 지속적으로 개선해 나갈 계획
출처:
Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku
A refreshed, more powerful Claude 3.5 Sonnet, Claude 3.5 Haiku, and a new experimental AI capability: computer use.
(www.anthropic.com)
※ 본 내용은 생성 AI를 사용하여 요약했습니다. 요약이 부족할 수 있으니 세부 내용은 출처의 원본을 참고하세요.