<3줄 요약>

  • Anthropic이 업그레이드된 Claude 3.5 Sonnet과 새로운 모델 Claude 3.5 Haiku를 소개
  • Claude 3.5 Sonnet은 코딩 등의 능력이 크게 향상되었고, Claude 3.5 Haiku는 비용과 속도 면에서 우수
  • 이와 함께 실험적인 컴퓨터 사용 기능을 베타 공개하며, 개발자들의 피드백을 기다리고 있음

소프트웨어 엔지니어링 분야의 선두주자, Claude 3.5 Sonnet

  • SWE-bench Verified 벤치마크에서 성능이 33.4%에서 49.0%로 향상되어 공개된 모델 중 가장 높은 점수
  • TAU-bench 벤치마크에서도 소매 도메인은 62.6%에서 69.2%, 항공 도메인은 36.0%에서 46.0%로 개선
  • GibLab, Cognition, The Browser Company 등 주요 고객들이 새로운 Claude 3.5 Sonnet의 성능을 높이 평가

가성비와 속도를 겸비한 최신 기술, Claude 3.5 Haiku

  • Claude 3 Opus를 능가하는 성능을 같은 비용과 유사한 속도로 제공
  • 특히 코딩 과제에서 뛰어난 성과를 보이며, SWE-bench Verified에서 40.6% 기록

AI 시스템의 컴퓨터 사용 기능 베타 공개

  • 사람과 같은 방식으로 화면을 보고, 커서를 움직이고, 버튼을 클릭하는 등의 기능 제공
  • 개발자들이 반복적인 작업 자동화, 소프트웨어 구축 및 테스트, 개방형 과제 수행 등에 활용할 수 있음
  • 현재 기능은 아직 실험적이며 오류가 발생할 수 있으므로, 개발자들의 피드백을 통해 지속적으로 개선해 나갈 계획

출처:

※ 본 내용은 생성 AI를 사용하여 요약했습니다. 요약이 부족할 수 있으니 세부 내용은 출처의 원본을 참고하세요.