<3줄 요약>
- 엔비디아, 라마 3.1-네모트론-70B-인스트럭트 LLM 공개
- 주요 벤치마크에서 GPT-4와 클로드 3.5 소네트 능가하는 성능 입증
- 자사 플랫폼 통한 무료 제공으로 AI 생태계 주도권 확보 노림
최신 LLM 공개 배경
- 2024년 10월 16일 허깅페이스 통해 신규 모델 출시
- 라마 3.1 기반으로 RLHF와 고품질 데이터셋으로 미세조정 진행
- 추가 프롬프트나 특수 토큰 없이 복잡한 쿼리 처리 가능
뛰어난 성능 지표
- 아레나 하드벤치: 85.0점 기록
- 알파카이벨 2 LC: 57.6점 달성
- GPT-4-터보 MT-벤치: 8.98점 획득
- 현존하는 최고 성능의 AI 모델들 상회하는 수치 기록
엔비디아의 AI 전략
- NVLM-D-72B 멀티모달 모델 선제 공개로 시장 반응 탐색
- 자사 인프라에 최적화된 모델 무료 제공으로 생태계 확장
- CUDA 플랫폼 전략과 유사한 시장 지배력 확보 포석
비용 효율성과 접근성
- 무료 사용 가능한 플랫폼 제공으로 진입장벽 낮춤
- 높은 성능과 경제성 동시 확보
- 기업들의 AI 도입 비용 부담 경감 효과 기대
출처
엔비디아, 오픈AI·앤트로픽 능가하는 LLM 공개...모델 중심 생태계 구축하나
이달 초 대형멀티모달모델(LMM)을 공개하며 오픈AI 등과 모델 경쟁을 선언한 엔비디아가 이번에는 대형언어모델(LLM)을 내놓았다. 이번에는 벤치마크에서 오픈AI의 'GPT-4o'와 앤트로픽의 '클로드 3.5 소네트'를 제치고 최고 점수를 기록했다고 밝혔다.벤처비트는 16일(현지시간) 엔비디아가 별 홍보 없이 허깅페이스를 통해 '라마 3.1-네모트론-70B-인스트럭트(Llama-3.1-Nemotron-70B-Instruct)'를 출시했다고 보도했다. 이 모델은 엔비디아 전용 플랫폼에서 무료로 사용해 볼 수 있다.엔비디아는 모델 개발
AI타임스 (www.aitimes.com)
※ 본 내용은 생성AI를 사용하여 요약했습니다. 요약이 부족할 수 있으니 세부 내용은 출처의 원본을 참고하세요.