Amazon Bedrock에 도입된 Anthropic의 Claude 3.5는 Claude 3 Sonnet의 속도와 비용을 유지하면서도 AI 모델 인텔리전스의 산업 표준을 높였습니다. 이 기사에서는 Amazon Bedrock의 Claude 3.5 모델 시리즈의 세 가지 새로운 기능을 소개합니다.
업그레이드된 클로드 3.5 소넷
이제 이전 모델의 장점을 바탕으로 동일한 비용으로 더욱 향상된 지능을 제공하는 업그레이드된 Claude 3.5 Sonnet 모델을 이용할 수 있습니다. Claude 3.5 Sonnet은 실제 소프트웨어 엔지니어링 작업을 해결하고 복잡한 에이전트 워크플로를 따르는 능력을 지속적으로 개선하고 있습니다. Claude 3.5 Sonnet의 업그레이드된 버전은 초기 설계부터 버그 수정, 유지 관리 및 최적화까지 전체 소프트웨어 개발 라이프사이클을 완료하는 데 도움이 될 수 있습니다. 이러한 기능을 통해 업그레이드된 Claude 3.5 Sonnet 모델은 따뜻하고 인간적인 톤을 제공하는 더욱 진보된 챗봇을 구축하는 데 도움이 될 수 있습니다. 업그레이드된 모델이 탁월한 효과를 발휘하는 다른 사용 사례로는 지식 기반 질의응답 플랫폼, 차트와 다이어그램과 같은 시각적 자료에서 데이터 추출, 반복적인 작업과 운영의 자동화 등이 있습니다.
컴퓨터 사용– 클로드 3.5 소네트
현재 Amazon Bedrock에서 공개 베타 버전으로 제공되는 컴퓨터 사용 기능을 통해 클로드는 컴퓨터 인터페이스를 감지하고 상호 작용할 수 있습니다. 개발자는 클로드에게 사람과 같은 방식으로 컴퓨터를 사용하도록 지시할 수 있습니다. 즉, 화면을 보고, 커서를 움직이고, 버튼을 클릭하고, 텍스트를 입력하도록 지시할 수 있습니다. 이는 키 입력 및 마우스 클릭과 같은 컴퓨터 작업을 반환하고, 텍스트 파일을 편집하고, 셸 명령을 실행할 수 있는 통합 도구에 모델에 대한 액세스를 제공함으로써 달성됩니다. 소프트웨어 개발자는 작업 실행 계층을 구축하고 Claude 3.5 Sonnet 화면 액세스 권한을 부여하여 컴퓨터 사용을 솔루션에 통합할 수 있습니다. 이런 방식으로 소프트웨어 개발자는 컴퓨터 작업을 수행하고 여러 단계를 따르고 결과를 확인할 수 있는 애플리케이션을 구축할 수 있습니다. 컴퓨터의 사용은 인공지능 응용 분야에 새로운 가능성을 열어주었습니다. 예를 들어, 소프트웨어 테스트와 백그라운드 작업을 자동화하고, 애플리케이션과 상호 작용할 수 있는 더욱 고급 소프트웨어 지원을 활성화하는 데 도움이 될 수 있습니다. 이 기술이 아직 초기 단계이므로 개발자는 위험도가 낮은 작업을 탐색하고 샌드박스 환경에서 사용하는 것이 좋습니다.
클로드 3.5 하이쿠
새로운 Claude 3.5 Haiku는 빠른 응답 시간과 향상된 추론 기능을 결합하여 속도와 지능이 필요한 작업에 이상적입니다. Claude 3.5 Haiku는 이전 모델보다 개선되었으며 Claude 3 Opus(이전 Claude의 가장 큰 모델)와 성능이 비슷합니다. Claude 3.5 Haiku는 빠르고 정확한 코드 제안, 고객 서비스에 대한 빠른 응답이 필요한 높은 상호 작용성을 갖춘 챗봇, 전자 상거래 솔루션, 교육 플랫폼과 같은 사용 사례에 도움이 될 수 있습니다. 금융, 의료, 연구 등 분야에서 대량의 비정형 데이터를 다루는 고객의 경우, Claude 3.5 Haiku는 정보를 효율적으로 처리하고 분류하는 데 도움이 될 수 있습니다.
Anthropic에 따르면, 업그레이드된 Claude 3.5 Sonnet은 이전 모델에 비해 전반적으로 개선되었으며, 이미 탁월한 성능을 발휘하고 있는 인코딩 분야에서 눈에 띄는 발전이 이루어졌습니다. 업그레이드된 Claude 3.5 Sonnet은 업계 벤치마크 테스트에서 광범위한 개선을 보였습니다. 인코딩 측면에서는 33%에서 49%로 검증된 SWE-bench에서의 성능이 향상되어 공개적으로 사용 가능한 모든 모델보다 높은 점수를 받았습니다. 또한, 프록시 도구 사용 작업인 TAU-bench의 성능이 소매 도메인에서는 62.6%에서 69.2%로, 항공 도메인에서는 36.0%에서 46.0%로 향상되었습니다. 아래 표에는 Anthropic에서 제공한 모델 평가가 포함되어 있습니다.
컴퓨터 사용, AI 상호작용의 새로운 전선
클로드는 모델을 API 사용으로 제한하지 않고 다양한 표준 도구와 소프트웨어 프로그램을 사용할 수 있도록 일반적인 컴퓨터 기술을 훈련받았습니다. 이를 통해 애플리케이션은 Claude를 사용하여 컴퓨터 인터페이스를 감지하고 상호 작용할 수 있습니다. 소프트웨어 개발자는 이 API를 통합하여 클로드가 프롬프트를 특정 컴퓨터 명령(브라우저 열기, 이 웹사이트 탐색 등)으로 변환할 수 있도록 할 수 있습니다.
보다 구체적으로, 모델을 호출할 때 소프트웨어 개발자는 이제 컴퓨터를 작동하기 위한 가상 손 세트를 제공하는 세 가지 새로운 통합 도구를 사용할 수 있습니다.
- 컴퓨터 도구– 이 도구는 스크린샷과 목표를 입력으로 받고 해당 목표를 달성하기 위해 수행해야 하는 마우스 및 키보드 동작에 대한 설명을 반환합니다. 예를 들어, 이 도구를 사용하려면 커서를 특정 위치로 옮기고, 클릭하고, 입력하고, 스크린샷을 찍어야 할 수도 있습니다.
- 텍스트 편집기 도구-- 이 도구를 사용하면 모델은 파일 내용 보기, 새 파일 만들기, 텍스트 바꾸기, 편집 취소 등의 작업을 요청할 수 있습니다.
- 배시 도구-- 이 도구는 사용자가 터미널에 입력한 내용보다 하위 수준에서 상호 작용할 수 있는 컴퓨터 시스템에서 실행할 수 있는 명령을 반환합니다.
이러한 도구는 데이터 분석, 소프트웨어 테스트부터 콘텐츠 생성, 시스템 관리까지 복잡한 작업을 자동화할 수 있는 무한한 가능성을 열어줍니다. Claude 3.5 Sonnet 기반의 애플리케이션은 터미널, 텍스트 편집기, 인터넷 브라우저, 양식 작성, 심지어 코드 디버깅을 포함한 다양한 데스크톱 도구를 사용하여 사람과 마찬가지로 컴퓨터와 상호 작용할 수 있습니다.
실제 컴퓨터 환경에서 멀티모달 에이전트를 위한 벤치마크인 OSWorld에서 업그레이드된 Claude 3.5 Sonnet은 현재 14.9%의 점수를 받았습니다. 인간 수준의 기술은 70-751 TP3T를 기록하며 훨씬 앞서 있지만, 이 결과는 같은 범주에서 두 번째로 좋은 모델이 얻은 7.71 TP3T보다 훨씬 더 좋습니다.
Amazon Bedrock 콘솔에서 Claude 3.5의 모든 기능을 경험해 보세요.
Claude 3.5 Sonnet의 업그레이드 버전에 액세스하려면 Amazon Bedrock 콘솔에 로그인해야 합니다. 사용자는 콘솔의 모델 액세스 섹션으로 이동하여 Claude 3.5 Sonnet V2에 대한 액세스를 요청하여 차세대 강력한 AI 모델을 테스트하고 통합할 수 있습니다. 개발자는 자신의 컴퓨터 사용 능력과 여러 도구(컴퓨터 도구, 텍스트 편집 도구, Bash 도구)를 활용하여 다양한 새로운 사용 사례와 솔루션을 탐색할 수도 있습니다. 이러한 기능은 개발 프로세스를 단순화할 뿐만 아니라, 비즈니스 자동화와 효율성도 향상시킵니다.
요약하다
Amazon Bedrock이 출시한 업그레이드된 Claude 3.5 모델 시리즈는 지능과 성능 면에서 상당한 발전을 이루었을 뿐만 아니라, 컴퓨팅 활용 및 향상된 추론 기능과 같은 혁신적인 기능을 통해 AI의 범위를 더욱 확장했습니다. Claude 3.5 Sonnet과 Claude 3.5 Haiku는 소프트웨어 엔지니어링, 비즈니스 자동화, 복잡한 데이터 처리 작업 등 개발자와 기업을 위한 강력한 도구와 솔루션을 제공합니다. AI 기술의 지속적인 발전에 따라, 클로드 3.5의 적용 전망은 의심할 여지 없이 더욱 광범위해지고, 다양한 산업의 디지털 전환에 기여할 것입니다.