Amazon Bedrock の Claude 3.5 モデルシリーズの 3 つの新機能

Amazon Bedrock で導入された Anthropic の Claude 3.5 は、Claude 3 Sonnet の速度とコストを維持しながら、AI モデル インテリジェンスの業界標準を高めます。この記事では、Amazon Bedrock の Claude 3.5 モデル シリーズの 3 つの新機能を紹介します。

アップグレードされたクロード 3.5 ソネット

以前のモデルの長所を基に構築され、同じコストでインテリジェンスが向上した、アップグレードされた Claude 3.5 Sonnet モデルにアクセスできるようになりました。 Claude 3.5 Sonnet は、実際のソフトウェア エンジニアリング タスクを解決し、複雑なエージェント ワークフローに従う能力を継続的に向上させています。 Claude 3.5 Sonnet のアップグレード バージョンは、初期設計からバグ修正、メンテナンス、最適化まで、ソフトウェア開発ライフ サイクル全体を完了するのに役立ちます。これらの機能により、アップグレードされた Claude 3.5 Sonnet モデルは、温かみのある人間のような口調の、より高度なチャットボットの構築に役立ちます。アップグレードされたモデルが優れているその他のユースケースとしては、知識質問応答プラットフォーム、チャートや図などのビジュアルからのデータの抽出、反復的なタスクと操作の自動化などがあります。

コンピュータの使用– クロード 3.5 ソネット

現在 Amazon Bedrock でパブリックベータ版として利用可能なコンピュータ使用機能により、Claude はコンピュータインターフェースを感知して操作できるようになります。開発者は、画面を見て、カーソルを動かし、ボタンをクリックし、テキストを入力するなど、人間と同じようにコンピューターを使用するようにクロードに指示できます。これは、キーストロークやマウスのクリックなどのコンピューター操作を返したり、テキストファイルを編集したり、シェルコマンドを実行したりできる統合ツールへのアクセス権をモデルに付与することによって実現されます。ソフトウェア開発者は、アクション実行レイヤーを構築し、Claude 3.5 Sonnet 画面アクセス権限を付与することで、コンピューターの使用をソリューションに統合できます。このようにして、ソフトウェア開発者は、コンピューター操作を実行し、複数の手順を実行し、その結果を確認する機能を備えたアプリケーションを構築できます。コンピュータの使用により、人工知能の応用に新たな可能性が開かれました。たとえば、ソフトウェアのテストやバックグラウンド タスクを自動化したり、アプリケーションと対話できるより高度なソフトウェア アシスタントを有効にしたりすることができます。このテクノロジーはまだ初期段階にあるため、開発者はリスクの低いタスクを調査し、サンドボックス環境で使用することをお勧めします。

 

クロード 3.5 俳句

新しい Claude 3.5 Haiku は、高速な応答時間と改善された推論機能を兼ね備えており、スピードとインテリジェンスが求められるタスクに最適です。 Claude 3.5 Haiku は前モデルから改良されており、Claude 3 Opus (以前の Claude の最大モデル) とパフォーマンスが同等です。 Claude 3.5 Haiku は、高速で正確なコード提案、顧客サービス、電子商取引ソリューション、教育プラットフォームに対する迅速な応答を必要とする高度にインタラクティブなチャットボットなどのユースケースに役立ちます。金融、医療、研究などの分野で大量の非構造化データを扱う顧客にとって、Claude 3.5 Haiku は情報を効率的に処理および分類するのに役立ちます。

Anthropic によれば、アップグレードされた Claude 3.5 Sonnet は、以前のモデルに比べて全体的に改善されており、すでに優れている分野であるエンコードの分野でも顕著な進歩が見られます。アップグレードされた Claude 3.5 Sonnet は、業界のベンチマーク テストで大幅な改善を示しました。エンコーディングに関しては、33% から 49% によって検証された SWE-bench のパフォーマンスが向上し、公開されているすべてのモデルよりも高いスコアを獲得しました。また、プロキシツール使用タスクである TAU-bench のパフォーマンスも、小売分野では 62.6% から 69.2% に、航空分野では 36.0% から 46.0% に向上しました。以下の表には、Anthropic によって提供されたモデル評価が含まれています。

 

Claude 3.5 Sonnet アップグレードレビュー

 

コンピュータの使用、AIインタラクションの新たなフロンティア

モデルを API の使用に限定するのではなく、Claude はさまざまな標準ツールとソフトウェア プログラムを使用するための一般的なコンピューター スキルのトレーニングを受けました。これにより、アプリケーションは Claude を使用してコンピューター インターフェイスを感知し、対話できるようになります。ソフトウェア開発者は、この API を統合して、Claude がプロンプトを特定のコンピュータ コマンド (ブラウザーを開く、この Web サイトを参照するなど) に変換できるようにすることができます。

具体的には、モデルを呼び出すときに、ソフトウェア開発者は、コンピューターを操作するための仮想ハンドのセットを提供する 3 つの新しい統合ツールを使用できるようになりました。

  • コンピュータツール– このツールは、スクリーンショットと目標を入力として受け取り、その目標を達成するために実行する必要があるマウスとキーボードのアクションの説明を返します。たとえば、このツールでは、カーソルを特定の場所に移動したり、クリックしたり、入力したり、スクリーンショットを撮ったりすることが必要になる場合があります。
  • テキストエディタツール-- このツールを使用すると、モデルはファイルの内容の表示、新しいファイルの作成、テキストの置換、編集の取り消しなどのアクションを要求できます。
  • Bashツール-- このツールは、ユーザーが端末に入力したものと同じ低レベルで対話するためにコンピュータ システムで実行できるコマンドを返します。

 

これらのツールは、データ分析やソフトウェアのテストからコンテンツの作成やシステム管理に至るまで、複雑なタスクを自動化する無限の可能性を切り開きます。 Claude 3.5 Sonnet を搭載したアプリケーションは、端末、テキスト エディター、インターネット ブラウザーなどのさまざまなデスクトップ ツールを操作したり、フォームに入力したり、コードをデバッグしたりしながら、人間と同じようにコンピューターと対話できます。

実際のコンピュータ環境でのマルチモーダルエージェントのベンチマークである OSWorld では、アップグレードされた Claude 3.5 Sonnet は現在 14.9% のスコアを獲得しています。人間レベルのスキルは 70 ~ 751 TP3T 程度のスコアではるかに上回っていますが、この結果は、同じカテゴリで 2 番目に優れたモデルが獲得した 7.71 TP3T よりもはるかに優れています。

Amazon Bedrock コンソールで Claude 3.5 の全機能を体験してください

Claude 3.5 Sonnet のアップグレード バージョンにアクセスするには、Amazon Bedrock コンソールにログインする必要があります。ユーザーは、コンソールのモデル アクセス セクションに移動し、Claude 3.5 Sonnet V2 へのアクセスを要求することで、この次世代の強力な AI モデルのテストと統合を開始できます。開発者は、コンピュータの使用機能と複数のツール (コンピュータ ツール、テキスト エディター ツール、Bash ツール) を活用して、さまざまな新しいユース ケースとソリューションを検討することもできます。これらの機能は開発プロセスを簡素化するだけでなく、ビジネスの自動化と効率性も向上させます。

要約する

Amazon Bedrock によって導入されたアップグレードされた Claude 3.5 モデル シリーズは、インテリジェンスとパフォーマンスが大幅に進歩するだけでなく、コンピューティングの利用や推論機能の強化などの革新的な機能を通じて AI の範囲をさらに拡大します。ソフトウェア エンジニアリング、ビジネス自動化、複雑なデータ処理タスクなど、Claude 3.5 Sonnet と Claude 3.5 Haiku は、開発者と企業に強力なツールとソリューションを提供します。 AI技術の継続的な発展に伴い、Claude 3.5の応用展望は間違いなく広がり、さまざまな業界のデジタル変革に貢献するでしょう。

 

さらに詳しく

何が必要か教えてください