現在、Claude 3.5 モデルの今後のシリーズの最初のモデルである Claude 3.5 Sonnet が発売されています。 Claude 3.5 Sonnet は、さまざまな評価において競合モデルや Claude 3 Opus を上回り、業界のインテリジェンスの基準を引き上げました。また、速度とコストの面では中級モデルである Claude 3 Sonnet に匹敵します。私たちオンクラウドAIこの記事は、Claude 3.5 を詳細に理解するのに役立ちます。
Claude 3.5 Sonnet は現在、Claude.ai および Claude iOS アプリで無料でご利用いただけます。また、Claude Pro および Team プランの加入者は、より高いレート制限でアクセスできます。 Anthropic API、Amazon Bedrock、Google Cloud の Vertex AI からも利用できます。このモデルのコストは、20 万トークンのコンテキスト ウィンドウの場合、入力トークン 100 万個あたり 3 ドル、出力トークン 100 万個あたり 15 ドルです。
最先端の情報を2倍速く入手
Claude 3.5 Sonnet は、大学院レベルの推論能力 (GPQA)、学部レベルの知識 (MMLU)、およびコーディング能力 (HumanEval) に関する新たな業界ベンチマークを設定しました。ニュアンス、ユーモア、複雑な指示を理解する能力が大幅に向上し、自然で親しみやすい口調で高品質なコンテンツを書く能力に優れています。
Claude 3.5 Sonnet は、Claude 3 Opus の 2 倍の速度で動作します。このパフォーマンスの向上と手頃な価格の組み合わせにより、Claude 3.5 Sonnet は、状況に応じた顧客サポートや複数ステップのワークフローの調整などの複雑なタスクに最適です。
内部プロキシコーディング評価では、Claude 3.5 Sonnet は 64% を解き、これは Claude 3 Opus (38% を解いた) よりも優れていました。私たちの評価では、望ましい改善点の自然言語による説明を与えられた場合に、バグを修正したりオープンソース コードベースに機能を追加したりするモデルの能力をテストします。ガイダンスとツールが提供されると、Claude 3.5 Sonnet は、高度な推論機能とトラブルシューティング機能を使用して、コードを独自に記述、編集、実行できます。コードの移行を簡単に処理できるため、レガシー アプリケーションの更新やコード ベースの移行に最適です。
最先端のビジョン
Claude 3.5 Sonnet は、標準的な視覚ベンチマークで Claude 3 Opus を上回る強力な視覚モデルです。これらの段階的な改善は、チャートやグラフの解釈など、視覚的な推論を必要とするタスクで最も顕著に表れます。 Claude 3.5 Sonnet は、不完全な画像からテキストを正確に書き写すこともできます。これは、AI がテキストのみよりも画像、グラフィック、イラストからより多くの洞察を得ることができる小売、物流、金融サービスにとってのコア機能です。
アーティファクト - クロードの新しい使い方
Claude.ai は、ユーザーが Claude と対話する方法を拡張する新しい機能である Artifacts を導入しました。ユーザーが Claude にコード スニペット、テキスト ドキュメント、Web サイトのデザインなどを生成するように依頼すると、これらの成果物がダイアログとともに専用のウィンドウに表示されます。これにより、動的なワークスペースが作成され、ユーザーは Claude の作品をリアルタイムで表示、編集、構築することができ、AI によって生成されたコンテンツをプロジェクトやワークフローにシームレスに統合できます。
このプレビュー機能は、Claude が会話型 AI から共同作業環境へと進化したことを示しています。これは Claude.ai のより広範なビジョンのほんの始まりに過ぎず、すぐにチームコラボレーションのサポートへと拡大される予定です。近い将来、チーム(そして最終的には組織全体)は、知識、ドキュメント、進行中の作業を共有スペースに安全にまとめることができ、Claude はいつでも対応可能なチームメイトとして機能します。
近日公開
チームの目標は、数か月ごとにインテリジェンス、速度、コストの間のトレードオフ曲線を大幅に改善することです。 Claude 3.5 モデルシリーズを完成させるため、チームは今年後半に Claude 3.5 Haiku と Claude 3.5 Opus をリリースする予定です。
次世代モデル ファミリの開発に加えて、エンタープライズ アプリケーションとの統合など、より多くのエンタープライズ ユース ケースをサポートするための新しいモードと機能も開発されています。チームはまた、メモリなどの機能も検討しています。これにより、Claude はユーザーの好みや特定のインタラクション履歴を記憶し、ユーザー エクスペリエンスをよりパーソナライズして効率的にすることができます。