Amazon Polly: テキストの音声を解き放つ

多様なコンテンツが溢れる今日のデジタル時代において、音声は情報発信とユーザーインタラクションの重要な手段となりつつあります。オーディオブック、オンライン学習、ショートビデオの吹き替え、インテリジェントなカスタマーサービスシステムなど、音声合成(TTS)技術の価値はますます高まっています。AWSの音声合成サービスであるAmazon Pollyは、開発者や企業に自然でスムーズ、かつ低遅延の音声合成機能を提供し、コンテンツを真に「話す」ことを可能にします。

 

Amazon Polly とは何ですか?

Amazon Pollyは、テキストを高品質な音声にリアルタイムで変換するディープラーニングベースのクラウドサービスです。出力形式はMP3、OGG、PCMに対応しており、保存と再生が容易です。ニューラルテキスト読み上げ(Neural TTS)技術は、自然さと感情表現に優れており、ポッドキャスト、オーディオブックなど、様々な用途で広く利用されています。

 

特集のハイライト

  • 多言語・多声スタイル: 中国語、英語、日本語、韓国語などの主流言語を含む 30 以上の言語と 60 以上の音声モデルをサポートします。
  • SSMLのサポート: 音声合成マークアップ言語を通じて、ユーザーはイントネーション、強勢、話す速度などの詳細を柔軟に調整できます。
  • リアルタイムおよびバッチ処理: インタラクティブ音声アプリケーションやコンテンツオーディオのバッチ生成に使用できます。

 

アプリケーションシナリオ

Amazon Polly は、教育やトレーニング、オーディオコンテンツ、インテリジェントな顧客サービス、アクセシビリティ支援、スマートスピーカーや音声ロボットなどの IoT デバイスで広く使用されています。

 

AWSエコシステムとのシームレスな統合

Polly は、Amazon S3、Lambda、Lex、CloudFront などのサービスと連携して、音声ファイルの保存、自動処理、音声対話、グローバルなコンテンツ配信を可能にし、音声駆動型アプリケーションを簡単に構築できます。

 

価格優位性

  • 標準音声:$4/百万文字
  • ニューラルボイス:$16/百万文字
  • 新規ユーザーは、毎月最大500万文字まで無料でご利用いただけます(最初の12か月間限定)

 

「クラウド」を選択する理由

「オンザクラウド」はAWS認定代理店として、Pollyのアクティベーション、利用設定、SSMLのカスタマイズ、技術サポートなどのワンストップサービスを提供し、音声機能を迅速に立ち上げ、デジタルエクスペリエンスを向上させるお手伝いをします。

あなたのコンテンツをもっと「声」あるものにするために、ぜひお問い合わせください。

さらに詳しく

何が必要か教えてください