AWS Polly: テキストを読み上げるインテリジェントな音声ソリューション。

インテリジェント音声と人間とコンピュータのインタラクションの急速な発展により、テキスト読み上げ (TTS) テクノロジは企業のデジタル エクスペリエンスの重要な部分になりつつあります。アマゾンポリー AWS が提供する高品質のクラウドベースの音声サービスとして、テキストを自然で流暢な音声にリアルタイムで変換できるため、企業はより人間的でインタラクティブな製品エクスペリエンスを創出できます。

 

Amazon Polly とは何ですか?

Amazon Pollyは、テキストコンテンツをリアルな音声出力に合成するディープラーニングベースのテキスト読み上げサービスです。複数の言語と音声スタイルをサポートしており、音声放送、インテリジェントなカスタマーサービス、教育・トレーニング、メディア放送、アクセシブルな読み上げなど、さまざまなシナリオに適しています。

ニューラル TTS (NTTS) テクノロジーにより、Polly は感情の変化、休止、強勢など人間のイントネーションに非常によく似た音声を生成できるため、より自然で表現力豊かな発話が可能になります。

 

コア機能

1. 高忠実度の音声出力

Amazon Polly は、数十の言語と地域アクセントを網羅した数百種類の音声オプションを提供しています。ユーザーは、対象とする聴衆に合わせて、優しい女性の声、プロフェッショナルな男性の声、元気な子供の声など、音声特性を自由に選択できます。

2. 柔軟な音声カスタマイズ機能

音声合成マークアップ言語 (SSML) の助けを借りて、開発者は発話速度、イントネーション、休止、感情表現を細かく制御できます。

つまり、「システムに話をさせる」だけでなく、「人間のように話をさせる」こともできるのです。

3. リアルタイムモードとオフラインモード

Pollyは低遅延のリアルタイム音声合成をサポートしており、オンラインカスタマーサービスや音声ナビゲーションといった即時にインタラクティブなシナリオに最適です。また、オーディオブック、ポッドキャスト、その他のコンテンツ制作ニーズに対応する音声ファイルのオフライン一括生成もサポートしています。

4. 多言語およびクロスプラットフォームのサポート

グローバルな教育アプリケーションを構築する場合でも、多言語の顧客サービス システムを開発する場合でも、Polly は Web、モバイル、または IoT デバイスにシームレスに統合できるため、企業が国際市場に迅速に参入するのに役立ちます。

5. 高いコストパフォーマンスと従量課金制

Pollyは文字数に応じた課金モデルを採用しているため、ハードウェアの初期費用は不要です。企業は使用量に応じて支出を柔軟に管理できるため、音声合成サービスへの参入障壁が大幅に下がります。

 

典型的なアプリケーションシナリオ

  • インテリジェントな顧客サービスシステムAmazon Lex と Amazon Connect を統合することで、多言語音声対話によるカスタマーサービスを実現し、人間のエージェントの作業負荷を軽減できます。
  • 教育と研修とeラーニング教材やトレーニング コース用の多言語オーディオを迅速に生成し、学習効率を向上させて、より幅広い対象者にリーチします。
  • メディアとコンテンツ制作オーディオニュース、ポッドキャスト、オーディオブックなどのシナリオをサポートし、コンテンツに「サウンド」の次元を与えます。
  • アクセシビリティアプリケーション: 視覚障害のあるユーザーが Web ページやドキュメントを音声で読み上げられるようにし、デジタル アクセシビリティを向上させます。

 

他の AWS サービスとの統合の利点

Polly は、Amazon S3、Lambda、CloudFront、Transcribe、Translate などのサービスと緊密に統合され、完全な音声コンテンツの制作および配信チェーンを構築できます。

たとえば、ユーザーはテキストを S3 に保存し、Polly をトリガーして Lambda 経由で音声を自動的に合成し、それを CloudFront を通じてグローバルに配信して、低レイテンシーのオーディオ再生エクスペリエンスを実現できます。

 

クラウド上

として AWS 公式認定販売代理店当社は、企業が Amazon Polly サービスを迅速に有効化および設定できるよう支援するだけでなく、次のような業界の特性に合わせたワンストップソリューションサポートも提供しています。

  • 音声サービス アーキテクチャの設計とコストの最適化。
  • さまざまなシナリオにおける多言語音声合成の応用。
  • Amazon Bedrock や SageMaker などの AI サービスを組み合わせてインテリジェントな音声システムを構築します。
  • アカウント登録、請求管理、ローカライズされたテクニカル サポート。

AWS Polly を使用すると、企業は言葉を「話す」だけでなく、ブランドを「伝える」こともできます。

当社は、お客様が AWS クラウド AI 機能を最大限に活用し、音声合成テクノロジーが真にビジネス革新に貢献し、ユーザーエクスペリエンスを向上できるよう支援することに尽力しています。

オンクラウド — 信頼できる AWS クラウド サービス リセラー。

当社は、Amazon Polly、Amazon Bedrock、SageMaker、Transcribe などの幅広い AI サービス ソリューションを提供し、企業のインテリジェントな変革の実現を支援します。

さらに詳しく

何が必要か教えてください