Amazon Polly：释放文本的声音力量

3 9 月, 2025

在当今内容多元化的数字时代，语音正成为信息传播与用户交互的重要载体。无论是有声书、在线学习、短视频配音，还是智能客服系统，文本转语音（TTS）技术的价值日益凸显。而 Amazon Polly，作为 AWS 推出的文本转语音服务，正在为开发者和企业提供自然流畅、低延迟的语音合成能力，让内容真正“开口说话”。

什么是 Amazon Polly？

Amazon Polly 是一项基于深度学习的云服务，支持将文本实时转为高质量语音，输出格式涵盖 MP3、OGG、PCM 等，便于存储与播放。其神经网络语音合成技术（Neural TTS）在语音自然度与情感表达上表现出色，广泛应用于播客、有声读物等场景。

功能亮点

多语言多语音风格：支持 30+ 种语言和 60+ 种声音模型，覆盖中文、英文、日语、韩语等主流语种。
支持 SSML：通过语音合成标记语言，用户可灵活调整语调、重音、语速等细节。
实时与批量处理：既可用于交互式语音应用，也可批量生成内容音频。

应用场景

Amazon Polly 广泛用于教育培训、有声内容、智能客服、无障碍辅助与 IoT 设备，如智能音箱与语音机器人。

与 AWS 生态无缝集成

Polly 可与 Amazon S3、Lambda、Lex 和 CloudFront 等服务协作，实现语音文件存储、自动处理、语音对话和全球内容分发等功能，轻松构建语音驱动型应用。

定价优势

标准语音：$4/百万字符
神经语音：$16/百万字符
新用户每月享有最高 500 万字符的免费额度（限前 12 个月）

选择“在云上”的理由

作为 AWS 授权代理商，“在云上”提供 Polly 开通、使用配置、SSML 定制及技术支持等一站式服务，助您快速上线语音功能，提升数字体验。

欢迎联系我们，让您的内容更有“声音”！

Amazon Polly：释放文本的声音力量

什么是 Amazon Polly？

功能亮点

应用场景

与 AWS 生态无缝集成

定价优势

选择“在云上”的理由

更多探索

AWS S3 存储桶完全指南：从基础配置到生产级应用

Tell me what you need

Amazon Polly：释放文本的声音力量

什么是 Amazon Polly？

功能亮点

应用场景

与 AWS 生态无缝集成

定价优势

选择“在云上”的理由

更多探索

AWS RDS vs Aurora 深度对比：如何选择适合出海业务的数据库？

AWS S3 存储桶完全指南：从基础配置到生产级应用

Tell me what you need