AWS Polly: 텍스트를 말로 표현하는 지능형 음성 솔루션입니다.

지능형 음성 및 인간-컴퓨터 상호작용의 급속한 발전으로 인해 텍스트-음성 변환(TTS) 기술이 기업 디지털 경험의 중요한 부분이 되고 있습니다.아마존 폴리 AWS가 제공하는 고품질 클라우드 기반 음성 서비스로, 텍스트를 실시간으로 자연스럽고 유창한 음성으로 변환하여 기업이 보다 인간적이고 대화형 제품 경험을 창출하는 데 도움이 됩니다.

 

Amazon Polly란 무엇인가요?

Amazon Polly는 텍스트 콘텐츠를 사실적인 음성 출력으로 합성하는 딥 러닝 기반 텍스트 음성 변환 서비스입니다. 여러 언어와 음성 스타일을 지원하여 음성 방송, 지능형 고객 서비스, 교육 및 훈련, 미디어 방송, 접근성 높은 독서 등 다양한 시나리오에 적합합니다.

폴리는 신경망 음성 합성 기술(NTTS) 기술을 통해 감정 변화, 멈춤, 강세 등을 포함하여 인간의 음조와 매우 유사한 음성을 생성하여 말을 더 자연스럽고 표현력이 풍부하게 만들어줍니다.

 

핵심 기능

1. 고음질 음성 출력

Amazon Polly는 수십 개의 언어와 지역 억양을 지원하는 수백 가지 음성 옵션을 제공합니다. 사용자는 부드러운 여성 음성, 전문적인 남성 음성, 활기찬 어린이 음성 등 대상 고객에 따라 음성 특성을 자유롭게 선택할 수 있습니다.

2. 유연한 음성 사용자 정의 기능

개발자는 음성 합성 마크업 언어(SSML)의 도움으로 음성 속도, 억양, 멈춤, 감정 표현을 세밀하게 제어할 수 있습니다.

즉, "시스템을 말하게 만들 수 있을 뿐만 아니라" "시스템이 사람처럼 말하게 만들 수도 있다"는 뜻입니다.

3. 실시간 및 오프라인 모드

Polly는 저지연 실시간 음성 합성을 지원하여 온라인 고객 서비스 및 음성 내비게이션과 같은 즉각적인 상호작용 시나리오에 적합합니다. 또한 오디오북, 팟캐스트 또는 기타 콘텐츠 제작을 위한 음성 파일의 오프라인 일괄 생성도 지원합니다.

4. 다국어 및 크로스 플랫폼 지원

글로벌 교육용 애플리케이션을 구축하든 다국어 고객 서비스 시스템을 개발하든 Polly는 웹, 모바일 또는 IoT 기기에 완벽하게 통합되어 기업이 신속하게 국제 시장에 진출하는 데 도움이 됩니다.

5. 높은 비용 대비 성능 비율과 사용량에 따른 결제 방식

폴리는 문자당 과금 모델을 사용하여 초기 하드웨어 비용이 필요하지 않습니다. 기업은 사용량에 따라 지출을 유연하게 조절할 수 있어 음성 합성 서비스 진입 장벽을 크게 낮출 수 있습니다.

 

일반적인 응용 프로그램 시나리오

  • 지능형 고객 서비스 시스템Amazon Lex와 Amazon Connect를 통합하면 다국어 음성 상호작용 고객 서비스를 구현하여 상담원의 업무 부담을 줄일 수 있습니다.
  • 교육 및 훈련 및 e-러닝교육 자료나 교육 과정을 위한 다국어 오디오를 빠르게 생성하여 학습 효율성을 높이고 더 많은 청중에게 다가갈 수 있습니다.
  • 미디어 및 콘텐츠 제작오디오 뉴스, 팟캐스트, 오디오북과 같은 시나리오를 지원하여 콘텐츠에 "사운드" 차원을 부여합니다.
  • 접근성 애플리케이션: 시각 장애인 사용자가 웹 페이지와 문서를 소리내어 읽을 수 있도록 돕고, 이를 통해 디지털 접근성을 개선합니다.

 

다른 AWS 서비스와의 통합 이점

Polly는 Amazon S3, Lambda, CloudFront, Transcribe, Translate 등의 서비스와 긴밀하게 통합되어 완전한 음성 콘텐츠 제작 및 배포 체인을 구축할 수 있습니다.

예를 들어, 사용자는 S3에 텍스트를 저장하고, Lambda를 통해 Polly가 자동으로 음성을 합성하도록 한 다음, CloudFront를 통해 전 세계에 배포하여 지연 시간이 짧은 오디오 재생 환경을 구현할 수 있습니다.

 

클라우드에서

처럼 AWS 공식 공인 리셀러Amazon Polly는 기업이 Amazon Polly 서비스를 신속하게 활성화하고 구성하는 데 도움을 줄 뿐만 아니라, 다음을 포함하여 업계 특성에 맞춰진 원스톱 솔루션 지원을 제공합니다.

  • 음성 서비스 아키텍처 설계 및 비용 최적화
  • 다양한 시나리오에서 다국어 음성 합성의 적용
  • Amazon Bedrock, SageMaker 등의 AI 서비스를 결합하여 지능형 음성 시스템을 구축합니다.
  • 계정 등록, 청구 관리, 현지 기술 지원.

AWS Polly를 사용하면 기업은 단순히 말을 '하는' 것이 아니라 브랜드를 '소리로 표현할' 수도 있습니다.

AWS는 고객이 AWS 클라우드 AI 기능을 최대한 활용하여 음성 합성 기술을 통해 진정한 비즈니스 혁신을 이루고 사용자 경험을 개선할 수 있도록 지원하는 데 전념하고 있습니다.

온클라우드 — 신뢰할 수 있는 AWS 클라우드 서비스 리셀러입니다.

Amazon Polly, Amazon Bedrock, SageMaker, Transcribe를 비롯한 다양한 AI 서비스 솔루션을 제공하여 기업이 지능적인 변혁을 달성할 수 있도록 지원합니다.

더 탐험할 것

당신이 필요한 것을 말해