Amazon, 대화형 AI 경험을 주도하는 혁신적인 음성 기반 모델인 Amazon Nova Sonic 출시

2025년 4월 11일

지난 10년 동안 Amazon은 최첨단 음성 기술 분야에 깊이 관여하면서 대화형 인공 지능의 발전에 지속적으로 박차를 가해왔습니다. Amazon Alexa와 같은 세계적으로 유명한 지능형 음성 비서부터 Amazon Lex, Amazon Polly, Amazon Connect와 같은 일련의 클라우드 서비스에 이르기까지 Amazon은 실제 비즈니스에서 음성 AI의 구현과 혁신을 지속적으로 촉진하고 있습니다.

하지만 음성 AI가 기업과 사용자에게 진정한 가치를 창출하려면 단어의 의미에만 의존하는 것만으로는 충분하지 않습니다. 인간의 의사소통에서 톤, 억양, 리듬과 같은 언어적 맥락 요소는 의도와 감정을 표현하는 데 중요한 역할을 합니다. 인공지능 시스템은 오랫동안 이러한 세부 정보를 정확하게 포착하는 데 어려움을 겪었습니다. 오늘날 이 기술적 문제는 마침내 획기적인 해결책을 얻었습니다.

아마존 공식 출시 아마존 노바 소닉 —— 음성 이해와 음성 생성 기능을 통합한 기본 모델입니다. 이 모델은 이제 Amazon Bedrock 플랫폼에서 출시된 새로운 API를 통해 개발자들에게 공개되었으며, 음성 AI의 통합과 구현을 가속화하는 것을 목표로 합니다. 고객 서비스 자동화부터 여행, 의료, 교육, 엔터테인먼트까지 다양한 산업 시나리오에서 AI 에이전트에 적합합니다.

다중 모델 오케스트레이션에서 통합 아키텍처로 음성 AI 개발 패러다임을 재편합니다.

기존의 음성 AI 시스템은 일반적으로 함께 작동하는 여러 개의 개별 구성 요소에 의존합니다. 음성 인식 모델은 오디오를 필사하는 데 사용되고, 대규모 언어 모델은 의미를 이해하고 응답을 생성하는 데 사용되며, 텍스트-음성 기술은 최종 오디오 출력을 완성합니다. 이 아키텍처는 완벽하게 기능하지만 복잡한 통합과 맥락적 단편화와 같은 문제가 있어 자연스러운 인간 대화에 중요한 톤, 말하는 속도, 멈춤, 상호작용 리듬을 정확하게 복원하기 어렵습니다.

Amazon Nova Sonic은 새로운 통합 아키텍처를 통해 이 프로세스를 완전히 재구성했습니다. 청각적 이해와 소리 생성을 통합하여 모델이 입력 음성의 맥락, 스타일, 감정적 단서에 따라 출력을 동적으로 조정하여 보다 자연스럽고 인간적인 음성 상호 작용 경험을 제공합니다.

더욱 놀라운 점은 Amazon Nova Sonic이 대화 중의 멈춤이나 주저함까지 인식하고, 자동으로 적절한 응답 시점을 기다리며, 중단이나 가로채기 등 복잡한 대화 상황을 유연하게 처리해 음성 상호작용의 '사실성'을 질적으로 크게 향상시켰다는 점입니다.

Amazon Nova Sonic을 통합하거나 Amazon Bedrock에서 더 많은 AI 모델 서비스를 살펴보고 싶으시다면 페이지 하단의 QR 코드를 스캔하여 문의해 주시면 1:1 기술 지원과 솔루션 권장 사항을 제공해 드립니다.