“Nova Sonic”.. جديد “أمازون” للذكاء الاصطناعي الصوتي

“أمازون”: النموذج الجديد أقل تكلفة بنحو 80% من نموذج “GPT-4o” الذي طورته “OpenAI”.
أعلنت شركة “أمازون” عن نموذجها الصوتي الجديد “Nova Sonic” القائم على تقنيات الذكاء الاصطناعي التوليدي، والذي يقدم تجربة صوتية أقرب إلى المحادثات البشرية من حيث السلاسة والتفاعل الطبيعي.
وقالت الشركة، في بيان رسمي، إن “Nova Sonic” ينافس أبرز نماذج الذكاء الصوتي من شركتي “OpenAI” و”جوجل”، متفوقاً في سرعة الاستجابة، ودقة تعرف الكلام، وجودة التفاعل.
وأوضحت أن النموذج الجديد أقل تكلفة بنحو 80% من نموذج “GPT-4o” الذي طورته “OpenAI”.
ويأتي إطلاق “Nova Sonic” كاستجابة لتطور النماذج الصوتية الحديثة، مثل تلك المدمجة في وضع الصوت في “ChatGPT”، التي أصبحت أكثر تطوراً من المساعدات الصوتية التقليدية مثل “أليكسا” و”سيري”.
ويُستخدم النموذج الجديد حالياً في تشغيل “أليكسا بلس”، الإصدار المحسن من مساعد “أمازون” الصوتي.
ويتوفر “Nova Sonic” عبر منصة “Bedrock” للمطورين، من خلال واجهة برمجة تطبيقات جديدة تتيح البث الصوتي في الاتجاهين، ما يفتح الباب أمام استخدامات واسعة في تطبيقات المؤسسات.
ويتميز النموذج بقدرته على التعرف على الكلمات حتى وسط الضوضاء أو التمتمة، كما يسجل نسبة خطأ منخفضة بلغت 4.2% في اختبار “Multilingual LibriSpeech”.
كما تفوق على نموذج “OpenAI” في اختبار الحوارات متعددة الأطراف بمعدل خطأ أقل بنسبة 46.7%، بحسب الشركة.
وبحسب مؤسسة “Artificial Analysis”، يسجل النموذج متوسط استجابة يبلغ 1.09 ثانية، متقدماً على أقرب منافسيه، ما يعزز مكانته في سوق تقنيات الصوت الذكية.