الاخبار

“ميتا” تطلق نموذج ذكاء اصطناعي لتقليد الأصوات البشرية

يهدف نموذج “ميتا” للذكاء الاصطناعي إلى تقديم تجربة صوتية طبيعية وأكثر تعبيراً.

أعلنت شركة “ميتا” الأمريكية إطلاق نموذج الذكاء الاصطناعي الجديد “Spirit LM” لتوليد الأصوات، وتقليد الأصوات البشرية.

ويُعنى نموذج “ميتا” الجديد بمعالجة التحديات المتعلقة بالنماذج المتعددة الوسائط في الذكاء الاصطناعي، ويعتمد على نموذج لغوي مدرب سابقا يحتوي على 7 مليارات معلمة.

كما يتميز هذا النموذج “بقدرته على معالجة الصوت بنحو مختلف عن النماذج التقليدية التي تعتمد على تقنيات تعرف الكلام تلقائيا (ASR)”.

وبحسب بيان “ميتا”، فإن هذا النموذج يهدف إلى “تقديم تجربة صوتية طبيعية وأكثر تعبيراً، مما يشكل خطوة متقدمة في تطوير الروبوتات الذكية القادرة على التواصل الصوتي بنحو أكثر تعقيدا وواقعية”.

وأشار إلى أن النهج التقليدي يؤدي إلى فقدان الكثير من التعبيرات الطبيعية في الصوت، بينما يعتمد “Spirit LM” على استخدام رموز الفونيم “الوحدات الصوتية”، والنغمات ودرجات الصوت لتجاوز هذه القيود.

وتمكّن هذه المميزات هذا النموذج من إنتاج أصوات طبيعية، والتعلم من مهام جديدة تشمل تعرف الكلام، وتحويل النص إلى صوت، وتصنيف الكلام.

وحتى اللحظة يتوفر نموذج “ميتا” كمشروع مفتوح المصدر للمطورين والباحثين لاستخدامه وتطويره، ويتوقع أن يستخدم مستقبلا ضمن تطبيقات “ميتا” مثل “واتسآب” و”إنستغرام” و”فيسبوك”، مما يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي عبر محادثات صوتية طبيعية مليئة بالتعبيرات.

ويأتي هذا في ظل السباق المحموم بين الشركات التكنولوجيا والمعلومات والدردشة، للاستفادة من تقنيات الذكاء الاصطناعي لتقديم تجارب فريدة للمستخدمين.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى