رئيس مجلسى الإدارة والتحرير
محمد الباز
رئيس مجلسى الإدارة والتحرير
محمد الباز

«مايكروسوفت» تطوّر نظام لغة يمكنه تقليد صوت شخص من عينة مدتها ثلاث ثوانٍ فقط

مايكروسوفت
مايكروسوفت

طورت شركة "مايكروسوفت" نظام لغة ذكيا، وهو برنامج مدعم بالذكاء الاصطناعي، يمكنه محاكاة صوت شخص ما وتقليد صوته من عينة صوتية مدتها ثلاث ثوانٍ فقط.

وبحسب صحيفة "ديكان هيرالد"، يحمل النظام الجديد اسم "VALL-E" ويعمل على تحويل النصوص المكتوبة إلى مقاطع صوتية، ويمكن أن يتطابق الكلام مع كل من نغمة الصوت للمتحدث وطريقة الحديث، حتى صوتيات الغرفة، حيث يمكن استخدامه لتطبيقات تحويل النص إلى كلام المخصصة أو المتطورة.

ولا يقتصر النظام على إنشاء مقاطع صوتية عبر كتابة نصوص عشوائية، لكنه يستطيع أيضاً مراعاة أسلوب القراءة ونبرة الصوت؛ لإظهار شخصية صاحب الصوت الأصلي في المقاطع الصوتية المزيفة.

ولا يزال النظام قيد التطوير والبحث، لكن المشروع يقدم مستوىً فائقاً في دقة محاكاة العوامل والمؤثرات الصوتية المحيطة بالمتحدث في المقطع الأصلي البالغة مدته 3 ثوان فقط، بحيث يتم إبرازها في المقاطع المصنعة بشكل أقرب للحقيقة.

وأوضحت عينات مقاطع صوتية عرضتها "مايكروسوفت" للكشف عن قدرات نظامها الجديد، مستوى دقيقا للبرنامج في إنشاء مقاطع صوتية كأنها مسجلة خلال مكالمة هاتفية، وذلك من خلال اقتباس نمط الصوت ومستواه ودرجة شدته، من المقطع الأصلي المُسجل للمستخدم خلال حديثه في الحقيقة.

وأثبتت "مايكروسوفت" من خلال المقاطع الصوتية التي نشرتها على صفحة النظام الجديد على "جت هب" أن النظام بإمكانه إنشاء مقاطع صوتية بأساليب مختلفة، عبر استخدام صوت شخص واحد.