أعلنت شركة Nvidia عن إتاحة الشيفرة المصدرية لتقنيتها المتقدمة Audio2Face، التي تتيح إنشاء أفاتارات رقمية واقعية يمكن استخدامها في الألعاب، والخدمات الافتراضية، وتطبيقات ثلاثية الأبعاد.
كيف تعمل تقنية Audio2Face
تعتمد التقنية على نماذج لغوية وصوتية ضخمة لتحويل الإشارات الصوتية إلى رسوم متحركة لملامح الوجه وحركات الشفاه في الوقت الفعلي.
وتحلل الخوارزميات عناصر الكلام مثل الفونيمات والنبرة والإيقاع، ثم تحولها إلى بيانات تحاكي تعابير الوجه وانفعالاته، ما يسمح بإنشاء محتوى مُعد مسبقاً أو شخصيات ذكية تفاعلية تتمتع بردود فعل عاطفية طبيعية.
أدوات للمطورين
إلى جانب النماذج المفتوحة، طرحت Nvidia:
- حزمة تطوير برمجيات (SDK) لدمج Audio2Face في المنتجات والتطبيقات المختلفة.
- إطار عمل للتدريب يتيح تكييف النماذج مع سيناريوهات محددة مثل الألعاب أو المساعدات الافتراضية أو خدمات العملاء.
بهذه الخطوة، تقترب إنفيديا من تعميم استخدام الأفاتارات التوليدية القادرة على التفاعل بشكل طبيعي مع المستخدمين في مجالات متعددة، بدءاً من الترفيه الرقمي وصولاً إلى الخدمات التجارية.