صوت الذكاء الإصطناعي من قوقل لا يمكن تمييزه الأن عن صوت الإنسان

نشرت قوقل ورقة بحثية هذا الشهر، والتي تتضمن تفاصيل نظام تحويل النص إلى كلام يُسمى "تاكوترون 2"، وهو نظام يعتمد على الذكاء الإصطناعي لتقليد صوت الإنسان بشكل دقيق. النظام يتكون من شبكتين عصبيتين عميقتين، بحيث الأولى تترجم النص إلى سبيكتوغرام (طيف) الذي تراه في الصوره أدناه، وتقوم الشبكة الثانية بقراءة هذا الرسم البياني وتحويله إلى صوت حقيقي. ويمكنك الإستماع إلى العينة أدناه. ونضع في إعتبارنا أن أحد الأصوت هو لفتاة، بينما الصوت الأخر لنظام الذكاء الإصطناعي الذي يستطيع بجانب القراءة معرفة الفروق الدقيقة فيما إذا تم تسليط الضوء على كلمة معينة أثناء الحديث. ونجد أنه من الصعب التمييز بين صوت الفتاة وصوت النظام، الذي إتضح بنهاية المطاف أنه الثاني. وخلافاً لبحوث الذكاء الإصطناعي الأخرى، هذه التكنولوجيا مفيدة بشكل كبير لشركة قوقل التي قد تستخدمها في مساعدها الصوتي. ومع ذلك، تم تدريب النظام لتقليد صوت إنثى واحدة فقط، لذلك فإن قوقل تحتاج إلى تدريب النظام بشكل أكبر للإطلاق الرسمي. هل تريد المزيد من الأمثلة؟ تذكر: الصوت الأول للفتاة والثاني لنظام الذكاء الإصطناعي! https://google.github.io/tacotron/publications/tacotron2/demos/bus_nostress.wav مثال أخر: https://google.github.io/tacotron/publications/tacotron2/demos/washington_gen.wav المصادر: Google Research Paper - Quartz

إطلاق التحديث المُنقح من أنظمة Tizen 3.0 لساعات Gear S3 في أوروبا إطلاق التحديث المُنقح من أنظمة Tizen 3.0 لساعات Gear S3 في أوروبا
تسريب فيديو يستعرض تصميم جالكسي S9 وS9 بلس تسريب فيديو يستعرض تصميم جالكسي S9 وS9 بلس
مكتبة الكونغرس لن تقوم بأرشفة جميع التغريدات بعد الآن مكتبة الكونغرس لن تقوم بأرشفة جميع التغريدات بعد الآن
أفضل الطُرق لمشاركة الشاشة على أنظمة iOS وmacOS أفضل الطُرق لمشاركة الشاشة على أنظمة iOS وmacOS
تطبيقات مجانية ليوم واحد [108] تطبيقات مجانية ليوم واحد [108]