صفحه نخست   |   درباره ما   |   تماس با ما
4- shoar مرکز اطلاعات فنی ایرانسال تاسیس : ۱۳۶۲        
جمعه   ۱۳۹۹/۱۲/۸  
نسخه چاپی  
صفحه نخست » راهنمای مدیران » تازه های تکنولوژی
 
تازه های تکنولوژی
 
صداساز دیجیتالی هوشمند برای تقلید صداها

 

صداساز دیجیتالی هوشمند برای تقلید صداها
 

صدای انسان با تمام زیر و بم ‌ها و لطافتش ثابت کرده که یکی از سخت ‏ترین چیزها برای شبیه‏ سازی در کامپیوتر است. یک استارت ‌آپ هوش مصنوعی جدید که در مونترال شکل‏گرفته، شبیه ‏ساز صدایی را تولید کرده که قادر به تقلید از صدای تقریباً هر انسانی است. حتی می‏تواند اوج و فرود صدای شخص را هم تقلید کند.

فعلاً این سیستم بی‏ نقص نیست، اما خبر از آینده ‏ای می‏دهد که در آن از صدای انسان‏ها هم مثل عکس‏ هایشان، به‏ سادگی تقلید می‏شود. وقتی دستیار هوشمند سیری، الکسا یا حتی جی ‏پی ‏اس نقشه با ما سخن می‌گوید، کاملاً مشخص است که از طرف یک ماشین مورد خطاب قرار گرفته ‏ایم. علت این است که تمام سیستم ‏های تبدیل نوشتار به گفتار موجود در بازار، بر کلمات، عبارات و گفته ‏های از پیش ضبط ‏شده گویندگان متکی هستند. در نهایت صداهای ضبط ‏شده در کنار هم قرار داده می ‏شوند و کلمات و جملات کامل را می‏سازند. نتیجه این کار صدایی کاملاً مصنوعی، رباتیک و حتی گاهی خنده ‏دار است. با این روش تولید صدای انسان، همواره لحن تکراری و خسته‏کننده ‏ای را از دستگاه‏ ها می‏شنویم.
در تلاشی برای افزودن اندکی حس زندگی به صداهایی که از اپلیکیشن ‏هایمان بیرون می‏آید، استارت ‌آپ هوش مصنوعی Lyrebird الگوریتم تقلید صدایی را نوشته است که می‏تواند صدای هر انسانی را شبیه ‏سازی کرده و هر متنی را با لحن و حس از پیش تعریف ‏شده بخواند. جالب است بدانید که این الگوریتم، بعد از پردازش صدای از پیش ضبط‏ شده شخص تنها به مدت چند ده ثانیه، می‏تواند از صدا و طرز حرف زدن وی تقلید کند. Lyrebird برای تبلیغ این ابزار جدید خود، چند نمونه از صدای باراک اوباما، دونالد ترامپ و هیلاری کلینتون را تولید کرده است.
دموهای Lyrebird کاتالوگی بی ‏پایان از صداهای مجازی را هم به نمایش می‏گذارد. سیستم آن ها می‏تواند جمله‏ای تکراری را با لحن ‏های متفاوت بیان کند. تمام این ها به کمک استفاده از شبکه ‏های عصبی مصنوعی ممکن شده است که کاری شبیه به شبکه عصبی بیولوژیکی در مغز انسان انجام می‏دهند. به بیان ساده، الگوریتم الگوهای صحبت فرد را شناسایی کرده و بعد همان الگوها را در صدایی که شبیه ‏سازی می‏کند، به‌کار می‏گیرد.
 

بالا^^