خبر

  • تک بورد - RVID-TTS NVIDIA صداهای هوش مصنوعی واقعی را ایجاد می کند که بیشتر بیان کننده هستند

    RVID-TTS NVIDIA صداهای هوش مصنوعی واقعی را ایجاد می کند که بیشتر بیان کننده هستند
    26 روز و 5 ساعت قبل

    صداهای سنتز شده طی این سالها پیشرفت زیادی کرده اند. دیگر زمان صداهای مصنوعی که شبیه یک ربات از یک فیلم علمی تخیلی دهه 1960 به نظر می رسید سپری شده است. دستیاران هوش مصنوعی معاصر مانند الکسا و سیری صدایی بسیار واقعی تر به نظر می رسانند.

    تا آنجا که صداهای تلفیقی و متن به گفتار آمده است ، هنوز کامل نیست. با این حال ، بخش تحقیقات نوشتار به گفتار انویدیا برخی ابزارهای یادگیری ماشین را برای واقعی سازی سنتز صدا در برنامه های مختلف توسعه داده است.

    انویدیا یک مدل هوش مصنوعی به نام RAD-TTS ایجاد کرده است. توسعه دهندگان می توانند مدل را با صدای خود آموزش دهند ، و با استفاده از انحرافات و لحن آموخته شده ، پیامهای متنی را به گفتار طبیعی تبدیل می کند. همچنین می تواند صدای یک بلندگو را به صدای دیگر تبدیل کند. صدای "، انویدیا می گوید. "با الهام از ایده صدای انسان به عنوان یک ابزار موسیقی ، رابط RAD-TTS به کاربران کنترل دقیق و سطح فریم بر میزان ، مدت زمان و انرژی صدای سنتز شده را می دهد. "

    می توانید نمونه هایی از فناوری مورد استفاده در سری ویدیوهای "I AM AI " Nvidia را مشاهده کنید. تهیه کننده ویدئویی انویدیا فیلمنامه را در این دموها خواند و مدل صدای او را به یک گوینده زن تبدیل کرد. هنگامی که مدل دارای یک اسکریپت پایه است ، توسعه دهنده می تواند روایت را تغییر داده تا بر کلمات خاص تأکید کند و قدم را متناسب با ویدئو تغییر دهد.

    این فناوری در بسیاری از زمینه ها از جمله خدمات خودکار به مشتریان ، ترجمه زبان ، کمک به معلولان ، و حتی بازی. تقریباً هر برنامه ای که به صدای طبیعی انسان نیاز داشته باشد می تواند از RAD-TTS سود ببرد.

    "چندین مدل با ده ها هزار ساعت داده صوتی در سیستم های NVIDIA DGX آموزش دیده اند. توسعه دهندگان می تواند هر مدلی را برای موارد استفاده آنها تنظیم کند ، سرعت آموزش را با استفاده از محاسبات با دقت مختلط در GPU های NVIDIA Tensor Core افزایش دهد. " البته برای استفاده در رایانه های مجهز به کارت گرافیک Nvidia بهینه شده است. با این حال ، کار آن منبع باز است و برای همه توسعه دهندگان علاقه مند رایگان است. Nividia آن را در جعبه ابزار Nvidia NeMo Python در مرکز ظروف و نرم افزار NGC خود در دسترس قرار داده است.





خبرهای دیگر از نرم افزار