techbord.com OpenAI  's DALL-E متن عجیب و غریب را به تصاویر عجیب تبدیل می کند

OpenAI می خواهد یک هوش مصنوعی عمومی (AGI) ایجاد کند که به نفع همه بشریت باشد و شامل توانایی درک مفاهیم روزمره و ترکیب آنها به روش های خلاقانه باشد. آخرین مدل های هوش مصنوعی این شرکت پردازش زبان طبیعی را با تشخیص تصویر ترکیب کرده و نتایج امیدوار کننده ای را در جهت رسیدن به این هدف نشان می دهند.

OpenAI به دلیل ایجاد مدلهای چشمگیر هوش مصنوعی مانند GPT-2 و GPT-3 شناخته شده است که قادر به نوشتن اخبار جعلی قابل باور هستند اما همچنین می توانند به ابزارهای اساسی در شناسایی و فیلتر کردن اطلاعات نادرست و هرزنامه آنلاین تبدیل شوند. پیش از این ، آنها همچنین ربات هایی را ایجاد کرده اند که می توانند مخالفان انسانی را در بازیهایی مانند Dota 2 شکست دهند ، زیرا می توانند به گونه ای بازی کنند که به آموزش هزاران ساله نیاز دارد.

گروه تحقیقاتی ارائه شده است با دو مدل اضافی که بر پایه آن بنا شده اند. اولین بار DALL-E یک شبکه عصبی است که اساساً می تواند تصویری را براساس ورودی متن ایجاد کند. ایلیا ساتسكور ، بنیانگذار و دانشمند ارشد OpenAI خاطرنشان می كند كه DALL-E با داشتن 12 میلیارد پارامتر قادر به ایجاد تقریباً هر چیزی است كه می توانید توصیف كنید ، حتی مفاهیمی را كه هرگز در آموزش دیده نبوده است.

https://techbord.com OpenAI  's DALL-E متن عجیب و غریب را به تصاویر عجیب و غریب تبدیل می کند

به عنوان مثال ، سیستم جدید هوش مصنوعی قادر به ایجاد تصویری است که "تصویری از تربچه کودک دایکون در توتو در حال راه رفتن سگ " ، "" یک پنجره شیشه ای رنگی با تصویر توت فرنگی آبی ، "" یک صندلی راحتی ارائه دهد. به شکل آووکادو ، "یا " حلزون ساخته شده از چنگ. "

DALL-E قادر به ایجاد چندین نتیجه قابل قبول برای این توصیفات و موارد دیگر است ، که نشان می دهد دستکاری بصری اکنون مفاهیم استفاده از زبان طبیعی در دسترس است.

Sutskever می گوید که "کارهایی که شامل مدل های مولد هستند ، می توانند تأثیرات قابل توجه و گسترده ای در جامعه داشته باشند. در آینده ، ما قصد داریم تجزیه و تحلیل نحوه مواردی مانند DALL-E به موضوعات اجتماعی مانند تأثیر اقتصادی بر روی برخی از فرآیندهای کار و مشاغل ، احتمال تعصب در خروجی مدل و چالش های اخلاقی بلند مدت تری که از این فن آوری ناشی می شود ، مربوط می شوند. "

< img src = "https://techbord.com/picsbody/2101/1752-2.jpg " alt = "https://techbord.com OpenAI 's DALL-E متن عجیب و غریب را به تصاویر عجیب و غریب تبدیل می کند ">

عملکرد کلیپ بهتر است مدل های دیگر حتی در تشخیص اشیا from از نمایش های تصویری انتزاعی تر

دومین مدل هوش چند منظوره هوش مصنوعی معرفی شده توسط OpenAI CLIP نام دارد. قدرت کلیپ در کمتر از 400 میلیون جفت متن و تصویر خراشیده شده از سراسر وب ، توانایی آن در گرفتن یک مفهوم تصویری و یافتن توصیف متنی است که به احتمال زیاد توصیف دقیق آن با استفاده از آن است. آموزش بسیار کمی.

این می تواند هزینه محاسباتی هوش مصنوعی را در برنامه های خاص مانند تشخیص شخصیت شی (OCR) ، تشخیص عملکرد و مکان یابی جغرافیایی کاهش دهد. با این حال ، محققان دریافتند که این کار در کارهای دیگر مانند تشخیص تومور غدد لنفاوی و طبقه بندی تصاویر ماهواره ای کوتاه است. مفاهیمی که ما برای درک جهان پیرامون خود استفاده می کنیم ، حتی اگر هنوز هم خیلی کامل نیستند. این یک نقطه عطف مهم برای هوش مصنوعی است ، که می تواند راه را برای بسیاری از ابزارهای مفید برای تقویت انسان در کار خود باز کند.

OpenAI 's DALL-E متن عجیب و غریب را به تصاویر عجیب تبدیل می کند
software/openai-s-dall-e-متن-عجیب-و-غریب-را-به-تصاویر-عجیب-تبدیل-می.html

آخرین مطالب سایت
techbord.com انویدیا شروع به پشتیبانی مجدد BAR قابل تغییر برای پردازنده های گرافیکی RTX 3000 می کند
techbord.com اپل بی سر و صدا رتبه های قابل ترمیم آیفون و مک بوک را به وب سایت فرانسوی خود اضافه کرد
techbord.com نسخه جدید بازسازی System Dock Night Dive در تابستان امسال فرا می رسد ، اکنون نسخه آزمایشی رایگان را بارگیری کنید
techbord.com Framework Laptop آخرین تلاش برای یک لپ تاپ مدولار واقعی است
techbord.com محققان استنفورد چهار دلیل اصلی
techbord.com Final Fantasy VII Remake برای PS5 به یک DLC ماجراجویی Yuffie و پیشرفت های گرافیکی اضافه می کند
copyright 2020 techbord.com
تمامی حقوق برای وبسایت تک بورد محفوظ است. استفاده از مطالب فقط با ذکر نام و لینک به صفحه منبع امکان پذیر است.