خبر

  • تک بورد - OpenAI  's DALL-E متن عجیب و غریب را به تصاویر عجیب تبدیل می کند

    OpenAI 's DALL-E متن عجیب و غریب را به تصاویر عجیب تبدیل می کند
    9 روز و 7 ساعت قبل

    OpenAI می خواهد یک هوش مصنوعی عمومی (AGI) ایجاد کند که به نفع همه بشریت باشد و شامل توانایی درک مفاهیم روزمره و ترکیب آنها به روش های خلاقانه باشد. آخرین مدل های هوش مصنوعی این شرکت پردازش زبان طبیعی را با تشخیص تصویر ترکیب کرده و نتایج امیدوار کننده ای را در جهت رسیدن به این هدف نشان می دهند.

    OpenAI به دلیل ایجاد مدلهای چشمگیر هوش مصنوعی مانند GPT-2 و GPT-3 شناخته شده است که قادر به نوشتن اخبار جعلی قابل باور هستند اما همچنین می توانند به ابزارهای اساسی در شناسایی و فیلتر کردن اطلاعات نادرست و هرزنامه آنلاین تبدیل شوند. پیش از این ، آنها همچنین ربات هایی را ایجاد کرده اند که می توانند مخالفان انسانی را در بازیهایی مانند Dota 2 شکست دهند ، زیرا می توانند به گونه ای بازی کنند که به آموزش هزاران ساله نیاز دارد.

    گروه تحقیقاتی ارائه شده است با دو مدل اضافی که بر پایه آن بنا شده اند. اولین بار DALL-E یک شبکه عصبی است که اساساً می تواند تصویری را براساس ورودی متن ایجاد کند. ایلیا ساتسكور ، بنیانگذار و دانشمند ارشد OpenAI خاطرنشان می كند كه DALL-E با داشتن 12 میلیارد پارامتر قادر به ایجاد تقریباً هر چیزی است كه می توانید توصیف كنید ، حتی مفاهیمی را كه هرگز در آموزش دیده نبوده است.

    https://techbord.com OpenAI  's DALL-E متن عجیب و غریب را به تصاویر عجیب و غریب تبدیل می کند

    به عنوان مثال ، سیستم جدید هوش مصنوعی قادر به ایجاد تصویری است که "تصویری از تربچه کودک دایکون در توتو در حال راه رفتن سگ " ، "" یک پنجره شیشه ای رنگی با تصویر توت فرنگی آبی ، "" یک صندلی راحتی ارائه دهد. به شکل آووکادو ، "یا " حلزون ساخته شده از چنگ. "

    DALL-E قادر به ایجاد چندین نتیجه قابل قبول برای این توصیفات و موارد دیگر است ، که نشان می دهد دستکاری بصری اکنون مفاهیم استفاده از زبان طبیعی در دسترس است.

    Sutskever می گوید که "کارهایی که شامل مدل های مولد هستند ، می توانند تأثیرات قابل توجه و گسترده ای در جامعه داشته باشند. در آینده ، ما قصد داریم تجزیه و تحلیل نحوه مواردی مانند DALL-E به موضوعات اجتماعی مانند تأثیر اقتصادی بر روی برخی از فرآیندهای کار و مشاغل ، احتمال تعصب در خروجی مدل و چالش های اخلاقی بلند مدت تری که از این فن آوری ناشی می شود ، مربوط می شوند. "

    < img src = "https://techbord.com/picsbody/2101/1752-2.jpg " alt = "https://techbord.com OpenAI 's DALL-E متن عجیب و غریب را به تصاویر عجیب و غریب تبدیل می کند ">

    عملکرد کلیپ بهتر است مدل های دیگر حتی در تشخیص اشیا from از نمایش های تصویری انتزاعی تر

    دومین مدل هوش چند منظوره هوش مصنوعی معرفی شده توسط OpenAI CLIP نام دارد. قدرت کلیپ در کمتر از 400 میلیون جفت متن و تصویر خراشیده شده از سراسر وب ، توانایی آن در گرفتن یک مفهوم تصویری و یافتن توصیف متنی است که به احتمال زیاد توصیف دقیق آن با استفاده از آن است. آموزش بسیار کمی.

    این می تواند هزینه محاسباتی هوش مصنوعی را در برنامه های خاص مانند تشخیص شخصیت شی (OCR) ، تشخیص عملکرد و مکان یابی جغرافیایی کاهش دهد. با این حال ، محققان دریافتند که این کار در کارهای دیگر مانند تشخیص تومور غدد لنفاوی و طبقه بندی تصاویر ماهواره ای کوتاه است. مفاهیمی که ما برای درک جهان پیرامون خود استفاده می کنیم ، حتی اگر هنوز هم خیلی کامل نیستند. این یک نقطه عطف مهم برای هوش مصنوعی است ، که می تواند راه را برای بسیاری از ابزارهای مفید برای تقویت انسان در کار خود باز کند.





خبرهای دیگر از نرم افزار