OpenAI анонсувала DALL-E 3

Автор: Едуард Голодницький, Президент International Advisers Association, co-founder Firm24

OpenAI анонсувала третю версію своєї генеративної платформи візуального мистецтва штучного інтелекту DALL-E, яка тепер дозволяє користувачам використовувати ChatGPT для створення підказок і містить більше параметрів безпеки.

DALL-E перетворює текстові промти на зображення. Але навіть DALL-E 2 помилився, часто ігноруючи конкретні формулювання. За словами дослідників OpenAI, остання версія набагато краще розуміє контекст.

Нова функція DALL-E 3 — інтеграція з ChatGPT. Використовуючи ChatGPT, не потрібно придумувати власну детальну підказку для керівництва DALL-E 3, бо можна просто попросити ChatGPT придумати підказку, і чат-бот напише абзац інструкцій. Інші користувачі можуть використовувати власні підказки, якщо у них є конкретні ідеї щодо DALL-E.

У демонстрації для The Verge Адітя Рамеш, провідний дослідник і керівник команди DALL-E, спонукав ChatGPT допомогти йому розробити логотип для ресторану рамен у горах. Потім ChatGPT написав довший запит, а DALL-E запропонував чотири варіанти. Моїм улюбленим було зображення гори зі сніговими шапками рамена, бульйону, що тече вниз, як водоспад, і маринованих яєць на землі, як каміння в саду — хоча це більше нагадувало ілюстрацію до якогось гарного товару, ніж звичайний логотип ресторану. За словами OpenAI, цей зв’язок із чат-ботом дозволяє більшій кількості людей створювати мистецтво штучного інтелекту, оскільки їм не обов’язково вміти створювати підказки.

DALL-E, вперше випущений у січні 2021 року, з’явився перед іншими художніми платформами ШІ для створення тексту в зображення від Stability AI та Midjourney. На момент випуску DALL-E 2 у 2022 році OpenAI відкрив список очікування, щоб контролювати, хто має право використовувати платформу після критики, що DALL-E може створювати фотореалістичні відверті зображення та демонструє упередженість під час створення фотографій. Компанія видалила список очікування у вересні минулого року та відкрила DALL-E 2 для громадськості.

Ця нова версія DALL-E спочатку буде випущена для користувачів ChatGPT Plus і ChatGPT Enterprise у жовтні, а восени — для дослідницьких лабораторій і служби API. OpenAI планує відстрочити випуск DALL-E 3, але не зобов’язується, коли буде випущена безкоштовна загальнодоступна версія.

OpenAI стверджує, що багато роботи зосередив на DALL-E 3, створюючи надійні заходи безпеки, щоб запобігти створенню непристойних або потенційно ненависних зображень. OpenAI заявив, що працював із зовнішніми командами, які навмисно намагаються зламати систему, щоб перевірити її безпеку — і покладався на класифікатори введення — спосіб навчити мовні моделі ігнорувати певні слова, щоб уникнути явних або жорстоких підказок. DALL-E 3 також не зможе відтворити зображення публічних осіб — за умови, що в підказці конкретно згадується ім’я.

Представники OpenAI повідомили в електронному листі, що DALL-E 3 навчено відмовлятися від створення зображень у стилі живих художників. На відміну від DALL-E 2, який за запитом може імітувати мистецтво в стилі певних художників.

OpenAI, можливо, щоб уникнути судових позовів, також дозволить художникам відмовитися від своїх творів у майбутніх версіях моделей штучного інтелекту для перетворення тексту в зображення. Творці можуть подати зображення, на яке вони володіють правами, і подати запит на його видалення у формі на веб-сайті. Майбутня версія DALL-E може блокувати результати, схожі на образ і стиль виконавця. Художники подали до суду на конкурентів DALL-E, Stability AI і Midjourney, а також на художній веб-сайт DeviantArt за те, що вони нібито використовували їхні роботи, захищені авторським правом, для навчання своїх моделей тексту в зображення.

theverge

Штучний інтелект (AI)