Генеративний АІ вже перевершує середню людину у креативності

15 вересня 2023 318
Едуард Голодницький

Президент International Advisers Association, CEO Firm24

Нещодавнє дослідження “Best humans still outperform artificial intelligence in a creative divergent thinking task”, опубліковане в журналі Scientific Reports, вказує на те, що великі мовні моделі (LLM) генеративного AI перевершують середньостатистичну людину в творчих завданнях, таких як наприклад брейнштормінг. Проте індивіди, які набрали найвищий бал у цих завданнях, все ще перевершували результати найкращі моделі генеративного AI.

Дивергентне мислення - це тип мислення, який часто пов'язують з творчістю і підкреслює генерацію багатьох різних ідей або рішень для конкретного завдання. Зазвичай такі скіли оцінюється завданням "Альтернативні використання" (АВ), в якому учасників просять придумати якнайбільше альтернативних використань для повсякденного предмета протягом короткого періоду часу. Відповіді оцінюються за 4 різними категоріями: плинність, гнучкість, оригінальність та розробленість

Міка Койвісто і Сімоне Грассіні порівняли відповіді 256 людських учасників з відповідями трьох AI-моделей (ChatGPT3, ChatGPT4 і Copy.Ai) на завданнях АВ для 4 об'єктів - мотузка, коробка, олівець і свічка. Автори оцінили оригінальність відповідей, оцінюючи їх на семантичну відстань (наскільки відповідь була близькою до оригінального використання об'єкта) та креативність. Був використаний обчислювальний метод для вимірювання семантичної відстані на шкалі від 0 до 2, тоді як людські оцінювачі, не знаючи, хто подавав відповіді, суб'єктивно оцінювали креативність від 1 до 5. У середньому відповіді чатботів набрали значно більше балів, ніж відповіді людей як за семантичною відстанню (0,95 проти 0,91), так і за креативністю (2,91 проти 2,47).

У відповідей людей був гораздо більший діапазон за обома показниками - мінімальні бали були набагато нижчими, ніж у відповідей AI, але максимальні бали, як правило, були вищими. Найкраща відповідь людини перевершувала найкращу відповідь кожного чатбота в сім з восьми категорій оцінки.

Ці висновки свідчать про те, що AI моделі зараз можуть генерувати творчі ідеї принаймні так само добре, як середня людина.

Проте автори вказують, що вони розглядали лише продуктивність у одному завданні, пов'язаному з оцінкою творчості. Автори пропонують, що майбутні дослідження можуть вивчити, як AI може бути інтегрований у творчий процес для покращення продуктивності людини.