тест Тьюринга та ai 10 17

Pexels/Google Deepmind, CC BY-SA

У 1950 році британський вчений-інформатик Алан Тюрінг запропонував експериментальний метод відповіді на запитання: чи можуть машини мислити? Він припустив, що якщо після п’яти хвилин опитування людина не може визначити, чи розмовляє вона з машиною зі штучним інтелектом (ШІ) чи з іншою людиною, це демонструватиме, що ШІ має людський інтелект.

Хоча системи штучного інтелекту залишалися далекими від проходження тесту Тюрінга за його життя, він припустив це

«[…] Приблизно через п’ятдесят років можна буде запрограмувати комп’ютери […] так, щоб вони грали в імітаційну гру настільки добре, що середній допитувач матиме не більше 70% шансів зробити правильну ідентифікацію через п’ять хвилин опитування.

Сьогодні, через понад 70 років після пропозиції Тюрінга, жодному штучному інтелекту не вдалося успішно пройти випробування, виконавши конкретні умови, які він окреслив. Тим не менш, як деякі заголовки відображати, кілька систем підійшли досить близько.

Один недавній експеримент протестував три великі мовні моделі, включаючи GPT-4 (технологію штучного інтелекту, що лежить в основі ChatGPT). Учасники провели дві хвилини, спілкуючись або з іншою людиною, або з системою ШІ. ШІ було запропоновано зробити невеликі орфографічні помилки – і припинити роботу, якщо тестер став занадто агресивним.


Innersele підписатися графіка


Завдяки цій підказці штучний інтелект добре обдурив тестувальників. У парі з ботом зі штучним інтелектом тестувальники могли правильно вгадати, чи спілкуються вони з системою штучного інтелекту лише в 60% випадків.

Враховуючи швидкий прогрес, досягнутий у розробці систем обробки природної мови, ми можемо побачити, як штучний інтелект пройде оригінальний тест Тюрінга протягом наступних кількох років.

Але чи справді наслідування людей є ефективним тестом на інтелект? А якщо ні, то які альтернативні тести ми можемо використати для вимірювання можливостей ШІ?

Обмеження тесту Тюрінга

Тоді як система, яка пройшла тест Тюрінга, дає нам деякі доказ того, що він інтелектуальний, цей тест не є вирішальним тестом інтелекту. Одна проблема полягає в тому, що він може давати «помилкові негативи».

Сучасні великі мовні моделі часто розроблені таким чином, щоб негайно оголосити, що вони не є людьми. Наприклад, коли ви задаєте запитання ChatGPT, він часто починає свою відповідь фразою «як мовна модель ШІ». Навіть якщо системи штучного інтелекту мають основну здатність проходити тест Тьюринга, такий тип програмування перекриває цю здатність.

Тест також ризикує отримати певні види «хибнопозитивних результатів». Як філософ Нед Блок зазначив, У статті 1981 року система могла пройти тест Тюрінга, просто запрограмувавши людську відповідь на будь-який можливий вхід.

Крім того, тест Тюрінга зосереджується, зокрема, на людському пізнанні. Якщо пізнання ШІ відрізняється від пізнання людини, експерт-допитувач зможе знайти певне завдання, у якому ШІ та люди відрізняються продуктивністю.

Стосовно цієї проблеми Тюрінг писав:

Це заперечення є дуже сильним, але принаймні ми можемо сказати, що якщо, тим не менш, машину можна сконструювати для задовільної гри в імітацію, це заперечення не повинно нас турбувати.

Іншими словами, хоча проходження тесту Тьюринга є хорошим доказом того, що система є розумною, невдача — не добрий доказ того, що система НЕ розумний.

Крім того, тест не є хорошим показником того, чи є ШІ свідомими, чи можуть вони відчувати біль і задоволення, чи мають вони моральне значення. На думку багатьох вчених-когнітивістів, свідомість включає певний кластер розумових здібностей, включаючи наявність оперативної пам’яті, думок вищого порядку та здатність сприймати навколишнє середовище та моделювати, як тіло людини рухається навколо нього.

Тест Тьюринга не дає відповіді на питання, чи існують системи ШІ мають ці здібності.

Зростаючі можливості ШІ

Тест Тюрінга базується на певній логіці. Тобто: люди розумні, тому все, що може ефективно імітувати людей, швидше за все, буде розумним.

Але ця ідея нічого не говорить нам про природу інтелекту. Інший спосіб вимірювання інтелекту ШІ передбачає більш критичне осмислення того, що таке інтелект.

Наразі не існує єдиного тесту, який би міг авторитетно виміряти штучний чи людський інтелект.

На найширшому рівні ми можемо думати про інтелект як про здатність для досягнення ряду цілей у різних середовищах. Більш інтелектуальні системи – це ті, які можуть досягати ширшого діапазону цілей у ширшому діапазоні середовищ.

Таким чином, найкращий спосіб стежити за прогресом у розробці систем штучного інтелекту загального призначення — це оцінювати їх ефективність у різних завданнях. Дослідники машинного навчання розробили низку тестів, які дозволяють це зробити.

Наприклад, ГПТ-4 був вміє правильно відповідати 86% запитань із розумінням мови у багатозадачному режимі – еталон вимірювання ефективності на тестах із множинним варіантом відповіді з низки навчальних предметів рівня коледжу.

Це також сприятливо оцінено в AgentBench, інструмент, який може виміряти здатність великої мовної моделі поводитися як агент, наприклад, переглядаючи веб-сторінки, купуючи продукти в Інтернеті та змагаючись в іграх.

Тест Тюрінга все ще актуальний?

Тест Тьюринга є мірою імітації здатності штучного інтелекту моделювати поведінку людини. Великі мовні моделі є досвідченими імітаторами, що зараз відображається на їхньому потенціалі проходити тест Тьюринга. Але інтелект – це не те саме, що наслідування.

Існує стільки типів інтелекту, скільки і цілей, які потрібно досягти. Найкращий спосіб зрозуміти інтелект штучного інтелекту — відстежувати його прогрес у розвитку цілого ряду важливих можливостей.

У той же час, важливо, щоб ми не «змінювали стійки воріт», коли справа доходить до питання про те, чи є ШІ розумним. Оскільки можливості штучного інтелекту швидко вдосконалюються, критики ідеї інтелекту штучного інтелекту постійно знаходять нові завдання, які системам штучного інтелекту може бути важко виконати – лише для того, щоб виявити, що вони перестрибнули ще одна перешкода.

У цій ситуації актуальним питанням є не те, чи є системи ШІ інтелектуальними, а точніше, які види інтелекту, який вони можуть мати.Бесіда

Саймон Гольдштейн, доцент, Інститут філософії Діанойя, Австралійський католицький університет, Австралійський католицький університет та Кемерон Доменіко Кірк-Джанніні, асистент кафедри філософії, Rutgers University

Ця стаття перевидана з Бесіда за ліцензією Creative Commons. Читати оригінал статті.