Daboost / Shutterstock

З нещодавнє звільнення та швидкий повторний прийом на роботу Сема Альтмана від OpenAI, дебати навколо розробки та використання штучного інтелекту (ШІ) знову в центрі уваги. Більш незвичайним є те, що головною темою у звітах ЗМІ є здатність Системи ШІ для математики.

Очевидно, частина драми в OpenAI була пов’язана з розробкою компанією нового ШІ-алгоритм Q*. Про цю систему говорили як про значний прогрес, і однією з її головних особливостей була здатність до математичних міркувань.

Але хіба математика не є основою ШІ? Як система ШІ може мати проблеми з математичним міркуванням, враховуючи, що комп’ютери та калькулятори можуть виконувати математичні завдання?

ШІ не є єдиним цілим. Це набір стратегій для виконання обчислень без прямих вказівок від людей. Як ми побачимо, деякі системи ШІ компетентні в математиці.

Однак одна з найважливіших сучасних технологій, великі мовні моделі (LLM), що лежать в основі чат-ботів штучного інтелекту, таких як ChatGPT, поки що важко імітує математичні міркування. Це тому, що вони були розроблені, щоб зосередитися на мові.


Innersele підписатися графіка


Якщо новий алгоритм компанії Q* може вирішувати небачені математичні проблеми, то це цілком можливо бути значним проривом. Математика - це давня форма людського мислення, яка великі мовні моделі (LLM) досі намагалися наслідувати. LLMs — це технологія, яка лежить в основі таких систем, як ChatGPT від OpenAI.

На момент написання статті деталі алгоритму Q* та його можливості обмежені, але дуже інтригуючі. Отже, перш ніж вважати Q* успішним, необхідно врахувати різні тонкощі.

Наприклад, математика — це предмет, яким усі займаються різною мірою, і рівень математики, на якому володіє Q*, залишається неясним. Проте була опублікована наукова робота, яка використовує альтернативні форми ШІ для просування математики на дослідницькому рівні (в тому числі деякі написані мною, а також один, написаний групою математиків у співпраці з дослідниками Google DeepMind).

Ці системи ШІ можна назвати компетентними в математиці. Однак цілком ймовірно, що Q* використовується не для допомоги науковцям у їхній роботі, а призначений для іншої мети.

Тим не менш, навіть якщо Q* не в змозі розширити межі передових досліджень, дуже ймовірно, що в тому, як він був побудований, можна знайти певне значення, яке може створити спокусливі можливості для майбутнього розвитку.

Все комфортніше

Як суспільство, ми все більш комфортно використовуємо спеціалізований ШІ для вирішення заздалегідь визначених типів проблем. Наприклад, цифрові помічники, розпізнавання осіб та онлайн-системи рекомендацій буде знайомий більшості людей. Що залишається невловимим, так це т.зв «загальний штучний інтелект» (AGI) який має широкі можливості міркування, які можна порівняти з людськими.

Математика — це базова навичка, якій ми прагнемо навчити кожну дитину шкільного віку, і, безсумнівно, стане основною віхою в пошуку AGI. Тож як інакше математично компетентні системи ШІ можуть допомогти суспільству?

Математичне мислення актуальне для багатьох застосувань, наприклад, кодування та інженерії, тому математичні міркування є життєво важливими навичками, які можна передати як для людини, так і для штучного інтелекту. Іронія полягає в тому, що ШІ на фундаментальному рівні базується на математиці.

Наприклад, багато методів, реалізованих алгоритмами штучного інтелекту, зрештою зводяться до математичної області, відомої як матрична алгебра. Матриця — це просто сітка чисел, відомим прикладом якої є цифрове зображення. Кожен піксель є не більше ніж числові дані.

Великі мовні моделі також за своєю суттю математичні. Ґрунтуючись на величезній вибірці тексту, машина може дізнатися ймовірності для слів, які є швидше за все, слідувати підказці (або запитанню) від користувача до чат-бота. Якщо ви хочете, щоб попередньо підготовлений магістр права спеціалізувався на певній темі, його можна точно налаштувати на математичній літературі чи будь-якій іншій галузі навчання. LLM може генерувати текст, який читається так, ніби він розуміє математику.

На жаль, це створює LLM, який добре блефує, але погано розбирається в деталях. Проблема полягає в тому, що математичне твердження, за визначенням, є таким, якому можна призначити однозначне логічне значення (тобто правда чи хибність). Математичні міркування зводяться до логічного виведення нових математичних тверджень із раніше встановлених.

Devil's advocate

Природно, що будь-який підхід до математичних міркувань, який спирається на лінгвістичні ймовірності, буде виходити за межі своєї смуги. Одним із способів обійти це може бути включення певної системи формальної перевірки в архітектуру (саме так, як побудовано LLM), яка постійно перевіряє логіку стрибків, зроблених великою мовною моделлю.

Підказка про те, що це було зроблено, може бути в назві Q*, яка ймовірно стосується алгоритм, розроблений ще в 1970-х роках щоб допомогти з дедуктивним міркуванням. Крім того, Q* може стосуватися Q-навчання, за якого модель може вдосконалюватися з часом шляхом тестування та винагороди за правильні висновки.

Але для створення математичних ШІ існує кілька проблем. Наприклад, деякі з найцікавіших математиків складаються з дуже малоймовірних подій. Є багато ситуацій, коли можна подумати, що шаблон існує на основі невеликих чисел, але він несподівано руйнується, коли перевіряється достатня кількість випадків. Цю можливість важко включити в машину.

Ще один виклик може стати несподіванкою: математичне дослідження може бути дуже творчим. Це має бути, тому що практикуючі повинні винаходити нові концепції і при цьому дотримуватися їх формальні правила давнього предмета.

Будь-яка методологія штучного інтелекту, навчена лише знаходити закономірності в уже існуючій математиці, ймовірно, ніколи не зможе створити справді нову математику. Враховуючи зв’язок між математикою та технологіями, це, здається, перешкоджає концепції нових технологічних революцій.

Але давайте на мить пограємо в роль адвоката диявола та уявимо, чи справді штучний інтелект може створити нову математику. Попередній аргумент проти цього має недолік, оскільки можна також сказати, що найкращі математики-людини також навчалися виключно на раніше існуючій математиці. Великі мовні моделі дивували нас раніше і будуть робити це знову.Бесіда

Том Олівер, викладач, інформатика та інженерія, Вестмінстерський університет

Ця стаття перевидана з Бесіда за ліцензією Creative Commons. Читати оригінал статті.