Чат-боти зі штучним інтелектом (ШІ) були розроблені, щоб якомога точніше відтворювати людську мову для покращення взаємодії з користувачем. Але оскільки штучний інтелект стає все більш досконалим, стає дедалі важче відрізнити ці комп’ютеризовані моделі від реальних людей. Тепер вчені Каліфорнійського університету в Сан-Дієго (UCSD) показали, що два провідні чат-боти досягли важливої віхи і зрівнялися з людиною у інтелекті, пройшовши знаменитий тест Тьюрінга.
Про це повідомляє Mail Online.
У 1950 році легендарний британський комп’ютерний вчений Алан Тьюрінг запропонував теорію навчання штучного інтелекту, щоб надати йому інтелект дитини, а потім дати можливість отримати відповідний досвід для його розвитку до інтелекту дорослої людини. Тест Тьюринга створений для того, щоб допомогти людині, коли вона не може правильно відрізнити відповідь іншої людини від відповіді ШІ.
Алан Тьюринг
У новому дослідженні вчених чат-боти ChatGPT від OpenAI і LLaMa від Meta AI пройшли знаменитий тест Тьюринга, що стало першим випадком, коли ШІ пройшов цей тест. Це сталося через 75 років після того, як Алан Тюринг представив остаточний тест комп’ютерного інтелекту у своїй основоположній статті «Обчислювальні машини та інтелект».
"Результати тесту є першим емпіричним доказом того, що будь-яка штучна система проходить стандартний тристоронній тест Тьюринга. Якщо дослідники не в змозі відрізнити відповіді людини від відповідей машини, тоді говорять, що машина його пройшла", — заявили вчені UCSD.
Дослідники використовували чотири моделі ШІ – GPT-4.5 (випущена в лютому), попередню ітерацію під назвою GPT-4o, флагманську модель Meta LLaMa та програму чату 1960-х років під назвою ELIZA.
Перші три — це «великі мовні моделі» (LLM) — алгоритми глибокого навчання, які можуть розпізнавати та генерувати текст на основі знань, отриманих із масивних наборів даних.
Експерти залучили 126 студентів бакалаврату Каліфорнійського університету в Сан-Дієго та 158 людей з онлайн-пулу даних Prolific. Учасники мали п’ятихвилинні онлайн-розмови одночасно з іншою людиною-учасником та одним із штучних інтелектів, але вони не знали, хто є який, і їм потрібно було визначити, хто, на їхню думку, був людиною.
Коли було запропоновано вибрати людину, GPT-4.5 назвали людиною в 73 відсотках випадків – частіше, ніж обирали реальну людину. Штучний інтелект LLaMa-3.1 від Meta під час дослідження визнали людиною у 56%. При цьому базові моделі (ELIZA та GPT-4o) досягли набагато нижчих показників – 23 відсотки та 21 відсоток відповідно.
Команда стверджує, що їхнє нове дослідження, є «переконливим доказом» того, що боти OpenAI і Meta пройшли тест Тьюринга.
Бенедикт Камбербетч в ролі Алана Тьюринга у фільмі "Гра в імітацію"
Оскільки GPT-4.5 зараз набрав 73 відсотки, ця новинка свідчить про те, що моделі ChatGPT стають все кращими й кращими у втіленні людей.
Раніше у Мінцифри анонсували запуск штучного інтелекту у мобільному додатку "Дія". Завдяки АІ-асистенту українці зможуть передавати скарги відповідним державним установам.