Машина вперше перевершила людей в розумінні зображень і відповідей на текстові питання після того, як модель AliceMind китайського гіганта електронної комерції Alibaba Group Holding посіла перше місце в глобальному конкурсі Visual Question Answering (VQA) Challenge 2021.
Про це повідомив портал South China Morning Post.
Алгоритм Alibaba зафіксував рівень точності 81,26% при відповідях на питання, пов'язані із зображеннями, в порівнянні з рівнем точності 80,83% для людей в щорічному конкурсі VQA Challenge, який проводиться з 2015 року Конференцією з комп'ютерного зору і розпізнавання образів (CVPR) .
В цьому році завдання містило більше 250 000 зображень і 1,1 мільйона питань. Оцінка являє собою зображення і пов'язане з цим питання, на який учасників просять дати точну відповідь. Компанія з Ханчжоу повідомила, що результати Alibaba, оновлені вісім днів тому, перевершили інших світових гравців, включаючи американського технологічного гіганта Microsoft.
"Ми пишаємося тим, що досягли ще однієї важливої віхи в області машинного інтелекту, що підкреслює наші постійні зусилля з просування досліджень і розробок в суміжних областях штучного інтелекту", - сказав Сі Луо, керівник відділу обробки природної мови (NLP) в Alibaba DAMO Academy . "Це не означає, що одного разу люди будуть замінені роботами. Швидше, ми впевнені, що більш розумні машини можуть використовуватися для допомоги в нашій повсякденній роботі і житті, і, отже, люди можуть зосередитися на творчих завданнях, в яких вони найкраще справляються" , - додав він.
Комп'ютерний зір - одна з найбільш активних областей досліджень і розробок ШІ в Китаї, хоча ранній упор на додатки для спостереження і вплив технологічної війни між США і Китаєм спонукали до пошуку нових драйверів комерційного зростання.
За словами Сі, технологія VQA може використовуватися в самих різних областях, включаючи пошук продуктів на сайтах електронної комерції, підтримку аналізу медичних зображень для початкової діагностики захворювань, а також для розумного водіння.
У Alibaba є. вже використовувала VQA в декількох сценаріях додатків, в тому числі в своєму інтелектуальному чат-боті Alime Shop Assistant, яким щодня користуються десятки тисяч продавців на роздрібних платформах Alibaba.
Раніше ми також повідомляли, що Android 12 зможе управляти смартфоном за допомогою міміки: екран відкриють бровою.