Новости

ШІ-модель Microsoft перевершила результат людини в тесті на розуміння природної мови SuperGLUE

[vc_row][vc_column][vc_column_text]

Алгоритм розуміння природної мови (Natural Language Understanding, NLU) Microsoft DeBERTa перевершив людські можливості в одному з найскладніших тестів для подібних алгоритмів SuperGLUE. На поточний момент модель займає перше місце в рейтингу з показником в 90,3, в той час як середнє значення людських можливостей становить 89,8 балів.

Рейтинг алгоритмов по прохождению теста SuperGLUE
Рейтинг алгоритмів по проходженню тесту SuperGLUE

Тест SuperGLUE включає в себе ряд завдань, які розроблені для оцінки здатності ШІ-моделей розпізнавати і розуміти природну мову, наприклад, дати правильну відповідь на питання на базі прочитаного абзацу, визначити, чи правильно використовується багатозначне слово в певному контексті і т.д. Тест був розроблений групою дослідників в 2019 році. Коли був представлений SuperGLUE, розрив між найефективнішою моделлю і показниками людини в таблиці лідерів становив майже 20 балів.

Для того щоб домогтися поточного результату в 90,3 бала, DeBERTa отримала масштабне оновлення архітектури: тепер вона складається з 48 шарів і має 1,5 млрд параметрів. Microsoft зробить публічну модель і її вихідний код. Крім того, DeBERTa буде інтегрована в наступну версію Тьюрінгової моделі Microsoft Turing (Turing NLRv4). Тьюрінгові моделі використовуються в таких продуктах Microsoft, як Bing, Office, Dynamics і Azure Cognitive Services, щоб удосконалювати, наприклад, взаємодію з чат-ботами, надання рекомендацій та відповідей на питання, пошук, автоматизацію підтримки клієнтів, створення контенту і вирішення багатьох інших задач на користь сотень мільйонів користувачів.

Архитектура модели DeBERTa
Архітектура моделі DeBERTa

На відміну від інших моделей, DeBERTa враховує не тільки значення слів, але і їх позиції та ролі. Наприклад, у реченні «a new store opened beside the new mall» (англ. «Новий магазин відкрився поруч з торговим центром») вона може зрозуміти, що близькі по контексту значення «store» ( «магазин») і «mall» ( «торговий центр») грають різні синтаксичні ролі (підлягає тут є саме «store»). Більш того, вона здатна визначати залежність слів один від одного. Наприклад, DeBERTa розуміє, що залежність між словами «deep» і «learning» набагато сильніша, коли вони стоять поруч (термін «глибоке навчання»), ніж коли вони зустрічаються в різних пропозиціях.

Незважаючи на те, що модель DeBERTa перевершила людські показники в тесті SuperGLUE, це не означає, що ШІ-модель досягла рівня людини в розумінні природної мови. На відміну від машин, люди добре вміють використовувати знання, раніше отримані при виконанні різних завдань, для вирішення нових – це називається композиційним узагальненням (англ. Compositional generalization). Тому, незважаючи на багатообіцяючі результати DeBERTa в тесті, необхідно продовжити дослідження, для того щоб розвинути у моделі цю навичку.

Microsoft активно працює над удосконаленням технології штучного інтелекту. Так, в жовтні 2020 року був представлений прогресивний ШІ-алгоритм для автоматичної генерації підписів до зображень, які в багатьох випадках виявляються більш точними, ніж написані людьми. Це дозволить зробити продукти і сервіси Microsoft ще більш інклюзивними і доступними для більшої кількості користувачів. В першу чергу, автоматичний опис допомагає людям з порушеннями зору при роботі з документами або веб-сторінками, а також в цілому дозволяє отримати доступ до вмісту будь-якого зображення, наприклад, при пошуку або підготовці презентацій.

Джерело Microsoft 

З питань придбання продуктів Microsoft звертайтеся до наших фахівців +380 (44) 355 07 70 або info@amica.ua

[/vc_column_text][/vc_column][/vc_row]