Компанія Alibaba випустила нову модель штучного інтелекту, яка має здатність розуміти зображення та проводити більш складні розмови, ніж їхні попередні продукти, – повідомляє internetua.
Китайський технологічний гігант оголосив, що дві нові моделі – Qwen-VL і Qwen-VL-Chat – матимуть відкритий вихідний код. Це означає, що дослідники, науковці та компанії з усього світу зможуть використовувати їх для створення власних програм штучного інтелекту без необхідності відновлювати навчання системи з нуля. Це значно економить час і ресурси.
Представники Alibaba стверджують, що Qwen-VL може відповідати на запити, пов'язані з різними зображеннями, і створювати підписи до них.
З іншого боку, Qwen-VL-Chat забезпечує більш «складну взаємодію», зокрема порівнянням кількох введених зображень та відповіддю на послідовні раунди запитань. До завдань, які може виконувати Qwen-VL-Chat, входить написання історій та створення зображень на основі фотографій, які надає користувач. Також вона вміє вирішувати математичні рівняння, що відображені на зображенні.
Alibaba приводить приклад з табличкою у лікарні, де Qwen-VL-Chat може відповісти на запитання щодо розташування певних відділень, інтерпретуючи зображення знаку.
До цього моменту більшість генеративних систем штучного інтелекту, де технологія формує відповіді на основі введеного користувачем тексту, були націлені на роботу з текстом. Остання версія OpenAI ChatGPT також має здатність розуміти зображення та надавати відповіді у текстовому вигляді, подібно до Qwen-VL-Chat.
Підписуйтесь на наш telegram-канал t.me/sudua та на Twitter, а також на нашу сторінку у Facebook та в Instagram, щоб бути в курсі найважливіших подій.