Компания Alibaba выпустила новую модель искусственного интеллекта, которая обладает способностью понимать изображения и проводить более сложные разговоры, чем их предыдущие продукты, – сообщает internetua.
Китайский технологический гигант объявил, что две новые модели – Qwen-VL и Qwen-VL-Chat – будут иметь открытый исходный код. Это означает, что исследователи, ученые и компании со всего мира смогут использовать их для создания собственных программ искусственного интеллекта без необходимости восстанавливать обучение системы с нуля. Это значительно экономит время и ресурсы.
Представители Alibaba утверждают, что Qwen-VL может отвечать на запросы, связанные с различными изображениями, и создавать подписи к ним.
С другой стороны, Qwen-VL-Chat обеспечивает более "сложное взаимодействие", включая сравнение нескольких введенных изображений и ответ на последовательные раунды вопросов. К задачам, которые может выполнять Qwen-VL-Chat, входит написание историй и создание изображений на основе фотографий, которые предоставляет пользователь. Также она умеет решать математические уравнения, которые отображены на изображении.
Alibaba приводит пример с табличкой в больнице, где Qwen-VL-Chat может ответить на вопрос о расположении определенных отделений, интерпретируя изображение знака.
До этого момента большинство генеративных систем искусственного интеллекта, где технология формирует ответы на основе введенного пользователем текста, были нацелены на работу с текстом. Последняя версия OpenAI ChatGPT также обладает способностью понимать изображения и предоставлять ответы в текстовом виде, подобно Qwen-VL-Chat.
Подписывайтесь на наш Тelegram-канал t.me/sudua, на Twitter, а также на нашу страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.