Китайська компанія DeepSeek у співпраці з Університетом Цінхуа презентувала інноваційний підхід до навчання моделей штучного інтелекту, який дозволяє суттєво скоротити витрати на цей процес. Про це повідомляє Bloomberg.
Йдеться про нову методику, за якою штучний інтелект самостійно закріплює набуті знання, краще адаптуючись до людських запитів та очікувань.
Зокрема, підхід базується на вдосконаленому навчанні з підкріпленням — техніці, що вже показала свою результативність у вузькоспеціалізованих завданнях, але досі була складною для реалізації в універсальних моделях.
Команда DeepSeek заявляє, що їм вдалося подолати ці труднощі: їхня система демонструє кращі результати за менших обчислювальних витрат у порівнянні з наявними технологіями.
Розробники назвали нові моделі DeepSeek-GRM (generalist reward modeling) та планують зробити їх з відкритим вихідним кодом, що дозволить іншим дослідникам і компаніям скористатися досягненням.
Підписуйтесь на наш Telegram-канал t.me/sudua та на Google Новини SUD.UA, а також на наш VIBER, сторінку у Facebook та в Instagram, щоб бути в курсі найважливіших подій.