Розробники компанії Meta*, зокрема Марк Цукерберг, створили нову нейромережу Make-A-Video, яка вміє генерувати відео з текстового опису.
Про це повідомили у виданні Mashable.
Зараз Make-A-Video може генерувати відео не більше 5 секунд із низькою якістю та без звуку, однак це все одно великий крок уперед на тлі того, що існувало до.
Читайте також: Нейромережа показала майбутнє: ядерний вибух у Москві та футуристичний Київ
"Згенерувати відео набагато важче, ніж фотографії, тому що крім правильного створення кожного пікселя, система також має передбачити, як вони змінюватимуться з часом. Make-A-Video вирішує цю проблему, додаючи рівень неконтрольованого навчання, який дозволяє системі розуміти рух у фізичному світі та застосовувати його до традиційного генерування тексту в зображення", - написав Марк Цукерберг.
Ця система працює так: Make-A-Video аналізує текстовий запит і генерує 16 кадрів відео з роздільною здатністю 64 на 64 пікселі кожен. Потім їх збільшують за допомогою іншої системи - і готово. Як стверджують розробники, нейромережу навчали робити зображення й рухати їх на мільйонах відеороликів, зокрема, стокових.
"Усі ці відео були згенеровані системою штучного інтелекту, створеною нашою командою Meta. Ми називаємо це Make-A-Video. Ви даєте йому текстовий опис, і він створює для вас відео. Ми дали йому такі описи, як: "плюшевий ведмедик, який малює автопортрет", "немовля-лінивець із в’язаною шапочкою намагається зрозуміти ноутбук", "космічний корабель, що приземляється на Марс", і "робот, що катається на хвилі в океані", - додав опис до відео Цукерберг.
Раніше "Апостроф" повідомляв, що компанія Цукерберга показала рукавички віртуальної реальності.