Российская IT-компания "Яндекс" выложила в интернет код YaLM 100B — нейросети для генерации и обработки текстов на русском и английском языках. По информации "Яндекса", это самая большая русскоязычная нейросеть, опубликованная в свободном доступе. Об этом сообщила пресс-служба компании.
"YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире", — рассказали в пресс-службе "Яндекса".
Компания отмечает, что современную нейросеть можно использовать как для развлечения, так и для создания коммерческой рекламы, описания товаров, генерации любых текстов и даже стихов. Также программа на основе алгоритмов "Яндекса" сможет классифицировать текст по функциональному стилю.
Модель YaLV 100B обучалась на суперкомпьютерах "Яндекса", признанных мощнейшими во всей Восточной Европе. По заверению компании, в ходе машинного обучения нейросеть обработала порядка 2 терабайт текстов из открытых источников и страниц английского и русского интернета. В данный момент нейросеть предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Ранее нейросеть от Google научили генерировать изображения по описанию. Для создания новых изображений нейросеть использует метод диффузии: сначала программа рисует небольшой схематичный набросок, который дальше улучшается и увеличивается в разрешении вплоть до максимального соответствия запросу. В данный момент доступны такие паттерны нейросети, как, например, изображения с текстовым описанием "фото енота с солнечными очками на скейтборде" или "картина маслом персидского кота, играющего на гитаре".