«Яндекс» запустила новый сервис «Балабоба», который использует ИИ на основе языковой модели Yet another Language Model (YaLM) и способен генерировать каждое последующее слово в предложении. Нейросеть с 3 млрд параметров в процессе обучения использовала страницы «Википедии», новостные статьи, книги, открытые записи в социальных сетях и другие материалы. YaLM используется для формирования ответов в поисковике «Яндекса» и ответах голосового помощника «Алиса».
Согласно имеющимся данным, новый сервис «Яндекса» способен генерировать текст в разных стилях, таких как народные мудрости, телевизионные репортажи, тосты, рекламные слоганы и др. Чтобы получающиеся в результате генерации тексты были правильными грамматически и разнообразны с лексической точки зрения, в процессе обучения использовались терабайты данных. Разработчики также исключили из выборки повторяющиеся, незаконченные и неестественные тексты, чтобы модель не была излишне перегруженной.
Главная особенность YaLM заключается в способности быстро обучаться новому. Достаточно всего несколько примеров, чтобы нейросеть могла писать осмысленные отзывы на фильмы, застольные тосты или теории заговора. Для достижения результата хватит от пяти до нескольких десятков примеров, показывающих, каким образом нужно писать такие тексты, чтобы нейросеть смогла в дальнейшем составлять осмысленные заметки. Разработчики отмечают, что для генерации простых рекламных слоганов нейросеть обучалась на нескольких известных примерах, включая «Найдётся всё», знаменитом слогане «Яндекса».