Google NotebookLM в один клик превращает в подкаст любой документ. Все бросились создавать шоу из чеков, банковских счетов и пользовательских соглашений

14 Октября, 2024

Google NotebookLM в один клик превращает в подкаст любой документ.

В сентябре компания Google представила Audio Overview — новый инструмент сервиса NotebookLM: теперь пользователи могут превратить любой документ, текст или ссылку на статью в «вовлеченную аудиодискуссию» двух ИИ-ведущих. Объявляя о новой функции, в Google, кажется, не рассчитывали произвести фурор в мире подкастов, но именно так и произошло

За последний месяц стриминговые платформы заполонили сотни шоу, сделанных с помощью NotebookLM. Простота сервиса позволяет за короткое время сгенерировать десятки «аудиодискуссий», причем программа умудряется создать осмысленный разговор буквально из ничего (среди экспериментов есть даже десятиминутный выпуск, созданный из двух слов — «какать» и «пукать»). Одни подкастеры воодушевлены новыми возможностями, другие опасаются, что их услуги больше не нужны.

Сервис NotebookLM, по задумке Google, должен помогать пользователям структурировать сложную информацию, вычленять главное из исследований, выбирать ключевые цитаты и так далее. Функция Audio Overview появилась как еще один способ обобщить документы и выделить в них самое важное — в формате непринужденной беседы двух ИИ-голосов, мужского и женского.

Чтобы создать «аудиодискуссию», достаточно загрузить ссылки или текст, нажать на кнопку Deep Dive Сonversation (или «Глубокое погружение в темы разговора» в русской версии) — и уже через пару минут система выдает аудиофайл с обсуждением вашей темы. При этом, как отмечает редакционный директор Google Labs Стивен Джонсон, NotebookLM опирается только на информацию, которую загружает пользователь, и не ищет дополнительный контекст извне, что отличает систему от других чат-ботов. Пока «аудиодискуссии» работают в тестовом режиме только на английском языке, но загружать материалы можно и на других языках.

«Вы можете превратить в подкаст вашу домашнюю работу, чтобы послушать ее в тренажерном зале. Или взять заседания городского совета и рассказать о них широкой публике в формате подкаста, не тратясь на звукозаписывающую студию», — добавляет Стивен Джонсон.

«Это одна из самых убедительных и совершенно ошеломляющих демонстраций потенциала искусственного интеллекта», — считает колумнист The Wall Street Journal Бен Коэн. И восхищается тем, что в разговорном формате теперь можно представить что угодно: дипломную работу, заметки с рабочей встречи, рецепт лазаньи, чек из магазина или банковский счет. 

Пользователи быстро оценили новый инструмент и стали активно экспериментировать с форматом. С помощью NotebookLM запустили исторический подкаст по мотивам статей из «Википедии». Среди других примеров эпизод, в котором ведущие внезапно осознают, что они не настоящие люди, и переживают экзистенциальный кризис. А также вполне серьезная дискуссия, основанная на файле со словами poop и fart («какать» и «пукать»), написанными тысячу раз подряд.

Почему продукт Google вызвал такой ажиотаж?

Приложения и различные инструменты с использованием нейросетей в современной аудиоиндустрии, разумеется, не редкость. Искусственный интеллект применяют для клонирования голосов, дубляжа видеороликов, для монтажа и расшифровок.

NotebookLM выделяется на этом фоне тем, что, во-первых, это бесплатно. Во-вторых, сервисом легко пользоваться — подкасты создаются в один клик. В-третьих, результат получается очень реалистичным — и в этом главная причина такого невероятного интереса к технологии.

Google старается делать разговоры ИИ-ведущих похожими на живую беседу. По словам редакционного директора Google Labs Стивена Джонсона, если ведущие будут произносить по очереди только правильно написанные предложения из идеального сценария, никто не станет это слушать. Поэтому гугловские ведущие запинаются, делают паузы, перебивают друг друга, эмоционально удивляются, и вставляют в речь слова-паразиты.

Неужели подкасты, созданные в NotebookLM, так хороши?

Google предупреждает пользователей, что NotebookLM «иногда может давать неточные ответы» и рекомендует «проверять факты самостоятельно». Поэтому в «аудиодискуссиях», пусть они на первый взгляд и звучат очень убедительно, все еще немало ошибок. Ведущие могут неверно произносить имена, неправильно интерпретировать загруженные материалы и высказывать странные оценочные суждения.

«Стоит ли доверять этой программе?» — задается вопросом обозреватель The Washington Post Джеффри Фаулер. В числе неудачных примеров он приводит подкаст, который у NotebookLM получился по итогам дебатов кандидатов в вице-президенты США. В этом эпизоде ИИ-ведущие среди прочего заявили, что для демократа Тима Уолза критика в адрес республиканца Дональда Трампа — «очень рискованный ход».

Профессор американского Университета Брауна Шрирам Кришнамурти рассказал, что прогнал через NotebookLM аннотации к своим научным работам. Результат ученый оценил на «тройку», потому что программа не смогла понять, на чем сосредоточиться и какие данные выделить.

«Сбои происходят на уровне обобщений», — признает старший менеджер по продукту Google Labs Райза Мартин. Она поясняет, что ИИ-ведущие пытаются находить аналогии, которые могут быть более или менее удачными в зависимости от того, насколько серьезные материалы загружает пользователь.

«Вы не услышите от ведущих вымышленные ответы или чепуху ни о чем. Но новых идей или чего-то по-настоящему смешного от них вы тоже не добьетесь», — добавляет колумнист The Wall Street Journal Бен Коэн.

Какое будущее ждет сервис Google?

Детектор «фейковых» подкастов, созданных через NotebookLM, который в октябре запустила компания ListenNotes, за первые дни работы обнаружил уже почти 900 шоу, созданных при помощи искусственного интеллекта. Впрочем, пользователей это не останавливает, и количество ИИ-подкастов продолжает расти.

И хотя некоторые подкастеры уже заявляют, что готовы уйти из профессии, шум вокруг нового инструмента Google скорее напоминает недолгий взлет Clubhouse в 2021 году. Audio Overview — модное и забавное развлечение, но как долго он будет популярен?

Учитывая несовершенство алгоритма, авторы и слушатели вряд ли полностью перейдут на подкасты, сгенерированные нейросетями, полагает исследовательница в области искусственного интеллекта Варшита Шер. По ее мнению, люди быстро устанут на регулярной основе слушать однотипные шоу. «Если вы слушаете эпизоды каждый день или каждую неделю, бесчисленные аналогии ведущих и их постоянные восклицания „Точно!“ могут вас утомить», — говорит она.

Впрочем, подкасты далеко не единственная сфера, в которой может пригодиться приложение NotebookLM. Обозреватель The Washington Post Джеффри Фаулер видит здесь новые возможности для образования и исследований. По его мнению, инструмент Google поможет людям разобраться в научных публикациях или юридических документах.

Кроме того, NotebookLM будет полезен для студентов, которые привыкли воспринимать информацию на слух, считает профессор Колледжа Сент-Питерсберг во Флориде Кристиан Мориарти. При этом он подчеркивает, что не стоит слепо верить искусственному интеллекту: «Не надо забывать развивать критическое мышление». А профессор Сара Итон из Университета Калгари предлагает относиться к подкастам NotebookLM как к экранизациям классической литературы: по ее мнению, это всего лишь еще один способ объяснить людям сложную информацию.

Источник: Meduza