Четверг, 22 Октября 2020

Оценить материал


Вставить в блог

Bookmark and Share

Голосовой помощник Google научился распознавать песни по напеванию и свисту

16 Октября, 2020

Голосовой помощник Google научился распознавать песни по напеванию и свисту. Фото: techcrunch.com

Голосовой помощник Google научился распознавать песни по напеванию и свисту. Фото: techcrunch.com

Google Assistant научился распознавать не только записанные песни, но и напетые или насвистанные. После обработки записи алгоритмами машинного обучения приложение выдает наиболее вероятные песни и указывает вероятность совпадения. Функция доступна в приложении или виджете Google для Android, а также iOS, но только на английском).

Уже много лет для смартфонов разрабатывают программы, которые могут распознавать играющие рядом песни. Реализация алгоритмов варьируется от программы к программе, но в целом их принцип работы заключается в анализе пиков на спектрограмме аудиозаписи, преобразовании этих данных в акустический отпечаток и сравнение его с отпечатками из базы данных. 

Поскольку данные сравниваются с базой в сильно сжатом виде, по сути отражающем основную мелодию песни, потенциально такой же способ можно применять и для напетых мелодий. На практике это сложная задача, потому что данные могут быть неполными (человек забыл часть мелодии) и искаженными, а вместо нескольких инструментов при напевании используется лишь один «инструмент».

Несколько лет назад подобную функцию реализовали разработчики приложения SoundHound, а теперь она также появилась в поиске Google – для этого нужно спросить голосового помощника, что за песня сейчас играет. Разработчики обучили новые нейросетевые модели на записях людей, насвистывающих и напевающих различные песни со словами или без. В результате сервис распознавания песен научился сопоставлять такие записи с обычными песнями из своей базы.

На момент запуска функция доступна в последних версиях приложений Google на Android и iOS, при этом на Android она работает с более чем 20 языками, в том числе на русском, а на iOS пока она доступна только на английском, но компания обещает расширять список языков. После того, как алгоритмы прослушали песню, приложение выдает не конкретную песню, как происходит обычно, а три на выбор с указанием вероятности соответствия для каждой из них, и, в некоторых случаях, кнопку с дополнительными результатами.

В прошлом году разработчики из Google создали алгоритм, который слушает, как пользователь поет песни группы Queen, и определяет, насколько он похож на Фредди Меркьюри по манере исполнения.

Источник: N+1

Просмотров: 262

Вставить в блог

Оценить материал

Отправить другу



Добавить комментарий

Введите символы, изображенные на картинке в поле слева.
 

0 комментариев

И Н Т Е Р В Ь Ю

НАЙТИ ДОКТОРА

Новостная лента

Все новости