Пару месяцев назад мне на глаза попалась новость о том, что очередной технологический стартап KRISP привлек $9M. В заметке говорилось, что группа армянских ученых разработала алгоритм, который помогает справится с внешними шумами, когда вы совершаете звонки через Zoom или Skype.
Для меня лично эта заметка попала в точку, так как в нашей семье 3 энергичных малышей, которые сейчас вынуждены оставаться дома и которых очень сложно уговорить находиться в своих комнатах. В тех семьях, у которых несколько детей, я думаю, отлично меня понимают. И хотя, для проведения рабочих звонков, есть отдельное место, тем не менее, звуки и шум, которые производят “спасатели Вселенной”, “воины Галактики”, “монстры”, “пришельцы”, “динозавры” и другие детские фантастические персонажи, порой, возникают в самый неподходящий момент - во время важного звонка или интервью.
Я давно интересуюсь темой повышения продуктивности и нахожусь в постоянном поиске различных сервисов и инструментов повышения продуктивности. С недавних пор я делюсь своей базой полезных утилит и сервисов в рамках проекта Startup Services (https://startupservices.io). Естественно, я не смог обойти стороной KRISP и решил опробовать его в бою!
Что такое KRISP?
KRISP основали два выходца из Армении - Артавазд Минасян и Давит Багдасарян - в октябре 2017 года. По информации с сайта, на момент основания в компании было 7 сотрудников, 6 из которых - кандидаты физических или математических наук.
Сейчас в компании 25 сотрудников, которые работают над разработкой и исследованиями продукта — все они находятся в Армении. «К концу 2021 года это будет команда из 45 человек, все из Армении», — сказал Багдасарян.
По словам основателя Давита Багдасаряна, только за 2020 год выручка компании выросла на 2000%, число пользователей увеличилось в 20 раз, число корпоративных пользователей в 23 раза. Общая аудитория пользователей более 1 млн. чел и более 1200 компаний. Среди основных клиентов - банки, юридические агентства, HR-платформы, колл-центры. Из известных брендов KRISP сотрудничает с GitHub, Zapier, Discord, Intel. Безусловно, на такой бурный рост повлияла пандемия, увеличение количества коммуникаций через Zoom, Skype, Google Meet и др. инструменты видеоконференцсвязи.
В августе 2020 года компания привлекла $5M, а в феврале 2021 года еще $9M. По данным Crunchbase общая сумма привлеченных средств составляет $17.5M. KRISP планирует потратить деньги инвесторов на найм новых сотрудников, увеличение продаж и маркетинг.
От идеи к продукту
Идея сервиса, который бы скрывал посторонние шумы, пришла Давиту Багдасаряну в 2016 году. В то время он работал в компании Twilio, которая специализировалась на API для корпоративных коммуникаций. Во время многочисленных командировок ему приходилось общаться с командой, находясь при этом в самых разных местах - от кафе до аэропорта. Своей идеей он поделился со своим другом - доктором математических наук - Артаваздом Минасяном.
Осенью 2017 года Багдасарян уволился из Twilio и приехал в Армению, где они вместе с Минасяном создали совместную компанию и начали разработку технологии шумоподавления.
Как работает технология?
Технология шумоподавления KRISP работает на основе машинного обучения. Для обучения нейросети команда использовала два набора данных: первый - десятки тысяч аудио-записей различных шумов, и второй - чистые аудио-записи человеческой речи, сделанные в студии.
После продолжительных экспериментов по обучению нейросети, путем комбинации различных вариантов шумов и голоса, они получили работоспособную технологию.
Технология может блокировать как входящие, так и исходящие посторонние звуки. Например, когда ваш собеседник находится в оживленном шумном месте, а вы в тихом и спокойном месте, вы можете включить подавление шумов только для вашего собеседника, передвинув только один из ползунков. Вторая ситуация - обратная, когда у вас на фоне много посторонних шумов, вам лучше включить режим шумоподавления - передвинув ползунок микрофона.
В качестве примеров раздражающих звуков и шумов, с которыми справляется технология: стук клавиш, вой собаки, шуршание бумаги, шум аэропорта, кафе или улицы, шум воды, плач или крик ребенка.
В дополнительных настройках сервиса есть опция удаления эха, при этом разработчики предупреждают, что эта функция пока носит экспериментальный характер.
И что - реально работает?
В настоящее время технология реализована в виде десктопного приложения для Windows и macOS.
Само приложение имеет крайне минималистичный дизайн и может интегрироваться со следующими приложениями: Zoom, Skype, Google Meet, Slack, Google Hangouts, Facetime, Webex.
Также вы можете использовать KRISP и в других приложениях, для этого вам нужно в настройках приложения выбрать источник звука и микрофона - krisp microphone и krips speaker соответственно.
Статус использования микрофона и динамиков отображается в приложении
В последних версиях разработчики добавили удобный полупрозрачный виджет, который появляется автоматически при звонке и отображает статус - задействована ли в данный момент технология шумоподавления или нет.
Например, в моем Zoom настройки звука выглядят следующим образом:
Настройки приложения также не содержат никаких удивительных элементов. Все просто и лаконично.
В бесплатной версии есть лимит в 120 минут в неделю, которого вполне может хватить, если ваши звонки из шумных мест совершаются достаточно редко.
Персональная PRO-версия приложения стоит $5 в месяц и снимает ограничение в 120 минут в неделю.
Тариф для команд, также стоит $5 в месяц с пользователя (для команд до 50 человек) и добавляет такие опции, как: управление командой, контроль выставления счетов, единая авторизация, приоритетная поддержка.
Для более крупных корпоративных клиентов условия тарифа не раскрываются и доступны по запросу.
Ресурсы, на которых вы можете найти информацию и видеобзоры, помогающие с процессом установки и настройки:
- Информация об обновлениях - Krisp - What’s New at Krisp
- Блог - Krisp | Blog
- Видео-инструкции на Youtube - Before you continue to YouTube
- Help Center - Krisp Help
Впечатления от личного использования
Как человек, который не привык верить рекламным обещаниям и проверяет все инструменты самостоятельно - сказывается опыт Linux-администратора в прошлом :) , я некоторое время пользовался бесплатной версией приложения и устраивал настоящие проверки!
Например, во время звонка в Zoom я просил своих детей, чтобы они специально кричали и бегали, изображая взлет и посадку реактивных истребителей. Периодически включая и отключая KRISP я интересовался у своего собеседника - ощущает ли он разницу в качестве голоса, слышит ли он посторонние шумы и тд
Безусловно, чудес не бывает, и, если вокруг вас сильные шумы, крики - качестве вашего голоса нельзя будет сравнить с записью аудио в студии. Однако, со слов моих собеседников, они слышали все эти шумы “где-то очень далеко”, хотя на самом деле малыши носились вокруг моего стола, очень довольные, что им наконец-то предоставили такую уникальную возможность - пошуметь в рабочем кабинете отца :)))
Буду ли я дальше пользоваться KRISP и буду ли рекомендовать своим знакомым и собеседникам, которые сталкиваются с аналогичными проблемами? Однозначно, да.
С наилучшими пожеланиями хорошего дня и качественных коммуникаций без раздражающих шумов,
Павел Черкашин
Винда:
— nvidia видеокарта (rtx ибо нужны тензор-ядра, но, вроде, недавно добавили часть функций и для 1ххх серий);
— бесплатно скачиваете nvidia broadcast
— profit в виде идеального шумоподавления нейронками, как входящего (собеседник), так и исходящего (микрофон). Плюс, работа с фоном (блюр, замена фона и т. д.)
Пользуюсь пару лет уже. Могу подтвердить — хорошо давит шумы, когда приходится подключаться к звонку, например, из кафе. Без чудес: если шум по громкости перекрывает голос, то всё равно собеседник будет слышать кашу; или в моменты пауз, пока молчишь, он может пропускать окружающие звуки.
Плюсую — тоже пользуюсь с самого начала. До локдауна покупал подписку, т.к. работал часто из аэропортов, кафе и опен-спейса. Сейчас не использую, т.к. дома нет таких шумов, чтобы заморачиваться с включением Криспа.