От диплома до продакшена: Часть 2: Как я проектировал опыт пользователя

Wait 5 sec.

Всплески в аудиосигнале Когда я глазами просматривал результаты разбора звука, я понял, что ещё происходит всплески по голосу.«Я имею в виду, когда человек читает книгу или в телевизоре происходит какое-то действие, то оно происходит примерно на одной волне, в небольшом диапазоне разброса. А когда человек подаёт команду, то у него меняется выборка голоса. Он становится плотнее и громче. В общем, на цифрах это хорошо заметно, и здесь нейросеть как раз способна извлечь необходимые паттерны для того, чтобы отделить команду от повседневной бытовой речи.» Читать далее