Você sabia que durante suas chamadas e reuniões no Microsoft Teams você pode remover ruídos de fundo indesejáveis? tudo graças a Inteligência Artificial (IA).
O recurso pode ser habilitado ajustando as configurações do dispositivo antes da chamada ou reunião e selecionando "High/Alto" no menu suspenso "Noise Supression/Supressão de ruído" (observe que esse recurso atualmente só é compatível com o cliente de desktop Windows Teams).
O recurso de supressão de ruído funciona analisando a alimentação de áudio de um indivíduo e usa redes neurais profundas, que foram especialmente treinadas para filtrar o ruído e reter apenas a fala.
Enquanto os algoritmos de supressão de ruído tradicionais podem abordar apenas fontes de ruído estacionárias simples, como um ruído de um ventilador ao contrário da abordagem baseada em IA feita para o Teams em que se aprende a diferença entre fala e ruído desnecessário e que é capaz de suprimir vários ruídos não estacionários, como a digitação no teclado ou som de um pacote de bolachas.
Com o aumento do trabalho em casa devido à pandemia da COVID-19, ruídos como de aspiradores, de aulas conflitantes com a de seus filho ou ruídos na cozinha se tornaram mais comuns, mas são efetivamente removidos por esta tecnologia de supressão de ruído baseada em IA, veja o exemplo no vídeo abaixo.
A supressão de ruído baseada em IA depende do aprendizado de máquina (ML) para aprender a diferença entre fala limpa e ruído. A chave é treinar o modelo de ML em um conjunto de dados representativo para garantir que ele funcione em todas as situações que os usuários de Microsoft Teams estão enfrentando. Deve haver diversidade suficiente no conjunto de dados em termos de discurso limpo, tipos de ruído e ambientes ocorrem as reuniões online.
Para atingir essa diversidade de conjunto de dados, foram criados um grande conjunto de dados com aproximadamente 760 horas de dados de voz limpa e 180 horas de dados de ruído. Para cumprir os rígidos padrões de privacidade da Microsoft, foi garantido que nenhum dado de cliente tenha sido coletado para esta análise. Foram usados dados disponíveis publicamente ou crowdsourcing para coletar cenários específicos.
Para uma fala limpa, foram garantidos equilíbrio entre a fala feminina e masculina e coletados dados de mais de 10 idiomas que também incluem idiomas tonais para garantir que o modelo não altere o significado de uma frase distorcendo o tom das palavras. Para os dados de ruído, foram incluídos 150 tipos de ruído para garantir a cobertura de diversos cenários que os usuários podem encontrar.
Outro aspecto importante foi incluir emoções nos dados referentes a fala limpa, para que expressões como riso ou choro não fossem suprimidas. As características do ambiente a partir do qual os usuários estão participando de suas reuniões também têm um forte impacto no sinal de voz.
Para capturar essa diversidade, o modelo de ML também foi treinado com dados de mais de 3.000 ambientes de sala real e mais de 115.000 salas virtuais criadas sinteticamente.
Teste agora seu Microsoft Teams ou fale conosco e mude para Microsoft 365 para obter o Teams e outras ferramentas de colaboração :)