A Nvidia anunciou uma nova plataforma de videoconferência para desenvolvedores chamada Nvidia Maxine, que poder corrigir alguns dos problemas mais comuns em chamadas de vídeo como correção do olhar, o que vai permitir que o interlocutor mantenha o contato visual com a câmera; substituição da imagem do usuário por avatares; tradução de idiomas em tempo real; troca das imagens de fundo; cancelamento de ruídos do ambiente; iluminação facial e outras em tempo real

O  Maxine processará chamadas na nuvem usando GPUs da Nvidia e aumentará a qualidade da chamada de várias formas com a ajuda da inteligência artificial.

Nem todos esses recursos são novos, é claro. A compressão de vídeo e a transcrição em tempo real são comuns, e a Microsoft e a Apple introduziram o alinhamento do olhar no Surface Pro X e FaceTime para garantir que as pessoas mantenham contato visual durante as chamadas de vídeo (embora os recursos de alinhamento de rosto da Nvidia aparenta ser muito melhor).

A Nvidia espera que sua influência na computação em nuvem e seu impressionante trabalho de P&D de IA ajudem a superar seus concorrentes. O verdadeiro teste, porém, será ver se alguma empresa de videoconferência do mercado adota a tecnologia da Nvidia.
Maxine não é uma plataforma para o consumidor final, mas um kit de ferramentas para empresas terceirizadas melhorarem seu próprio software. Até agora, porém, a Nvidia anunciou apenas uma parceria – com a empresa de comunicações Avaya, que usará recursos selecionados do Maxine . Conforme indicado na imagem abaixo, todos os principais fornecedores de nuvem estão oferecendo Maxine como parte de seus serviços de nuvem GPU Nvidia.

A Nvidia afirma que seu recurso de compressão usa um método de IA conhecido como redes adversárias geradoras ou GANs para reconstruir parcialmente os rostos dos chamadores na nuvem. Esta é a mesma técnica usada em muitos deepfakes. “Em vez de transmitir a tela inteira de pixels, o software de IA analisa os principais pontos faciais de cada pessoa em uma chamada e, em seguida, reanima de forma inteligente o rosto no vídeo do outro lado”, disse a empresa em um blog. “Isso possibilita o streaming de vídeo com muito menos dados fluindo de um lado para o outro na Internet.”

Como sempre com esses anúncios iniciais, precisaremos ver mais dessa tecnologia em ação e esperar por quaisquer acordos de parceria que a Nvidia faça antes de sabermos quanto efeito isso terá nas chamadas de vídeo diárias. Mas o anúncio da Nvidia mostra como o futuro da videoconferência será mais artificial do que nunca, com a IA usada para endireitar seu olhar e até reconstruir seu rosto, tudo em nome da economia de largura de banda.