O líder do Windows da Microsoft, Pavan Davuluri, indicou que a próxima iteração do Windows será “mais ambiente, difundido e multimodal”, pois a inteligência artificial (AI) está definida para redefinir a interface da área de trabalho e a interação do usuário com computadores.

Em uma recente entrevista em vídeo, Davuluri, que atua como Microsoft CVP e Boss Windows, elaborou o futuro da plataforma, destacando mudanças significativas previstas para o sistema operacional. Quando questionado sobre o impacto da IA na interação humano-computador, Davuluri afirmou: “Acho que veremos a computação se tornar mais ambiental, mais difundida, continuar a abordar fatores de forma e certamente se tornar mais multimodal no arco de tempo.

Esta não é a primeira instância em que a Microsoft sugeriu priorizar a voz como um método de entrada primária para o Windows. Um vídeo “Windows 2030 Vision”, lançado apenas a semana anterior pelo CVP da Enterprise & Security da Microsoft, também explorou um futuro semelhante para o sistema operacional, reforçando a direção da empresa. A próxima experiência do Windows deve integrar a voz como um método de entrada de primeira classe, permitindo que os usuários interajam com o sistema operacional usando a linguagem natural. Esse recurso permitirá que o sistema compreenda a intenção do usuário com base no contexto na tela, complementando as entradas tradicionais de mouse e teclado.

Davuluri também sugeriu que a aparência visual do Windows provavelmente evoluirá significativamente devido à IA agêntica. Ele observou: “Acho que as interfaces humanas são hoje e como elas são daqui a cinco anos é uma grande área de impulso para nós que o Windows continua a evoluir. O sistema operacional é cada vez mais agêntico e multimodal … essa é uma área de tremendo investimento e mudança para nós”.

Além disso, Davuluri enfatizou o papel crucial da computação em nuvem para permitir essas experiências futuras. Ele explicou: “A computação se tornará difundida, como nas experiências do Windows, usará uma combinação de recursos locais e que estão na nuvem. Acho que é nossa responsabilidade garantir que sejam perfeitas para nossos clientes”. Isso indica uma abordagem híbrida, alavancando o poder de processamento local e os recursos baseados em nuvem para oferecer experiências contínuas do usuário.

A Microsoft parece estar posicionando o Windows como um assistente de IA integrado, indo além do modelo atual, onde os assistentes de IA funcionam principalmente como aplicativos ou sobreposições separadas nos sistemas operacionais existentes. Ao contrário dos assistentes atuais de IA, como Copilot, no Windows, Gemini no Android ou Siri no Mac, que operam como aplicativos distintos ou janelas flutuantes, as janelas futuras prevêem ter IA intrinsecamente tecida em toda a sua arquitetura. Essa integração fundamental da IA sugere uma profunda mudança na maneira como o sistema operacional é projetado e utilizado.

Prevê-se que essa mudança transformadora se concretize nos próximos cinco anos, potencialmente com o lançamento do Windows 12. Vários executivos de alto nível da Microsoft aludiram a este ser uma mudança significativa de paradigma para a plataforma e a computação em geral, impulsionada pelos avanços da IA.

Embora o conceito de se tornar um método de entrada primária e confiável para PCs possa inicialmente parecer desafiador para alguns usuários entender, espera -se que a integração da IA agêntica e a capacidade do sistema operacional de compreender a intenção do usuário e a linguagem natural façam que a experiência pareça mais intuitiva do que o previsto. A mudança não é exclusiva da Microsoft; Há rumores de que a Apple esteja desenvolvendo um recurso centrado em voz para o iOS 26, o que permitiria aos usuários do iPhone navegar apenas em aplicativos por comandos de voz, indicando uma tendência mais ampla da indústria para uma interação de voz aprimorada.

No Windows, é provável que a voz sirva como um método de entrada adicional, juntamente com o mouse e o teclado, criando três modalidades de interação primária: digitar, toque/mouse e voz. Embora a entrada de voz possa não ser obrigatória para a conclusão da tarefa, sua inclusão deverá otimizar os fluxos de trabalho e aumentar a produtividade.

No entanto, espera-se que a adoção generalizada de experiências tão orientadas pela IA levanta preocupações significativas de privacidade. Essas funcionalidades avançadas exigirão acesso a quantidades substanciais de dados pessoais do usuário para otimizar sua utilidade. Juntamente com a necessidade declarada da Microsoft de um equilíbrio entre a computação local e a nuvem para facilitar essas experiências, há uma antecipação de uma potencial reação pública em relação à privacidade e segurança de dados.

Source: A Microsoft quer que o próximo Windows seja multimodal