Novo modelo da Microsoft pode reduzir consumo de energia (ilustração: Vitor Pádua/Tecnoblog)
Resumo
Microsoft revelou em um estudo a BitNet b1.58 2B4T, uma IA de arquitetura de 1 bit que roda em CPUs comuns.
O modelo usa pesos com três valores (-1, 0, 1) e simplifica cálculos, dispensando GPUs e data centers, com desempenho comparável a IAs similares em GPU.
Ainda em fase de testes, a tecnologia pode reduzir consumo de energia e facilitar o uso local de IA em dispositivos pessoais.
Pesquisadores da Microsoft, em colaboração com um especialista da Universidade da Academia Chinesa de Ciências, apresentaram um novo modelo de inteligência artificial que funciona em CPUs convencionais, sem depender de unidades gráficas (GPUs).
A proposta se destaca por utilizar uma arquitetura de 1 bit — modelo que, segundo os desenvolvedores, pode representar um avanço importante na redução do consumo de energia e de recursos computacionais. O trabalho foi divulgado em um artigo científico no arXiv, repositório onde cientistas e pesquisadores do mundo todo publicam versões preliminares de seus estudos, sem revisão por pares.
Como funciona a arquitetura de 1 bit usada pela Microsoft?
Gráfico mostra que BitNet b1.58 2B supera concorrentes em desempenho com menor uso de memória (imagem: reprodução/arXiv)
Batizado de BitNet b1.58 2B4T, o modelo foi projetado para operar com um ambiente de execução próprio, o bitnet.cpp, e tem como diferencial o uso de pesos codificados apenas com três valores: -1, 0 e 1. Isso permite cálculos com operações simples como adição e subtração, facilitando o uso de CPUs comuns em vez de depender de grandes centros de dados com alto custo energético.
Tradicionalmente, os modelos de linguagem utilizam pesos representados por números de ponto flutuante (geralmente com 8 ou 16 bits), o que exige alto poder de processamento e grande volume de memória. A proposta da Microsoft elimina essa necessidade ao reduzir os dados processados para apenas um bit, tornando o modelo mais leve e menos exigente em termos de hardware.
Durante os testes, o novo modelo demonstrou desempenho compatível com outras IAs da mesma categoria executadas em GPU, superando até algumas delas em eficiência. A expectativa é que a simplificação da arquitetura torne possível a execução de modelos avançados em dispositivos pessoais, como notebooks ou até smartphones, sem a necessidade de conexão com a internet ou servidores externos.
O que muda com essa tecnologia?
Tecnologia da Microsoft pode diminuir a dependência de serviços em nuvem (ilustração: Vitor Pádua/Tecnoblog)
Caso os resultados apresentados se confirmem fora do ambiente de testes, a tecnologia pode representar uma mudança importante na forma como usamos modelos de IA no dia a dia. Além de reduzir significativamente o consumo de energia, essa abordagem permitiria que o processamento fosse feito localmente, preservando a privacidade dos usuários e diminuindo a dependência de serviços em nuvem.
Ao dispensar GPUs e grandes estruturas de dados, a Microsoft aponta para uma possível democratização do uso de modelos de linguagem. Rodar assistentes de IA localmente, em dispositivos comuns, pode abrir espaço para novas aplicações em ambientes com acesso limitado à infraestrutura tecnológica tradicional.
Com informações do Tech Xplore
Microsoft apresenta IA que roda em CPUs comuns com arquitetura de 1 bit
Leave a Reply