Por que é que isto importa: a visão computacional é essencial para muitas aplicações de Inteligência Artificial (IA) – de carros sem condutores e robôs industriais a sensores inteligentes que agem como olhos em locais remotos – as máquinas tornaram-se muito boas a responder ao que veem. Mas a maioria dos softwares de reconhecimento de imagem precisa de muito poder computacional para funcionar. Parte do problema é um obstáculo encontrado nos sensores tradicionais, que capturam uma enorme quantidade de dados visuais, independentemente de serem úteis ou não para classificar e identificar uma imagem. O processamento de todos esses dados torna as coisas mais lentas.
Um sensor que captura e processa as imagens simultaneamente, sem converter ou repassar os dados, faz com que o uso do reconhecimento de imagem seja muito mais rápido e consuma muito menos energia. O projeto, publicado no dia 4 de março na Nature pelos investigadores do Institute of Photonics de Viena, imita a forma que os olhos de animais pré-processam as informações visuais antes de repassá-las para o cérebro.
Como funciona: A equipa construiu o chip a partir de uma lâmina de disseleneto de tungstênio com apenas alguns átomos de espessura, entalhada com diodos sensores de luz. Os investigadores então conectaram os diodos para formar uma rede neural. O material usado para fabricar o chip fornece propriedades elétricas únicas, de modo que a fotossensibilidade dos diodos – os nós da rede – possa ser ajustada externamente. Isto significava que a rede poderia ser treinada para classificar as informações visuais, adequando a sensibilidade dos diodos até que se conseguisse as respostas corretas. Dessa maneira, o chip inteligente foi treinado para reconhecer versões estilizadas e pixelizadas das letras “n”, “v” e “z”.
Visão limitada: Este novo sensor é um passo emocionante no caminho para começar a incluir mais IA nas máquinas, tornando-as mais rápidas e eficientes. Mas ainda há um longo percurso pela frente. Para começar, o olho consiste em apenas 27 detectores e não consegue lidar com muito mais do que imagens compactadas 3×3. Mesmo pequeno, o chip pode executar várias tarefas básicas de machine learning supervisionadas e não supervisionadas, incluindo a classificação e codificação de letras. Os investigadores argumentam que expandir a rede neural em tamanhos muito maiores seria simples.
Artigo de Will Douglas Heaven, Senior Editor – MIT Technology Review EUA