декември 4, 2024

92% за половин наносекунда: MIT интегрира невронна мрежа във фотонен процесор

Изследователи създадоха чип за дълбоко машино обучение, базиран на светлината.

Изследователи от Масачузетския технологичен институт (MIT) и други организации разработиха напълно интегриран фотонен процесор, който може да извършва ключови изчисления на дълбоки невронни мрежи по оптичен път директно върху чипа.

Съвременните модели за дълбоко обучение стават толкова сложни, че достигат границите на възможностите на традиционния електронен хардуер. Фотонните устройства, които използват светлина за изчисленията, предлагат по-бърза и по-енергийно ефективна алтернатива, но досега те не можеха да извършват всички видове изчисления на невронните мрежи. Нелинейните операции изискват използването на външна електроника, което забавя процеса и увеличава разходите за енергия.

Новото устройство решава този проблем. При тестването фотонният процесор е извършил ключовите изчисления на задачата за класификация за по-малко от половин наносекунда, като е постигнал точност от над 92%, което е сравнимо с производителността на традиционния хардуер.

Чипът се състои от взаимосвързани модули, които образуват оптична невронна мрежа. Той е произведен с помощта на промишлени процеси за производство на чипове, което открива възможности за мащабиране на технологията и интегрирането ѝ в електрониката.

Работата на системата се основава на кодиране на параметрите на модела на дълбоката невронна мрежа в светлина. Програмируемите делители на лъча извършват матрично умножение на входните данни, а нелинейните оптични функционални блокове (NOFU) реализират нелинейните функции. За тази цел те отклоняват малка част от светлината към фотодиоди, които преобразуват оптичните сигнали в електрически ток. Този подход намалява консумацията на енергия и избягва използването на външни усилватели.

Фотонната система демонстрира над 96% точност по време на обучението и над 92% точност по време на извеждането на резултатите. Всички ключови операции се извършват за по-малко от половин наносекунда.

Устройството е изградено върху стандартната инфраструктура и производствени процеси, използвани за производството на CMOS чипове, което прави възможно масовото производство с минимални отклонения.

Фотонният процесор има потенциал за приложение в сложни от изчислителна гледна точка задачи, като например лидарни системи, научни изследвания в областта на астрономията и физиката на елементарните частици и високоскоростни телекомуникации. Той може да бъде полезен и за обработка на данните в реално време.

По-нататъшните изследвания ще включват мащабиране на устройството и интегрирането му в реални системи, включително камери и телекомуникационно оборудване. Ще бъдат проучени и алгоритми, които могат максимално да увеличат ползите от фотонната обработка на данни. Това открива съвсем нови възможности пред съвременната електроника и изкуствения интелект от ново поколение.

Проектът е финансиран частично от Националната научна фондация на САЩ, Службата за научни изследвания на ВВС на САЩ и NTT Research.

source

Сподели: