Новата техника на AI може да генерира холограми с по-малко от един мегабайт памет

Холограмата е изображение, което по същество прилича на 2D прозорец, гледащ към 3D сцена. Пикселите на всяка холограма разпръскват светлинни вълни, падащи върху тях. Те взаимодействат помежду си по начини, които създават илюзия за дълбочина.

Използвайки изкуствен интелект, учените вече могат бързо да генерират фотореалистични цветни 3D холограми дори на смартфон. Новата технология може да намери приложение в очилата за виртуална реалност, разширената реалност и други приложения.

Как се случва магията

Холографските видео дисплеи създават 3D изображения, които хората могат да гледат, без да усещат напрежение в очите. При конвенционалните 3D екрани се създава илюзия за дълбочина, чрез 2D изображения. Компании като Samsung наскоро постигнаха напредък в разработването на хардуер, който може да показва холографско видео.

Всяка холограма кодира определено количество данни, за да създаде илюзия за дълбочина в цялото изображение. Като такова, генерирането на холографско видео често изисква изчислителната мощност на суперкомпютър.

За да превърнат технологията в масова, учените опитват редица различни стратегии за намаляване на необходимия обем изчисления. Това може да стане, чрез заменяне на сложни физически симулации с прости справочни таблици. От това обаче може да пострада качеството на изображението.

MIT

Сега изследователи от MIT са разработили нов начин за производство на образи. Новият метод, базиран на дълбоко обучение е толкова ефективен, че може да генерира холограми на лаптоп за един миг.

Използването на физически симулации за компютърно генерирана холография включва изчисляване на външния вид на много части от холограмата и след това комбинирането им, за да се получи окончателен образ. Използването на справочни таблици е като запаметяване на набор от често използвани части, но това все още изисква подобрение в комбинирането им.

Използването на физически симулации за изчисляване външния вид на всяка точка в пространството е отнемащ време процес, който прилича на използването на осем точни парчета. Използването на справочни таблици за компютърно генерирана холография е като маркиране на границата на всеки отрязък преди изрязване. Въпреки че това спестява малко време, като елиминира стъпката на изчисляване къде да се реже, извършването на всичките осем разреза все още е трудоемко.

Технологичен напредък

Новата техника използва дълбоко обучение, за да разбере, как да нареже парчетата, използвайки само три разреза. Система, която грубо имитира начина, по който човешкият мозък обработва визуални данни, намира преки пътища, за да генерира пълна холограма, без да се налага да изчислява по отделно, как се получава всяко парче.

Изследователите са създали персонализирана база данни от 4000 компютърно генерирани изображения, която включва информация за цвета и дълбочината на всеки пиксел. Тази база данни разполага и с 3D холограма, съответстваща на всяко изображение.

Използвайки тези данни, невронната мрежа се учи как да генерира холограми от изображенията. След това произвежда нови от образи с информация за дълбочината. Последната може да бъде изчислена от настройка на камери или сензори за лидар, като и двете са стандартни за някои нови модели iPhone.

Къде ще ги открием?

Новата система изисква по-малко от 620 килобайта памет и може да генерира 60 цветни 3D холограми в секунда с резолюция 1,920 на 1080 пиксела на един потребителски графичен процесор. Изследователите могат да го пуснат на iPhone 11 Pro със скорост 1,1 холограма в секунда и на Google Edge TPU със скорост 2 холограми в секунда. Това предполага, че един ден може да генерираме холограми в реално време за бъдеща виртуална реалност.

3D холографията в реално време може да спомогне за подобряване на така наречените обемни техники за 3D печат, които създават обекти чрез проектиране на изображения върху съдове с течност и могат да генерират сложни кухи структури. Новата техника може да намери приложение в оптични и акустични пинсети, полезни за манипулиране на материята на микроскопично ниво, както и в холографски микроскопи. Те могат да анализират клетки и конвенционални статични холограми за използване в изкуството, сигурността, съхранението на данни и други приложения.

Бъдещите изследвания могат да добавят технология за проследяване на очите, за да ускорят системата, като създадат холограми с висока разделителна способност само там, където гледате.