Изкуственият интелект помогна за мащабиране на античен филм от 1896 г. до 4K

Сега можем да се насладим на по – реалистичен образ от всякога. През 1896 г. се е състояла грандиозната премиера на 50-секунден мълчалив късометражен филм L’Arrivée d’un train en gare de La Ciotat. Това е било толкова необичайно и реалистично събитие, че част от публиката се е стреснала да не би да ги връхлети истински влак. Това се случва въпреки изключително лошото качество на филма (по съвременни данни) и ниската разделителна способност. А какво да кажем за подобрената чрез ИИ версия!?

Как се стига до идеята

За целта са използвани двойка публично достъпни програми за подобряване на качеството, DAIN и Gigapixel AI на Lapa Topaz Labs. Чрез тях се извършва трансформация на оригиналните кадри в 4K 60FPS клип. Gigapixel AI използва собствен алгоритъм за интерполация, който анализира изображението и разпознава детайли и структури, допълвайки ги според уебсайта на Topaz Labs. Изкуственият интелект изостря и изяснява изображенията, дори след като те са увеличени с цели 600 процента. DAIN, от друга страна, вмъква рамки между ключовите такива на реалния видео клип. Това е същата концепция използвана за изглаждане движението на 4K телевизорите. В този случай обаче са добавени достатъчно кадри, за да се увеличи скоростта до 60 FPS.

Това са две от технологиите за увеличаване на мащаба, което е съществена част от развлекателната индустрия от 1998 г. Именно тогава започна появата на първите телевизори с висока разделителна способност. Телевизорите със стандартна такава, притежаваха резолюция 720×480. Това са общо 345 600 пиксела на съдържание, което може да бъде показано наведнъж. Приемниците с висока разделителна способност показват 1920 × 1080 или 2 073 600 общо пиксела. Тази стойност е шест пъти по-висока от разделителната способност на SD. Модерното 4K се гордее с резолюция от 3840×2160 и се нуждае от 8 294 400 пиксела.

Действие в цифри

Ако искате да увеличите HD изображение е необходимо да допълните с 6 милиона пиксела, за да се поберат на 4K екран, така че оптимизаторът трябва да разбере какво трябва да има на тези допълнителни пиксели. Оттук идва процесът на интерполация. Тя оценява какво трябва да показва всеки от тези нови пиксели въз основа на показаните пиксели около тях.

Методът “най-близък съсед”

Това е ефективна техника, която попълва празните пиксели със същия цвят като техния най-близък. Това е просто и ефективно, но води до назъбено, очевидно пикселирано изображение. Билинеарната интерполация изисква малко повече мощност на обработка, но позволява на телевизора да анализира всеки празен пиксел въз основа на двата си най-близки съседа и да генерира градиент между тях, което изостря изображението. Bicubic интерполацията от друга страна, взема проби от своите 16 най-близки пиксели. Това води до пълнокачествено оцветяване, но размазано изображение, като комбинира резултатите от билинейна и бикубична интерполация. Съвременните телевизори могат да отчитат недостатъците на всеки подобен процес и да генерират превъзходни изображения с минимална загуба на оптично качество в сравнение с оригинала.

Използвайки дълбоки конволюционни невронни мрежи, програми като DAIN могат да анализират и картографират видеоклипове и след това да вмъкват генерирани изображения между съществуващите кадри. Ефектът обаче не е перфектен. При внимателна проверка се забелязват множество визуални артефакти. Дори и с тези недостатъци техниката предлага някои примамливи възможности.