MIT иска да изгради изцяло нов Liquid AI
MIT има за цел да изгради AI системи с общо предназначение, захранвани от сравнително нов тип AI модел. Той се нарича течна невронна мрежа. За целта вече са събрани средства възлизащи на $37,5 милиона. Това са постъпления от различни организации, като OSS Capital, PagsGroup, компанията майка на WordPress Automattic, Samsung Next, Bold Capital Partners, ISAI Cap Venture и много други.
Какво представляват течните невронни мрежи?
Течните невронни мрежи като концепция съществуват от 2018 г. Идеята е измислена първоначално във Виенския технологичен университет, Австрия. Работата след това е усъвършенствана и мащабирана в лабораторията на MIT.
Течните невронни мрежи се състоят от неврони управлявани от уравнения. Последните предсказват поведението на всеки отделен неврон във времето, както повечето други архитектури. Термина в течни невронни мрежи се отнася до гъвкавостта на архитектурата. Те не само са много по-малки от традиционните AI модели, но изискват минимална изчислителна мощност за работа.
GPT-3, предшественикът на модела GPT-4 за генериране на текст и анализ на изображения на OpenAI, съдържа около 175 милиарда параметъра и приблизително 50 000 неврона. За сравнение, течна невронна мрежа обучена за задача като навигиране на дрон във външна среда, може да съдържа само 20 000 параметъра и по-малко от 20 неврона.
По-малко параметри и неврони означават по-малко изчисления необходими за обучение и изпълнение на модела. Това е твърде привлекателна перспектива във време, когато изчислителният капацитет на AI е на първо място. Подобна мрежа проектирана да управлява автомобил автономно на теория би могла да работи и на Raspberry Pi.
С какво разполагаме?
Вече съществуват модели с няколко параметъра, способни на автономно шофиране, генериране на текст и други. Ниските режийни разходи не са единственото нещо, с което могат да се похвалят.
Друга уникална характеристика на новите мрежи е способността им да адаптират своите параметри за по-голям успех с течение на времето. Мрежите разглеждат поредици от данни за разлика от изолираните срезове или моментни снимки и динамично регулират обмена на сигнали между техните неврони. Тези качества позволяват на течните невронни мрежи да се справят с промените в заобикалящата ги среда и обстоятелства, дори ако не са били обучени да предвиждат тези промени. Такива са променящи се метеорологични условия в контекста на самостоятелно шофиране.
При първоначалните тестове, течните невронни мрежи изпреварват други най-съвременни алгоритми за прогнозиране на бъдещи стойности в набори от данни, обхващащи атмосферната химия и автомобилния трафик. Но по-впечатляващо е това, което постигат при автономна навигация.
Иновативната невронна мрежа побеждава други модели за навигация, като успява да вземе решения, които водят дроновете до цели в неизследвани към момента пространства дори при наличието на шум и други предизвикателства. Това е единственият модел, който може надеждно да обобщи сценарии, които са непознати.
Търсенето и спасяването с дронове, наблюдението и доставката на диви животни са сред по-очевидните приложения на течните невронни мрежи. Архитектурата е подходяща за анализиране на всякакви явления, които се променят във времето. Такива са електрически мрежи, медицински показания, финансови транзакции и тежки климатични условия. Докато има набор от изчерпателни данни, течните невронни мрежи могат да се обучават върху тях.
Комерсиализация
Работата върху архитектурата на течната невронна мрежа ще продължи. През 2022 г. лабораторията измисли начин за мащабиране далеч отвъд това, което някога беше изчислително практично. Други пробиви може да дебнат на хоризонта.
Освен проектирането и обучението на нови модели, Liquid AI планира да предостави локална и частна AI инфраструктура за клиенти и платформа, която ще им позволи да изграждат свои собствени модели, за каквито и случаи на употреба да мислят.