
(Снимка: Getty Images)
В началото на 2000-те години, архитектите на интернет се сблъскали с познат проблем: как да се изгради система, която да се справя с огромно, непредсказуемо търсене без да се счупи, когато която и да е част от нея се провали?
Техният отговор бил да създадат система за равноправно свързване. Вместо всичко да минава през централни сървъри, P2P системите разпределяли натоварването между хиляди индивидуални възли, без единствена точка на провал, с интелигентност, по-близка до потребителя и устойчивост, вградена в архитектурата.
Това било успешно решение. P2P мрежите се оказали по-бързи, по-устойчиви и по-мащабируеми от всяка централизирана IT инфраструктура за разпределени натоварвания.
С настъпването на ерата на облачните изчисления, хиперскалният модел стана доминираща инфраструктура за последните петнадесет години. Неговата основна идея – да се агрегира всичко в най-големите възможни центрове за данни, да се оптимизира за единична цена, да се централизират без ограничения – имаше смисъл за много натоварвания.
Но изкуственият интелект, особено в етапа на индикация, работи на точно същите принципи, които направиха P2P привлекателни.
Разбиране на причините
Разбирането на причините изисква разделяне на два етапа на AI, които често се смесват. Обучението на голям модел е еднократен, интензивен процес. То работи добре на централизирана, агрегирана инфраструктура. Индикацията е различна.
Индикацията е всеки път, когато моделът се използва: система за откриване на измами, предсказваща система за поддръжка, логистична платформа, която изчислява маршрути в реално време. Тези решения се взимат непрекъснато, в милисекунди, в точката, където операциите наистина се извършват.
Пренасочването на натоварванията от индикация към отдалечен хиперскален обект въвежда забавяне, което просто не е съвместимо с много от тези случаи на употреба. Системата за хирургическа помощ не може да чака за връщане до център за данни в друг регион.
McKinsey прогнозира, че глобалното търсене на центрове за данни ще се утрои до 2030 г., като основната причина за това е индикацията, а инфраструктурата, обслужваща това търсене, трябва да бъде изградена около изискванията на индикацията, което означава изчислителна мощност близо до мястото на вземане на решения.
Отговорът на P2P системите бил да спрат да разглеждат разпределението като проблем и да започнат да го третират като архитектура. BitTorrent не се опита да реши трансфера на файлове, като построи по-бързи централни сървъри, а разпредели проблема между хиляди възли: всеки близо до потребителя, всеки обработващ местното търсене.
Edge computing
Edge computing прилага същата логика към AI инфраструктурата. По-малки, модулни изчислителни съоръжения, разположени близо до мястото, където данните се генерират и консумират, разпределят натоварването от индикация по начина, по който P2P разпределя трансфера на файлове. Всяко място обработва местните решения локално. Мрежата като цяло става по-устойчива, защото нито едно съоръжение не носи цялото натоварване.
Централното изпълнение на индикацията носи и разходи, които нарастват с увеличаването на обема: всеки път, когато данните напускат мрежата на хиперскален облачен доставчик, организациите плащат такси за изход.
За AI натоварвания, които изискват непрекъснато предаване на данни между централно съоръжение и разпределени оперативни среди, тези такси се натрупват по начини, които лесно могат да бъдат подценени на етапа на планиране. Обработката на данни локално на ръба – близо до мястото, където се генерират – намалява обема, преминаващ през мрежата.
Смяната на хардуера също променя изчисленията за осъществимост на ниво устройство. Невронни процесорни единици (NPU), проектирани специално за задачи от индикация на AI, сега са вградени в смартфони, лаптопи и индустриални ръбови устройства.
Изчислителната мощност, необходима за работа на способни натоварвания от индикация, постоянно намалява, а хардуерът, който преди няколко години би изисквал сървърна ракла, сега се побира в ръчен устройство.
С намаляването на цената и физическите размери на хардуера, способен на индикация, предположението, че всяко натоварване трябва да се пренасочва обратно към централизирано съоръжение, става все по-трудно за поддържане.
Данъчна суверенитет
С нарастващото затягане на регулациите за данъчна суверенитет в ЕС, Югоизточна Азия, Латинска Америка и извън тях, централизирането на индикацията в малък брой съоръжения създава правна уязвимост.
За организациите, работещи в множество юрисдикции, инфраструктурата на ръба решава този проблем по дизайн: данните се обработват локално, в съответната юрисдикция, без да се изискват сложни правни и технически обходи след факта.
Накрая, друг важен елемент е, че наличието на енергия – а не цената – става свързващото ограничение на капацитета на центровете за данни. В Северна Вирджиния, най-гъстият облачен хъб в света, комуналните услуги прогнозират времеви линии за свързване на големи проекти, които се простират до седем години поради задръствания в мрежата.
Центровете за данни в Ирландия сега консумират над 20% от националната електрическа енергия. Тези проблеми са предсказуеми резултати от концентрирането на огромни изчисления на малък брой места, но проблемът с мегаватите е по-лесен за решаване, когато не се налага да се решава на едно място.
Разпределението на натоварванията на ръба, чрез разпределение на натоварванията между много по-малки обекти, разпределя енергийните нужди по начин, който по-добре съответства на наличната капацитет на мрежата.
Нищо от това не означава, че хиперскалната инфраструктура изчезва. Натоварванията от обучение, обработката на големи данни и много корпоративни приложения ще продължат да работят ефективно в централизирани облачни среди.
Случаят за ръба не е случай против облака, а по-скоро за съответствие на архитектурата на инфраструктурата с реалните нужди на натоварванията.
Инженерите, които изградили P2P мрежите, разбрали, че разпределянето на интелигентността в мрежата я прави по-силна, а не по-слаба.
С напредването на индикацията извън центровете за данни и в местата, където бизнесите наистина оперират, този урок става все по-актуален.





































