AlphaFold3 вече е достъпен

AlphaFold3 най-накрая е отворен. Шест месеца след като Google DeepMind спорно скри код, описващ модела за предсказване на структурата на протеина, учените вече могат да изтеглят софтуера и да използват инструмента за изкуствен интелект за некомерсиални цели.

Откриване на нови лекарства

AlphaFold3, за разлика от своите предшественици, е в състояние да моделира протеини съвместно с други молекули. Но вместо да пусне основния си код, както беше направено с AlphaFold2, DeepMind предостави достъп чрез уеб сървър. Това ограничи броя и видовете прогнози, които учените могат да направят. Сървърът попречи на учените да предскажат как ще се държат протеините в присъствието на потенциални лекарства. Но решението на DeepMind да пусне кода променя това.

Първоначално компанията сподели, че предоставянето на AlphaFold3 само чрез уеб сървър постига правилния баланс между позволяването на достъп за изследвания и защитата на търговските интереси.

Но публикуването на AlphaFold3 без неговия код или параметри на модела, получени чрез обучение на софтуера върху протеинови структури и други данни, предизвика критики от учените. Според тях този ход подкопава възпроизводимостта. DeepMind бързо взе решение, че ще направи достъпна версия с отворен код на инструмента в рамките на половин година.

Вече всеки може да изтегли софтуерния код AlphaFold3 и да го използва с некомерсиална цел. Но засега само учени с академична принадлежност имат достъп до данните при поискване.

Достъпни версии

DeepMind има конкуренция. През последните няколко месеца редица компании разкриха инструменти за предсказване на протеинова структура с отворен код, базирани на AlphaFold3. Те разчитат на спецификациите, описани в оригиналната статия, известна като псевдокод.

Две китайски компании, технологичният гигант Baidu и разработчикът на TikTok ByteDance, вече пуснаха модели, вдъхновени от AlphaFold3. Това направи и стартираща компания в Сан Франциско, Калифорния, наречена Chai Discovery.

Ограничение на модела

Основно ограничение на тези модели е, че подобно на AlphaFold3, никой не е лицензиран за търговски приложения като откриване на лекарства. Въпреки това, моделът на Chai Discovery, Chai-1, може да се използва за такава работа чрез уеб сървър.

Друга фирма, базираната в Сан Франциско Ligo Biosciences, пусна без ограничена версия на AlphaFold3. Но софтуерът все още няма пълния набор от възможности, включително капацитет за моделиране на лекарства и молекули, различни от протеини.

Други екипи работят върху версии на AlphaFold3, които не идват с такива ограничения. AlQuraishi се надява до края на годината да има модел с напълно отворен код, наречен OpenFold3. Това би позволило на фармацевтичните компании да преквалифицират своите версии, използвайки патентовани данни.

Естеството на AlphaFold2 с отворен код доведе до поток от иновации от други учени. Например, победителите в скорошен конкурс за проектиране на протеини използваха инструмента за изкуствен интелект, за да проектират протеини, способни да се свързват с мишена за рак. Любимият неотдавнашен хак на AlphaFold2 на Jumper беше създаден от екип, който използва инструмента, за да идентифицира ключов протеин. Той помага на спермата да се прикрепи към яйцеклетките.

Значението на достъпността

През изминалата година се наблюдава поток от биологични AI модели. Те са реализирани от компании с различни подходи към отвореността. Ако DeepMind очаква всички да споделят информация за това как са направени прогнозите и да представят AI моделите и кода по начин, който може да се провери и самата тя трябва направи това.

Вече са факт няколко репликации на AlphaFold3. Това показва, че моделът е възпроизводим дори без код с отворен код. Очакваме повече дискусии относно нормите за публикуване в област, все по-населена както от академични, така и от корпоративни изследователи.