Събиране на данни

Повечето създатели на изкуствен интелект не казват откъде получават данните, които използват. На тях са им нужни такива когато обучават своите ботове и модели. Законово те са длъжни да кажат какво правят с данните на своите клиенти.

Разкритията за използване на данни отварят прозорец към иначе непрозрачния свят за храна на мозъка на Big Tech. Може би следващия път ще помислите малко повече относно снимката, която току-що сте публикували в Instagram. Създателите на AI се нуждаят от огромно количество необработени данни, за да обучат своите големи езикови и образни модели.

Стъпки в обучението

Компаниите се надпреварват да обучават своите AI, използвайки информация от много различни източници. Понякога с разрешение от собственика, а често пъти и без него. Така се случваха нещата преди новите закони и съдебни разпоредби да направят идеята по-трудна.

Всеки голям технологичен гигант изгражда генеративни AI модели и много от тях използват своите клиентски данни, за да ги обучават. В някои случаи съществува опция за включване. Това означава, че вашите данни няма да бъдат използвани, освен ако не сте съгласни. В други случаи това е отказ, което означава, че вашата информация автоматично ще се използва, освен ако изрично не кажете „не“.

Тези правила са различни в зависимост от региона и правните различия. В САЩ законът за поверителността е сред отговорните за изискването фирмите да споделят какво правят с потребителските данни. В ЕС това е GDPR.

Практиката на създателите на AI за използване на данни обикновено варират в зависимост от това дали дадена фирма оперира в сферата на потребителите или корпоративния бизнес.

Мнението на потребителите

Що се отнася до потребителите, особено тези на безплатни услуги, възможността да откажат използването на личните им данни за обучение на изкуствен интелект често е силно ограничена. Фирмите и организациите по правило очакват техните данни да не бъдат използвани.

Как се справят различните компании?

Ако използваме за пример Adobe, той нагорещи страстите с промени в своите условия за обслужване. Те намекнаха, че използва данни на бизнес клиенти, за да обучава своите генеративни AI системи. В отговор компанията се ангажира писмено да не прави това.

Apple също широко използва лични данни за да обучава Apple Intelligence. Но тя се е ангажирала с нова архитектура, която според нея ще гарантира, че данните си остават строго поверителни. Личната информация, която се обработва на устройства като телефони или облачен център за данни си остава недостъпна за всеки друг освен за потребителя.

Microsoft няколко пъти се принуди да отлага функцията за извикване на совите компютри Copilot+ заради проблеми с поверителността и личните данни. Работата се извършва само и единствено на устройството, но съхранението се случва по начин, по който друг софтуер може да получи лесен достъп. Компанията запазва огромно количество екранни снимки, които могат да включват масив от лична информация. Все пак имаме настройка за изключване на функцията за конкретни приложения и уебсайтове.

OpenAI притежава набор от различни правила, които варират в зависимост от типа клиент. Има значение и това дали използвате безплатни или платени услуги.

Индивидуален подход

Всяка от компаниите ще бъде разгледана поотделно относно това, какви данни използват за обучение на совите AI. Ще се направят нужните промени в техните политики и опциите, които предлагат на клиенти, които не желаят техните данни да се използват за обучение на AI.

В ерата на социалните медии индустрията изгради огромни глобални мрежи, които превръщат всяка публикация и кликване в реки от печалби чрез монетизиране на личната информация на потребителите. AI придава на тази информация нова стойност и ни дава нови причини да се замислим, какво предоставяме.