Точиться боротьба навколо визначення штучного інтелекту з відкритим кодом

У галузі програмного забезпечення є дві сторони. Одна дивиться назовні, з дивовижними продуктами та послугами, які приносять мільярди доларів доходу компаніям із трильйонами доларів. Інша звернена усередину, створюючи, оновлюючи та ділячись — часто безкоштовно — базовою інфраструктурою програмного забезпечення та інструментами, завдяки яким цифровий світ працює.

Програмне забезпечення з відкритим вихідним кодом , у якому розробник випускає вихідний код для продукту та дозволяє будь-кому іншому повторно використовувати та змінювати його на свій смак, лежить в основі Android від Google, i OS від Apple і всіх чотирьох найбільших веб-браузерів. Шифрування чату WhatsApp, стиснення потоку Spotify і формат збереженого знімка екрана контролюються кодом з відкритим кодом.

Хоча рух відкритого коду сягає своїм корінням у пост-хіпі-утопізм Каліфорнії 1980-х років, сьогодні він все одно є сильним частково тому, що його дух не зовсім альтруїстичний. Зроблення програмного забезпечення вільним доступом дозволило розробникам отримати допомогу у покращенні коду; довести свою надійність; заслужити похвалу своїх однолітків; і, в деяких випадках, заробляти гроші, продаючи підтримку тим, хто користується продуктами безкоштовно.

Кілька виробників моделей у світі штучного інтелекту ( ШІ ), включаючи Meta , гіганта соціальних медіа, хочуть наслідувати цю традицію відкритого коду, розробляючи свої пакети потужних продуктів. Вони сподіваються об’єднати любителів і стартапи в силу, яка зможе конкурувати з лабораторіями вартістю мільярд доларів, і водночас покращувати свою репутацію.

На жаль для них, однак, керівні принципи, опубліковані минулого тижня американською некомерційною організацією Open Source Initiative ( OSI ), свідчать про те, що сучасне використання цього терміна технологічними гігантами втратило сенс. Обтяжені обмеженнями та розроблені в таємниці, ці безкоштовні продукти ніколи не приведуть до справжньої хвилі інновацій, якщо щось не зміниться, каже OSI . Це останній залп у жвавій дискусії: що насправді означає відкритий код в епоху ШІ ?

У традиційному програмному забезпеченні цей термін чітко визначений. Розробник надасть оригінальні рядки коду, які використовуються для написання частини програмного забезпечення. Що важливо, при цьому вони відмовляться від більшості прав: будь-який інший розробник може завантажити код і налаштувати його так, як вважає за потрібне для власних цілей. Часто оригінальний розробник додає так звану ліцензію «copyleft», вимагаючи спільного використання налаштованої версії. Згодом оригінальний код може перетворитися на абсолютно новий продукт. Операційна система Android, наприклад, є нащадком Linux, спочатку написана для використання на персональних комп’ютерах.

Дотримуючись цієї традиції, Meta, американський технологічний гігант, з гордістю стверджує, що його широкомовна модель ( LLM ), Llama 3, є «відкритим вихідним кодом» і ділиться готовим продуктом з усіма, хто хоче створити його поверх нього безкоштовно. Однак компанія також накладає обмеження на її використання, включаючи заборону на використання моделі для створення продуктів із понад 700 мільйонами активних користувачів щомісяця. Інші лабораторії, від французької Mistral до китайської Alibaba, також випустили LLM для безкоштовного використання, але з подібними обмеженнями.

Те, чим Meta вільно ділиться — ваги зв’язків між штучними нейронами в LLM, а не весь вихідний код і дані, які були використані для його створення — безумовно, недостатньо для того, щоб хтось створив власну версію Llama 3 з нуля, як зазвичай вимагали б пуристи з відкритим кодом. Це тому, що навчання ШІ сильно відрізняється від звичайної розробки програмного забезпечення. Інженери накопичують дані та створюють приблизний план моделі, але система фактично збирається сама, обробляючи навчальні дані та оновлюючи власну структуру, поки не досягне прийнятної продуктивності.

Оскільки кожен етап навчання налаштовує модель у принципово непередбачуваний спосіб, який зближується до правильного рішення лише з часом, модель, навчена з використанням тих самих даних, того самого коду та того самого обладнання, що й Llama 3, буде дуже схожа на оригінал, але не на те саме. Це знищує деякі передбачувані переваги підходу з відкритим вихідним кодом: перевіряйте код скільки завгодно, але ви ніколи не можете бути впевнені, що ви використовуєте те саме, що пропонує компанія.

Інші перешкоди також стоять на шляху до дійсно відкритого ШІ . Навчання «передової» моделі штучного інтелекту , яка відповідає найновішим версіям Open AI або аналогам, коштує щонайменше 1 мільярд доларів, що перешкоджає тим, хто витратив такі суми, дозволяти іншим наживатися. Є також питання безпеки. У чужих руках найпотужніші моделі можуть навчити користувачів створювати біологічну зброю або створювати необмежену кількість зображень жорстокого поводження з дітьми. Блокування своїх моделей за ретельно обмеженою точкою доступу дозволяє лабораторіям штучного інтелекту контролювати, що їх можна запитувати, і диктувати способи, якими їм дозволено відповідати.

Відкрити і закрити

Складність проблеми призвела до суперечок щодо того, що саме має означати « ШІ з відкритим кодом». «Є багато різних людей, які мають різні концепції того, що таке [відкритий вихідний код], — каже Роб Шерман, віце-президент із політики Meta. У цій дискусії на карту поставлено більше, ніж просто принципи, оскільки ті, хто сьогодні працює з відкритим кодом, можуть стати галузевими гігантами майбутнього.

У недавньому звіті OSI зробив усе можливе, щоб визначити цей термін. Він стверджував, що, щоб заслужити ярлик, системи штучного інтелекту повинні надавати «чотири свободи»: вони повинні бути вільними для використання, вивчення, модифікації та спільного використання. Замість того, щоб вимагати повного оприлюднення навчальних даних, він закликав лише лабораторії, щоб описати їх достатньо докладно, щоб дозволити створити «по суті еквівалентну» систему. У будь-якому випадку, обмін усіма навчальними даними моделі не завжди буде бажаним — це, по суті, перешкодить, наприклад, створенню медичних інструментів штучного інтелекту з відкритим кодом , оскільки записи про стан здоров’я є власністю їхніх пацієнтів і не можуть передаватись без обмеження.

Для тих, хто будує над Llama 3, питання про те, чи можна її назвати відкритим кодом, має менше значення, ніж той факт, що жодна інша велика лабораторія не наблизилася до такої щедрості, як Meta. Вінсент Вайссер, засновник Prime Intellect, лабораторії штучного інтелекту в Сан-Франциско, віддав би перевагу, якби модель була «повністю відкритою в усіх вимірах», але все ж вірить, що підхід Meta матиме довгостроковий позитивний вплив, що призведе до дешевшого доступу для кінцевих користувачів. користувачів і зростання конкуренції. Відтоді, як Llama була вперше опублікована, ентузіасти розчавили її настільки, щоб можна було працювати на телефоні; вбудовані спеціалізовані апаратні мікросхеми, здатні працювати надзвичайно швидко; і перепрофілював його для військових цілей у рамках проекту китайської армії, довівши, що недоліки є більш ніж теоретичними.

Не кожен, ймовірно, так охоче стане усиновлювачем. Юридично кажучи, використання справжнього програмного забезпечення з відкритим вихідним кодом має відбуватися без «тертя», каже Бен Малінг, патентний експерт лондонської юридичної фірми EIP . Щойно для аналізу деталей і наслідків кожного окремого обмеження знадобляться юристи, інженерна свобода, на яку покладаються так багато технологічних інновацій, зникає. Такі компанії, як Getty Images і Adobe, уже відмовилися від використання деяких продуктів штучного інтелекту через побоювання випадково порушити умови своїх ліцензій. Інші підуть.

Точне визначення штучного інтелекту з відкритим кодом матиме широке значення. Подібно до того, як виноградники живуть або вмирають залежно від того, чи можуть вони називати свою продукцію шампанським чи простим ігристим вином, етикетка з відкритим кодом може виявитися критичною для майбутнього технологічної компанії. Якщо країні не вистачає власної наддержави зі штучним інтелектом , каже Марк Сурман, президент Mozilla, фонду з відкритим кодом, тоді вона може забажати підтримати індустрію з відкритим кодом як противагу американському домінуванню. Закон Європейського Союзу щодо штучного інтелекту наразі має лазівки для полегшення вимог щодо тестування моделей з відкритим кодом, наприклад. Ймовірно, інші регулятори в усьому світі підуть цьому прикладу. Оскільки уряди прагнуть встановити жорсткий контроль над тим, як штучний інтелект можна створювати та використовувати, вони будуть змушені вирішити: чи хочуть вони заборонити майстрам спальні працювати в космосі, чи звільнити їх від дорогого тягаря?

Наразі закриті лабораторії оптимістичні. Навіть Llama 3, найпотужніша з майже відкритих конкурентів, наздоганяла моделі, випущені Open AI , Anthropic і Google. Один із керівників великої лабораторії сказав The Economist , що подібний стан речей неминучий через економічні аспекти. Хоча випуск потужної моделі, до якої можна отримати безкоштовний доступ, дозволяє Meta підривати бізнес своїх конкурентів, не заважаючи своїм власним, відсутність прямого доходу також обмежує її бажання витрачати суми, необхідні для того, щоб бути лідером, а не швидким послідовником. Свобода рідко буває по-справжньому безкоштовною.

The Economist

Опубліковано

07.11.2024

Аналітика

Теги: