DeepSeek став модним словом, і цілком заслужено…
Китайська компанія випустила велику мовну модель (LLM), яка відповідає рівню таких відомих моделей штучного інтелекту, як ChatGPT (Open AI), Llama (Meta) і Gemini (Google), за меншу частину вартості, з меншими обчислювальними потужностями і меншим споживанням енергії.
Цей прорив спричинить хвилі в кількох сферах, від інфраструктури до політики щодо даних. З точки зору торгівлі, варто виділити кілька цікавих аспектів.
Торгівля та доступ до технологій
Технології нерівномірно розподілені у просторі та часі. У кожній хвилі технологічного розвитку лише невелика кількість країн має необхідні ресурси для того, щоб бути інноваторами або першими, тоді як більшість країн, що розвиваються, і найменш розвинених країн належать до “більшості, що запізнилася” або “відстаючих”. Торгівля є одним з найважливіших механізмів, що дозволяє технологіям перетікати з місць, які мають більш значний фінансовий і технологічний потенціал, до країн з меншими можливостями.
Коли порушуються торговельні потоки: приклад експортного контролю США щодо напівпровідників зі штучним інтелектом
Експортний контроль, накладений на технології, обмежує торговельні потоки, впливаючи на ланцюги поставок, виробництво та глобальний доступ. Одним із стовпів стратегії Сполучених Штатів, спрямованої на збереження технологічного лідерства в галузі штучного інтелекту щодо Китаю, було запровадження експортних обмежень на передові напівпровідники.
З одного боку, американський експортний контроль виявився ефективним у запобіганні доступу китайських компаній, таких як DeepSeek, до найсучасніших технологій. Система штучного інтелекту DeepSeek була розроблена з використанням графічного процесора NVIDIA H800 і менш потужних чіпів. З іншого боку, “потреба – мати винаходів”, а дефіцит технологій змусив інженерів DeepSeek “мислити нестандартно”, що сприяло інноваційному стрибку вперед. Якщо Китай також розвине здатність виробляти власні передові мікросхеми, він продемонструє потужну комбінацію обчислювальних потужностей та ефективних алгоритмів, і головна мета політики експортного контролю США матиме зворотний ефект.
Прихильники експортного контролю стверджують, що такі компанії, як DeepSeek, все ще отримують вигоду від накопичення американських чіпів, придбаних до запровадження експортних обмежень. З розвитком технологій у США розрив між американськими компаніями та китайськими, які все ще залежать від NVIDIA, поступово збільшуватиметься, якщо експортний контроль залишатиметься незмінним.
Водночас, економічні та соціальні витрати від використання експортного контролю для уникнення конкуренції та збереження технологічного домінування однієї країни роблять його дуже суперечливим інструментом. Професор Мілтон Мюллер справедливо ставить під сумнів переваги, які отримують американські громадяни від “скорочення або уповільнення економічного розвитку 17% населення світу”, але також важливо підкреслити негативний вплив на світову економіку в цілому, який виникає внаслідок уповільнення прогресу одного з глобальних технологічних центрів сили.
DeepSeek також показує, як правила експортного контролю в динамічних галузях, таких як ШІ, можуть швидко застаріти. 15 січня США запровадили проміжне остаточне правило щодо нових експортних обмежень, яке вперше включало обмеження на вагу моделі ШІ. Ваги моделі – це числові параметри всередині АІ-моделі, які кодують те, що було вивчено на етапах попереднього навчання та точного налаштування, і формують прогнози АІ. Це правило ґрунтується на припущенні, що ваги для просунутих моделей ШІ можуть бути отримані тільки шляхом інтенсивного навчання моделі. DeepSeek використовує набагато менш інтенсивні обчислювальні потужності, що може призвести до необхідності перегляду адміністрацією Трампа порогового рівня, встановленого нормою експортного контролю щодо вагових коефіцієнтів моделей ШІ.
DeepSeek і цифрові послуги: більш економічно ефективний доступ до ШІ
Моделі штучного інтелекту стають одним із шарів глобальної інфраструктури. Компанії все частіше використовують АІ як основу для створення, вдосконалення та масштабування власних продуктів і послуг. Замість того, щоб розробляти ШІ з нуля, багато компаній використовують існуючі моделі ШІ, в тому числі за допомогою хмарних рішень (ШІ як послуга або AIaaS), як фундаментальну основу для інновацій в різних галузях. Модель штучного інтелекту також можна налаштувати під конкретні потреби, наприклад, для медичної діагностики в контексті охорони здоров’я або управління запасами в електронній комерції.
DeepSeek розробила моделі за частку вартості, яку несуть великі американські компанії, що займаються розробкою штучного інтелекту, і це скорочення витрат може бути передане компаніям, які розробляють свої продукти та послуги, що робить AIaaS більш доступним. Генеральний директор Perplexity – пошукової системи на основі ШІ, яка використовує передові моделі ШІ для надання прямих відповідей на запити користувачів – вже згадував, що має намір використовувати DeepSeek, наприклад, для скорочення операційних витрат. Багато країн, що розвиваються, демонструють нижчі темпи впровадження штучного інтелекту, часто через обмежену інфраструктуру та високі витрати на впровадження, і саме ці країни можуть стати основними бенефіціарами економічно ефективних рішень зі штучного інтелекту.
DeepSeek також вирішила надати рішення з відкритим вихідним кодом, зробивши код своєї ШІ-системи доступним для вивчення, повторного використання та адаптації. Це також дає можливість країнам з меншими економічними ресурсами технічно вчитися на проривах і намагатися прискорити свій шлях до розвитку штучного інтелекту.
Незважаючи на великий потенціал, надання транскордонних послуг зі штучного інтелекту на практиці може бути не таким простим. Для того, щоб компанії могли працювати в інших країнах, вони повинні дотримуватися місцевого законодавства. Нещодавно італійський орган із захисту даних вирішив заблокувати роботу DeepSeek на підставі побоювань щодо недоторканності приватного життя. Це приклад перешкод, що виникають через відсутність гармонізації регулювання у сферах, які є важливими для зміцнення довіри, що має лежати в основі цифрової торгівлі.
Алгоритми та інтелектуальна власність: рішення з відкритим кодом як спосіб сприяння підзвітності та розвитку ШІ знизу вгору
Алгоритми штучного інтелекту – це особливий вид вихідного коду. Правовий захист вихідного коду здійснюється за допомогою законодавства про інтелектуальну власність. У багатьох країнах можна посилатися на авторське право, але основною формою захисту часто є комерційна таємниця, яку можна розуміти як конфіденційну ділову інформацію, що надає компанії конкурентну перевагу і не є загальновідомою, і яка не є загальнодоступною. Деякі компанії, такі як Open AI і Google, зберігають свої алгоритми штучного інтелекту в таємниці. Інші, такі як Meta і DeepSeek, вирішили зробити вихідний код своїх АІ-моделей доступним.
Хоча поки що на ринку переважають пропрієтарні моделі, відкритий код набирає обертів, як зазначив Ян Лекун, головний науковець зі штучного інтелекту компанії Meta, який написав: “Людям, які бачать результати роботи DeepSeek і думають: “Китай випереджає США в галузі штучного інтелекту”. Ви читаєте це неправильно. Правильно читати: “Моделі з відкритим кодом перевершують пропрієтарні”. Це дуже важливо, принаймні з двох причин:
1. Це посилює прозорість і підзвітність. Доступ до вихідного коду систем штучного інтелекту може знадобитися в багатьох практичних ситуаціях, наприклад, для забезпечення дотримання правил безпеки або охорони здоров’я, в контексті фінансового регулювання, з метою забезпечення чесної конкуренції та для встановлення юридичної відповідальності. Незважаючи на це, законні запити на доступ до вихідного коду іноземних компаній наштовхуються на правовий бар’єр, створений положеннями про вихідний код, закріпленими в торговельних угодах. Ці положення обмежують випадки, в яких суб’єкт може вимагати доступ до вихідного коду або алгоритму, вбудованого в продукт або послугу. Ці обмеження дедалі більше суперечать національному законодавству, яке має на меті узгодити ШІ зі стандартами безпеки та фундаментальними правами людини. Положення про вихідний код створюють настільки серйозну перешкоду для прозорості та підзвітності ШІ, що деякі експерти з Оксфордського університету запропонували взагалі вилучити положення про вихідний код з торговельних угод, одночасно пропонуючи альтернативні заходи для захисту інтелектуальних активів компаній.
2. Це знижує бар’єри для розвитку висхідного ШІ, пом’якшуючи поточну передачу знань і даних великим гравцям у сфері ШІ. ШІ з відкритим вихідним кодом дає користувачам свободу не лише ретельно вивчати, а й модифікувати та розвивати моделі ШІ. Як тільки моделі ШІ стануть доступними і кастомізованими, учасники ринку все частіше зможуть розробляти свої ШІ-рішення власними силами, без необхідності передавати свої дані великим ШІ-компаніям, що сприятиме розвитку ШІ за принципом “знизу-вгору”. Це дасть змогу меншим гравцям розробляти системи штучного інтелекту, пристосовані до конкретних потреб їхньої цільової аудиторії. У Diplo поняття висхідного ШІ було інтегровано в життєвий цикл організації, а маркування даних стало частиною щоденної практики в навчанні та дослідженнях. Це дає інженерам, які працюють у лабораторії штучного інтелекту Diplo, доступ до високоякісних даних для навчання наших моделей штучного інтелекту. Розробка конкретних додатків, таких як висвітлення великих міжнародних подій, таких як Тиждень електронної комерції ЮНКТАД, за допомогою штучного інтелекту, демонструє цінність висхідного ШІ для обслуговування нашої цільової аудиторії та виконання місії Diplo таким чином, щоб посилити незалежність та автономію на організаційному рівні.
ШІ-гонка? Куди воно прямує?
Ідея перегонів штучного інтелекту – погана метафора. Перегони – це гра з нульовою сумою: хтось виграє, хтось програє. З технічної точки зору, менталітет нульової суми вводить в оману. Інновації з’являються не з повітря, а завдяки тому, що ми стоїмо на плечах тих, хто був до нас. У технічній записці DeepSeek згадується важливість Llama (Meta) та Qwen (Alibaba) для навчання моделей. Водночас генеральний директор Perplexity зазначив, що відкритий характер DeepSeek, ймовірно, допоможе американським інноваторам, які зможуть впроваджувати елементи, натхненні проривами DeepSeek, у свої власні моделі ШІ.
З глобальної точки зору, торговельні потоки сприяють поширенню технологій у різних географічних регіонах, покращуючи життя людей і глобальну економіку. Шлях розвитку штучного інтелекту не має фінішної прямої, але це постійна “робота в процесі”, заснована на зусиллях науковців та інженерів, які вчаться на досягненнях один одного, а також на проактивності компаній, які перетворюють ці досягнення в розробку продуктів. Разом відкритість і співпраця позитивно впливають на торгівлю технологічними продуктами, послугами та світовий ВВП.
Автор: Марія Масіель – директор з цифрової торгівлі та економічної безпеки.
Джерело: DiploFoundation