Чому організації повинні прийняти парадигму «відкритого коду»

Обмін інформацією прискорює темпи спільних інновацій, сприяючи між- та мультидисциплінарним дослідженням та навчанню…

В епоху штучного інтелекту інформація збирається та обробляється автоматично у великих масштабах. Однак перетворення цього на інновації є складним завданням. Орелі Жан, Гійом Сібу, Марк Еспозіто і Теренс Це пишуть, що відкритими наборами даних і вихідними кодами комп’ютерів можуть допомогти вирішити цю проблему. Обмін інформацією прискорює темпи спільних інновацій, сприяючи між- і мультидисциплінарним дослідженням, а також розширенню і поширенню наукових знань і результатів досліджень.

Приказка “інформація – це сила” пов’язує рівень нашого впливу та влади з кількістю та якістю інформації, якою ми володіємо. Сьогодні, як ніколи раніше, завдяки технологіям, ми обмінюємося даними та інформацією, щоб досягти більшого впливу та влади, оптимізувати рішення, виявити ключові інсайти до певного явища або кастомізувати користувацький досвід. (Великі) дані дозволяють нам отримувати інсайти та контрінтуїтивну інформацію, або, наприклад, відстежувати в часі та просторі еволюцію інформації про явище.

Під час пандемії Covid-19 платформи відкритих даних, відкриті дослідження та програми з відкритим вихідним кодом продемонстрували надпотужність відкритої парадигми обміну інформацією для подолання таких масштабних викликів, як прогнозування поширення вірусу на основі всесвітнього збору даних та співпраці.

Рік тому поява таких технологій, як ChatGPT, призвела до дискусій про захист прав людини, свободи і демократії шляхом обміну інформацією про те, як розробляються деякі алгоритми. Зовсім недавно глобальна дискусія про відкритий штучний інтелект, яка призвела до відкритого листа, зосередилася на тому, як отримати більше переваг від алгоритмів з відкритим кодом, щоб прискорити і кинути виклик будь-якій частині реалізованих алгоритмів на благо всіх, зменшуючи при цьому будь-які загрози.

Парадигма спадщини

Інформація була частиною економіки і використовувалася як важіль для посилення влади окремої особи чи інституції. Наукова глобалізація стала можливою завдяки друкарському верстату Гутенберга у 15 столітті та паровій машині Ватта у 18 столітті. Ці дві інновації уможливили обмін знаннями, відкриттями та теоріями. Перші країни, які скористалися перевагами цих нововведень, змогли володіти знаннями та інноваціями, а також збільшити свою могутність. Те ж саме стосується компаній або окремих винахідників.

Тепер, завдяки великим даним і алгоритмічним моделям штучного інтелекту, інформація збирається, структурується і обробляється автоматично у великих масштабах, щоб забезпечити розуміння, прогнози або відповіді на конкретні питання. Незважаючи на очевидні переваги в багатьох сферах, ШІ несе в собі загрози, з якими ми повинні боротися, наприклад, дискримінація та вплив на навколишнє середовище. Додатковими викликами є обмеження на розмір наборів даних і пул талантів, до яких нам потрібен доступ для створення нових технологій. Відкриття деяких наборів даних і вихідних кодів комп’ютерів може допомогти нам подолати ці обмеження і розробити проривні інновації наступного покоління, захищаючи при цьому наші фундаментальні права.

Обмін інформацією

Обмін інформацією полегшує подолання найскладніших перешкод, прискорюючи темпи спільних інновацій, сприяючи міждисциплінарним дослідженням і навчанню, а також розширюючи і поширюючи наукові знання і передові результати досліджень.

Під час пандемії багато країн поділилися статистичними даними про стан здоров’я, щоб за короткий час створити моделі прогнозування та отримати актуальну інформацію про Covid-19, що прискорило дослідження в галузі штучного інтелекту в охороні здоров’я та підвищило зацікавленість у прискоренні процесу академічного рецензування публікацій. Обмін інформацією, як правило, уможливлює прийняття широкомасштабних, заснованих на даних рішень для управління кризами.

Деякі технології на основі ШІ вимагають диверсифікованих, великомасштабних наборів даних, які часто можна отримати лише через доступ до відкритих джерел даних, таких як ImageNet, платформа, що використовується для навчання алгоритмів розпізнавання зображень. Нарешті, навчальні набори даних з великих баз даних збагачують і урізноманітнюють перспективи, пропонуючи більшу різноманітність і репрезентативність, таким чином зменшуючи ймовірність упередженості і гарантуючи інклюзивність отриманих в результаті інновацій.

Ця нова парадигма, заснована на обміні інформацією, також дозволяє нам захищати фундаментальні права людей, оскільки вона заохочує ключових гравців ділитися тим, як вони створюють технології, що можуть мати значний – у багатьох випадках негативний – вплив на свободу волі та демократію. Прискорене поширення в “соціальних мережах” теорій змови та “фейкових новин” демонструє нагальну потребу зробити загальнодоступними алгоритми рекомендацій на таких платформах, як X, Facebook, TikTok і ChatGPT.

Конкретні приклади

Платформи для публікації результатів відкритих досліджень, такі як Science Open, Open Access, ResearchGate або Welcome Open Research, дозволяють обмінюватися результатами і методами досліджень, тим самим прискорюючи і полегшуючи академічні дослідження і розробки. Вони орієнтовані на результати, допомагаючи покращити консенсус, швидше масштабувати рішення практичних проблем і легше трансформувати їх у промислові застосування.

Програмне забезпечення та бібліотеки з відкритим кодом сприяють швидшим спільним розробкам, надаючи розробникам, науковцям та інженерам готові до використання комп’ютерні програми та програмні функції з доступом до вихідного коду (програмне забезпечення з відкритим кодом) або без нього (бібліотеки та інтерфейси прикладного програмування). Бібліотека Python під назвою TensorFlow широко використовується всіма, хто впроваджує алгоритми машинного навчання.

Платформи відкритих даних, такі як Відкриті дані Світового банку або репозиторій відкритих даних Всесвітньої організації охорони здоров’я, дозволяють створювати репрезентативні навчальні набори даних для аналізу проблеми або підвищення точності статистичних метрик. Це дозволяє створювати більш ефективні алгоритмічні моделі для вирішення масштабних і складних проблем. Можна також згадати Бюро перепису населення США, відкриту базу даних Bold Open Database від Veuve Clicquot або нещодавній проект Météo France, який незабаром відкриє доступ до своїх даних, щоб використовувати компетенції талановитих людей для аналізу кліматологічних даних та даних про погоду в режимі реального часу.

Як діяти

Суб’єкти приватного сектору повинні розрізняти алгоритмічні технології та дані, які є ключовими для їхньої інтелектуальної власності та бізнес-моделі, і другорядні, які в кінцевому підсумку підтримують перші. Вони також можуть ділитися окремими частинами свого вихідного коду, щоб скористатися перевагами парадигми відкритого коду, включаючи тестування коду і моделей, виявлення алгоритмічних помилок або загальних удосконалень, зберігаючи при цьому свою інтелектуальну власність на певний період. Крім того, не відкриваючи частину вихідного коду своєї технології, вони можуть передбачити обмін і відкриття частини або всього набору даних, які вони використовували для побудови алгоритму (алгоритмів), вбудованих в їхню технологію.

Обмін найкращими практиками, які визначають частину алгоритмічного управління, може зробити команди та компанії більш конкурентоспроможними, оскільки вони стають більш надійними, а отже, більш привабливими для користувачів, споживачів, громадськості та ринків. Нарешті, обмін помилками і невдалими спробами, а також знаннями також є критично важливим у парадигмі відкритості, що забезпечить кожному учаснику безпечний простір для обміну інформацією, обговорення і викликів один одному.

Навколо “відкритості” точиться все більше дискусій, які, ймовірно, стануть стандартним баченням для державних і приватних інституцій. Очікування наступного покоління включають розробку та впровадження конкретної та специфічної стратегії відкритості шляхом визначення інноваційних компонентів, що підлягають відкриттю, таких як дані, алгоритм та вихідний код, а також умов для обміну. Це частина управління даними та алгоритмами.

Автори: Орелі Жан, Гійом Сібу, Марк Еспозіто та Теренс Це.

Джерело: LSE, (Лондонська школа економіки)

МК

Опубліковано

13.01.2024

Аналітика

Теги: