Open Source Initiative (OSI), організація, що займається питаннями відкритого коду, представила версію 1.0 свого визначення відкритого коду для штучного інтелекту (OSAID). Цей документ став результатом багаторічної співпраці з академічними та промисловими колами і має на меті встановлення стандарту, який дозволить визначати, чи відноситься ІШ до категорії відкритого коду.
На перший погляд, може виникнути питання, навіщо важливо мати чітке визначення відкритого коду для ІШ. Як зазначив Стефано Маффуллі, виконавчий віце-президент OSI, однією з головних цілей є об'єднання розробників та політиків для спільної роботи.
«Регулятори вже починають звертати увагу на цю сферу», — сказав Маффуллі в інтерв'ю TechCrunch. Він підкреслив, що необхідно забезпечити узгодженість думок серед різних зацікавлених сторін.
Щоб ІШ-система вважалася відкритою відповідно до OSAID, вона повинна надавати достатньо інформації про свою архітектуру, дозволяючи іншим розробникам «суттєво» відтворити модель. Також вимагається розкриття деталей про навчальні дані, включаючи їх джерело, методи обробки та ліцензування.
«Штучний інтелект з відкритим кодом дозволяє користувачам повністю зрозуміти процес його створення», — додав Маффуллі. Це означає, що всі компоненти, такі як код, що використовується для навчання та обробки даних, повинні бути доступні.
OSAID також описує права, які розробники можуть очікувати від відкритих моделей, наприклад, свободу використання та модифікації без попереднього дозволу. «Важливо, щоб ви могли будувати на основі існуючих моделей», — зазначив Маффуллі.
Однак OSI не має механізмів примусу, щоб змусити розробників дотримуватися OSAID. Проте організація планує звертати увагу на моделі, які неправомірно називаються відкритими.
«Ми сподіваємося, що спільнота реагуватиме, коли хтось спробує зловживати терміном "відкритий код"», — сказав Маффуллі. Історично такі спроби мали неоднозначні результати, але не були повністю безрезультатними.
Деякі стартапи та великі компанії, такі як Meta, часто використовують термін «відкритий код» для своїх ІШ-моделей, однак лише небагато відповідають критеріям OSAID. Наприклад, Meta вимагає, щоб платформи з понад 700 мільйонами активних користувачів запитували спеціальні ліцензії для використання їх моделей Llama.
Маффуллі висловив невдоволення щодо підходу Meta до називання своїх моделей «відкритими». Після обговорень з OSI Google і Microsoft погодилися не використовувати цей термін для моделей, які не є повністю відкритими, але Meta не дотрималася цього прикладу.
Stability AI також рекламувала свої моделі як «відкриті», проте вимагає корпоративної ліцензії від компаній з доходом вище мільйона доларів. Французький стартап Mistral вводить обмеження на використання своїх моделей для комерційних цілей.
Дослідження, проведене Signal Foundation та іншими організаціями, показало, що багато моделей, які заявляються як відкриті, лише формально відповідають цьому визначенню. Дані для навчання часто залишаються закритими, а необхідні обчислювальні ресурси недоступні для більшості розробників, що призводить до посилення централізації влади в цій сфері.
Деякі експерти висловлюють думку, що OSAID не охоплює всі аспекти, пов'язані з ліцензуванням навчальних даних. Наприклад, чи може вважатися відкритою модель, якщо для отримання даних для її навчання необхідно платити?
«Визначення відкритого коду ІШ повинно забезпечувати впевненість у ліцензуванні», — зазначив Лука Антіга з Lightning AI. Він додав, що ігнорування питання ліцензування даних може знизити ефективність визначення.
Версія 1.0 OSAID не розглядає авторські права в контексті моделей ІШ, що також може стати проблемою. Якщо суди приймуть рішення про те, що моделі можуть бути захищені авторським правом, можуть знадобитися нові юридичні інструменти для належного відкриття таких моделей.
Маффуллі погодився, що визначення потребує оновлень, і для цього OSI створила комітет, який буде стежити за його застосуванням і пропонувати зміни.
«Це колективна робота, що здійснюється відкрито за участю різних зацікавлених сторін», — підсумував він.