Open Source Initiative (OSI), организация, занимающаяся вопросами открытого исходного кода, представила версию 1.0 своего определения открытого исходного кода для искусственного интеллекта (OSAID). Этот документ стал результатом многолетнего сотрудничества с академическими и промышленными кругами и направлен на установление стандарта, который позволит определять, относится ли ИИ к категории открытого исходного кода.
На первый взгляд, может возникнуть вопрос, зачем важно иметь четкое определение открытого исходного кода для ИИ. Как отметил Стефано Маффулли, исполнительный вице-президент OSI, одной из главных целей является объединение разработчиков и политиков для совместной работы.
«Регуляторы уже начинают обращать внимание на эту сферу», — сказал Маффулли в интервью TechCrunch. Он подчеркнул, что необходимо обеспечить согласованность мнений среди различных заинтересованных сторон.
Чтобы ИИ-система считалась открытой в соответствии с OSAID, она должна предоставлять достаточно информации о своей архитектуре, позволяя другим разработчикам «существенно» воссоздать модель. Также требуется раскрытие деталей об обучающих данных, включая их источник, методы обработки и лицензирование.
«Искусственный интеллект с открытым исходным кодом позволяет пользователям полностью понять процесс его создания», — добавил Маффулли. Это подразумевает, что все компоненты, такие как код, используемый для обучения и обработки данных, должны быть доступны.
OSAID также описывает права, которые разработчики могут ожидать от открытых моделей, например, свободу использования и модификации без предварительного разрешения. «Важно, чтобы вы могли строить на основе существующих моделей», — отметил Маффулли.
Однако OSI не имеет механизмов принуждения, чтобы заставить разработчиков следовать OSAID. Тем не менее, организация планирует обращать внимание на модели, которые неправомерно именуются открытыми.
«Мы надеемся, что сообщество будет реагировать, когда кто-то попытается злоупотребить термином "открытый исходный код"», — сказал Маффулли. Исторически подобные попытки имели неоднозначные результаты, но не были полностью бесполезными.
Некоторые стартапы и крупные компании, такие как Meta, часто используют термин «открытый исходный код» для своих ИИ-моделей, однако лишь немногие соответствуют критериям OSAID. Например, Meta требует, чтобы платформы с более чем 700 миллионами активных пользователей запрашивали специальные лицензии для использования их моделей Llama.
Маффулли выразил недовольство по поводу подхода Meta к наименованию своих моделей «открытыми». После обсуждений с OSI, Google и Microsoft согласились не использовать этот термин для моделей, которые не являются полностью открытыми, но Meta не последовала этому примеру.
Stability AI также рекламировала свои модели как «открытые», однако требует корпоративной лицензии от компаний с доходом выше миллиона долларов. Французский стартап Mistral вводит ограничения на использование своих моделей для коммерческих целей.
Исследование, проведенное Signal Foundation и другими организациями, показало, что многие модели, заявляемые как открытые, лишь формально соответствуют этому определению. Данные для обучения зачастую остаются закрытыми, а необходимые вычислительные ресурсы недоступны для большинства разработчиков, что ведет к усилению централизации власти в этой сфере.
Некоторые эксперты выражают мнение, что OSAID не охватывает все аспекты, касающиеся лицензирования обучающих данных. Например, может ли считаться открытой модель, если для получения данных для ее обучения необходимо платить?
«Определение открытого исходного кода ИИ должно обеспечивать уверенность в лицензировании», — отметил Лука Антига из Lightning AI. Он добавил, что игнорирование вопроса лицензирования данных может снизить эффективность определения.
Версия 1.0 OSAID не рассматривает авторские права в контексте моделей ИИ, что также может стать проблемой. Если суды примут решение о том, что модели могут быть защищены авторским правом, могут потребоваться новые юридические инструменты для правильного открытия таких моделей.
Маффулли согласился, что определение требует обновлений, и для этого OSI создала комитет, который будет следить за его применением и предлагать изменения.
«Это коллективная работа, осуществляемая открыто с участием различных заинтересованных сторон», — подытожил он.