Государственные данные для нейросетей: новый баланс

Правительство России продолжает работу над законопроектом о регулировании искусственного интеллекта, внося в него существенные изменения.
Согласно последней версии документа, с которой ознакомился «Коммерсантъ», разработчикам суверенных и национальных ИИ-моделей могут разрешить обучать свои нейросети на государственных данных. Однако доступ к такой информации будет предоставляться только после согласования с Федеральной службой по техническому и экспортному контролю и Федеральной службой безопасности.
Это предложение стало одним из ряда дополнений, которые появились в новой редакции законопроекта. Документ уже прошёл первое чтение в правительстве и в настоящее время дорабатывается совместно с представителями отрасли и заинтересованными ведомствами.
Что меняется в регулировании
Помимо доступа к государственным данным, новая версия законопроекта вводит несколько ключевых положений.
Во-первых, закрепляется понятие «доверенной» ИИ-модели. Статус доверенной сможет получить только та модель, которая включена в соответствующий реестр. Порядок ведения этого реестра и критерии включения в него будет устанавливать правительство. Ранее предполагалось, что требование нахождения в реестре будет распространяться только на модели, используемые на объектах критической информационной инфраструктуры и в государственных информационных системах.
Во-вторых, правительство получает право устанавливать случаи обязательного применения суверенных и национальных моделей в банковской сфере — по согласованию с Центральным банком.
В-третьих, законопроект закрепляет ответственность операторов и владельцев ИИ за обеспечение информационной безопасности моделей.
Путь законопроекта: от жёсткой версии к компромиссной
Важно понимать, что текущая редакция — результат значительного смягчения первоначальных требований. Первая версия законопроекта, опубликованная правительством в феврале 2026 года, вызывала масштабную критику со стороны бизнеса.
Изначально предлагалось, что суверенные и национальные модели должны разрабатываться и обучаться исключительно гражданами России с использованием только российских наборов данных. Кроме того, для интернет-сервисов с аудиторией более 500 тысяч пользователей вводилось требование регистрироваться в качестве организатора распространения информации.
Бизнес предупреждал, что такие требования приведут к росту затрат на внедрение ИИ на 20–40% и замедлят вывод продуктов на рынок в полтора-два раза. В ответ на это правительство смягчило подход. В апрельской версии документа из законопроекта исключили требования к наборам данных для обучения моделей, а также убрали норму о разработке суверенных моделей исключительно гражданами России. Теперь для получения статуса достаточно, чтобы разработку вела российская компания, а сама модель соответствовала отечественному законодательству и традиционным ценностям.
Таким образом, текущее предложение об обучении на государственных данных — это не возврат к жёстким ограничениям, а новый механизм, который даёт разработчикам доступ к ценным массивам информации, но под контролем регуляторов.
Мнения участников рынка
Реакция отрасли на нововведения оказалась неоднозначной.
Генеральный директор Национальной федерации музыкальной индустрии Никита Данилов считает оправданным введение дополнительных требований к обучению ИИ на государственных данных. По его мнению, неконтролируемое использование информации, в том числе персональных данных, несёт серьёзные риски для информационной безопасности.
В Ассоциации больших данных, напротив, предупреждают о необходимости соблюдать осторожность. Регулирование, указывают в ассоциации, не должно приводить к появлению дополнительных барьеров, особенно в части получения данных, необходимых для выполнения установленных обязанностей.
В компании MWS AI (входит в МТС Web Services) полагают, что согласование использования закрытых данных с государственными структурами не должно существенно осложнить процесс обучения ИИ и его работу.
Однако в «Т-технологиях» обращают внимание на нерешённый вопрос: документ вводит понятия «суверенной» и «национальной» модели, но не раскрывает их содержание и сферу применения. Директор по развитию технологий ИИ компании Алексей Шпильман отмечает, что сформулировать требования к таким моделям будет сложно. Любые критерии либо окажутся невыполнимыми, либо потеряют смысл, поскольку под них можно будет формально подвести любую минимально модифицированную систему.
Категории моделей: в чём разница
Законопроект вводит три категории ИИ-моделей.
Суверенная модель — система, полностью разработанная в России с использованием только отечественных технологий и данных на всех этапах.
Национальная модель может создаваться с использованием иностранных open-source решений, но при её обучении должны использоваться российские наборы данных.
Доверенная модель — система, прошедшая проверку ФСБ и ФСТЭК и включённая в специальный реестр.
Для использования в государственных информационных системах и на объектах критической информационной инфраструктуры потребуются именно доверенные модели.
Для российских разработчиков ИИ появление возможности обучаться на государственных данных открывает доступ к информации, которая ранее была для них практически закрыта. Государственные массивы данных — это огромный ресурс, который может повысить качество отечественных моделей, особенно в таких сферах, как госуправление, медицина, транспорт.
Однако процедура согласования с ФСБ и ФСТЭК может стать новым административным барьером, особенно для небольших компаний и проектов. Ключевым вопросом остаётся то, насколько прозрачной и предсказуемой будет эта процедура.
Для банковской сферы норма об обязательном применении суверенных и национальных моделей означает, что финансовые организации, уже активно внедряющие ИИ для скоринга, анализа рисков и обслуживания клиентов, будут вынуждены переходить на отечественные решения. Это ускорит импортозамещение в критически важной отрасли, но одновременно потребует от банков дополнительных инвестиций.
Для крупных технологических компаний, таких как «Сбер» и «Яндекс», у которых уже есть собственные языковые модели, изменения в законопроекте, скорее всего, не создадут серьёзных проблем. Их решения уже полностью локализованы и соответствуют требованиям безопасности. Более того, по данным исследований, 90% россиян уже используют отечественные ИИ-сервисы, включая YandexGPT и GigaChat.
Перспективы принятия
Законопроект планируется принять до конца 2026 года, а вступление его в силу ожидается с 1 сентября 2027 года. Документ носит рамочный характер — многие ключевые детали, включая критерии включения в реестр доверенных моделей и конкретные требования к безопасности, будут прописаны в подзаконных актах.
В Минцифры подчёркивают, что говорить о финальной версии и конкретных деталях пока рано. Это означает, что процесс согласования продолжается, и окончательный облик регулирования может ещё измениться.
Ключевой вызов для разработчиков — найти баланс между соблюдением новых требований и сохранением гибкости, необходимой для инноваций. Для государства — обеспечить безопасность, не создав при этом избыточных барьеров, которые затормозят развитие одной из самых динамичных технологических отраслей.
С уважением к Вашему делу, Ника Виноградова
Источник: Sostav.ru
