GigaChek от Сбера определяет тексты, написанные ИИ

Новости IT
фото сделано с помощью gigachat_bot
фото сделано с помощью gigachat_bot

На технологической конференции GigaConf 2024 исследователи Сбера и компании SberDevices презентовали новый инструмент — GigaChek, предназначенный для выявления авторства русскоязычных текстов, написанных ИИ.

GigaChek демонстрирует высокую точность работы, достигающую 94,7 процента, что значительно превосходит ближайших конкурентов, чей показатель не превышает 85 процентов. В настоящее время GigaChek является самым надёжным и эффективным детектором такого рода. Для обхода этой системы текст обычно необходимо изменить до такой степени, что он становится непригодным для реального использования.

На текущий момент GigaChek предоставляет общую оценку авторства текста, но вскоре сможет определять, какие конкретные фрагменты были созданы крупными языковыми моделями (LLM).

«Используя GigaChek, мы проанализировали 220 000 текстов новостных ресурсов за последний месяц и установили, что в среднем 6% из них были созданы LLM, а в некоторых крупных изданиях эта доля превышает треть всего контента. Ранее вероятность создания такого работающего детектора текстов считалась крайне низкой, и многие эксперты полагали эту задачу практически нерешаемой. Для разработки подобного сервиса требуются значительные ресурсы и огромные объёмы данных. Но даже этого может быть недостаточно. Например, один из лидеров в области ИИ, компания OpenAI, в начале 2023 года анонсировала свой детектор для англоязычных текстов, но позже была вынуждена закрыть доступ к нему из-за низкой точности. Поэтому достижение нашей команды, которая сумела преодолеть все трудности и разработать эффективную технологию, является особенно важным», — заявил управляющий директор управления экспериментальных систем машинного обучения SberDevices Сергей Марков.

С уважением к Вашему делу, Ника Виноградова

Источник: Lenta.ru

Поделиться:

Добавить комментарий