ArXiv вводит годовой бан за злоупотребление искусственным интеллектом при написании научных работ

Усиление контроля за академической добропорядочностью в эпоху генеративных моделей

Популярный репозиторий научных препринтов ArXiv объявил о внедрении строгих санкций против авторов, использующих генеративный искусственный интеллект для написания своих материалов без надлежащей проверки и редактирования. Согласно новым правилам, исследователи, которые полностью перекладывают процесс создания научных текстов на большие языковые модели (LLM), получат ограничение на публикации сроком на 1 год.

Администрация платформы, базирующаяся в Корнеллском университете, пошла на такой шаг из-за стремительного роста количества низкокачественных и откровенно сфабрикованных материалов. Проблема заключается не в самом факте использования инструментов на базе искусственного интеллекта для корректуры или улучшения стилистики, а в полной автоматизации процесса создания исследований, что приводит к появлению ошибок, вымышленных фактов и так называемых галлюцинаций нейросетей.

Критерии выявления нарушений и механизм блокировки авторов

Определение того, была ли статья сгенерирована искусственным интеллектом полностью, базируется на комплексном анализе. Модераторы платформы и автоматизированные системы оценки обращают внимание на специфические признаки, которые оставляют популярные чат-боты. Среди наиболее распространенных маркеров выделяют характерные речевые обороты, структурирование текста по шаблонам ИИ, а также наличие системных промтов, которые авторы забывают удалить перед отправкой документа.

Наиболее весомым доказательством академической недобросовестности являются фейковые цитаты и вымышленные источники. Генеративные модели часто создают несуществующие названия научных трудов, приписывая их реальным ученым, или выдумывают идентификаторы DOI. Если в тексте обнаруживают подобные аномалии, статья немедленно отклоняется, а в отношении авторов начинается служебное расследование.

Срок блокировки составляет 1 год, в течение которого все соавторы дисквалифицированной работы теряют право отправлять новые препринты на платформу. После завершения срока ограничения ученые смогут вернуться к публикациям на ArXiv только при одном условии. Их новые материалы должны пройти предварительное рецензирование в авторитетных научных журналах или быть принятыми на рецензируемые конференции, что подтвердит их научную ценность и подлинность.

Сравнение подходов к регулированию использования ИИ в науке

Различные научные институты и издательства выбирают собственные стратегии борьбы с неконтролируемым генеративным контентом. Ниже приведено сравнение политики популярных платформ по состоянию на текущий период.

Политика научных платформ в отношении генеративного контента
Платформа или издательство Разрешенные сценарии использования ИИ Тип санкций за нарушение правил Особые требования к авторам
ArXiv Редактирование стиля, исправление грамматики Бан на 1 год и обязательное рецензирование в дальнейшем Полная ответственность за точность фактов и ссылок
Nature/Springer Вспомогательный инструмент для анализа данных Отклонение рукописи, информирование института автора Запрет указывать ИИ в качестве соавтора исследования
IEEE Перевод текстов, улучшение читаемости Временный или постоянный запрет на публикации Обязательное декларирование использования инструментов ИИ

Влияние на научное сообщество и технологические вызовы

Внедрение жестких санкций вызвало активные дискуссии среди исследователей, особенно в области компьютерных наук и машинного обучения, где ArXiv является основной площадкой для оперативного обмена опытом. Критики решения указывают на то, что современные детекторы текстов ИИ имеют высокий уровень ложноположительных срабатываний, что может привести к несправедливому наказанию авторов, для которых английский язык не является родным и которые используют сервисы вроде Grammarly для базовой коррекции.

С другой стороны, сторонники усиления контроля подчеркивают угрозу девальвации научного знания. Благодаря доступности коммерческих API и локальных языковых моделей, стоимость генерации наукообразного текста снизилась почти до нуля. Это позволяет недобросовестным исследователям массово выпускать низкокачественные статьи для искусственного повышения своих индексов цитирования и получения финансовых грантов, которые в западных университетах могут измеряться суммами от 10000 USD до сотен тысяч долларов.

Администрация ArXiv уверяет, что не полагается исключительно на автоматические алгоритмы детекции контента. Каждый случай потенциального нарушения рассматривается экспертной комиссией вручную, а бан накладывается только тогда, когда присутствуют неопровержимые текстовые доказательства полной автоматизации написания. Платформа стремится сохранить статус надежного источника проверенной информации, где качество материалов обеспечивается репутацией и ответственностью самих ученых.

София Эйнштейн
Об авторе

София Эйнштейн

Исследует квантовые феномены, биологические открытия и перспективы колонизации других планет.

0 Comments

Ответить

2500
Пожалуйста, введите комментарий
Пожалуйста, укажите ваше имя