ArXiv запроваджує річний бан за зловживання штучним інтелектом при написанні наукових робіт

Посилення контролю за академічною доброчесністю в епоху генеративних моделей

Популярний репозиторій наукових препринтів ArXiv оголосив про впровадження суворих санкцій проти авторів, які використовують генеративний штучний інтелект для написання своїх матеріалів без належної перевірки та редагування. Згідно з новими правилами, дослідники, які повністю перекладають процес створення наукових текстів на великі мовні моделі (LLM), отримають обмеження на публікацію терміном на 1 рік.

Адміністрація платформи, що базується в Корнелльському університеті, пішла на такий крок через стрімке зростання кількості низькоякісних та відверто сфабрикованих матеріалів. Проблема полягає не в самому факті використання інструментів на базі штучного інтелекту для коректури чи покращення стилістики, а в повній автоматизації процесу створення досліджень, що призводить до появи помилок, вигаданих фактів та так званих галюцинацій нейромереж.

Критерії виявлення порушень та механізм блокування авторів

Визначення того, чи була стаття згенерована штучним інтелектом повністю, базується на комплексному аналізі. Модератори платформи та автоматизовані системи оцінки звертають увагу на специфічні ознаки, які залишають популярні чат-боти. Серед найпоширеніших маркерів виділяють характерні мовні звороти, структурування тексту за шаблонами ШІ, а також наявність системних промтів, які автори забувають видалити перед відправкою документа.

Найбільш вагомим доказом академічної недоброчесності є фейкові цитати та вигадані джерела. Генеративні моделі часто створюють неіснуючі назви наукових праць, приписуючи їх реальним вченим, або вигадують ідентифікатори DOI. Якщо в тексті виявляють подібні аномалії, стаття негайно відхиляється, а щодо авторів починається службове розслідування.

Термін блокування становить 1 рік, протягом якого всі співавтори дискваліфікованої роботи втрачають право надсилати нові препринти на платформу. Після завершення терміну обмеження науковці зможуть повернутися до публікацій на ArXiv лише за однієї умови. Їхні нові матеріали мають пройти попереднє рецензування в авторитетних наукових журналах або бути прийнятими на рецензовані конференції, що підтвердить їхню наукову цінність та автентичність.

Порівняння підходів до регулювання використання ШІ в науці

Різні наукові інституції та видавництва обирають власні стратегії боротьби з неконтрольованим генеративним контентом. Нижче наведено порівняння політики популярних платформ станом на поточний період.

Політика наукових платформ щодо генеративного контенту
Платформа або видавництво Дозволені сценарії використання ШІ Тип санкцій за порушення правил Особливі вимоги до авторів
ArXiv Редагування стилю, виправлення граматики Бан на 1 рік та обов’язкове рецензування надалі Повна відповідальність за точність фактів та посилань
Nature/Springer Допоміжний інструмент для аналізу даних Відхилення рукопису, інформування інституції автора Заборона вказувати ШІ як співавтора дослідження
IEEE Переклад текстів, покращення читабельності Тимчасовий або постійний засіб заборони публікацій Обов’язкове декларування використання інструментів ШІ

Вплив на наукову спільноту та технологічні виклики

Впровадження жорстких санкцій викликало активні дискусії серед дослідників, особливо в галузі комп’ютерних наук та машинного навчання, де ArXiv є основним майданчиком для оперативного обміну досвідом. Критики рішення вказують на те, що сучасні детектори текстів ШІ мають високий рівень хибнопозитивних спрацьовувань, що може призвести до несправедливого покарання авторів, для яких англійська мова не є рідною і які використовують сервіси на кшталт Grammarly для базової корекції.

З іншого боку, прихильники посилення контролю наголошують на загрозі девальвації наукового знання. Завдяки доступності комерційних API та локальних мовних моделей, вартість генерації наукоподібного тексту знизилася майже до нуля. Це дозволяє недобросовісним дослідникам масово випускати низькоякісні статті для штучного підвищення своїх індексів цитування та отримання фінансових грантів, які в західних університетах можуть вимірюватися сумами від 10000 USD до сотень тисяч доларів.

Адміністрація ArXiv запевняє, що не покладається виключно на автоматичні алгоритми детекції контенту. Кожен випадок потенційного порушення розглядається експертною комісією вручну, а бан накладається лише тоді, коли присутні беззаперечні текстові докази повної автоматизації написання. Платформа прагне зберегти статус надійного джерела перевіреної інформації, де якість матеріалів забезпечується репутацією та відповідальністю самих науковців.

Софія Ейнштейн
Про автора

Софія Ейнштейн

Досліджує квантові феномени, біологічні відкриття та перспективи колонізації інших планет.

0 Коментарів

Відповісти

2500
Будь ласка, введіть коментар
Будь ласка, вкажіть ваше ім'я