OpenAI внедряет Trusted Contact как новый инструмент безопасности в ChatGPT

Механизм работы функции Trusted Contact

Компания OpenAI официально представила функцию Trusted Contact для совершеннолетних пользователей ChatGPT. Эта опциональная настройка позволяет добавить контактное лицо (члена семьи или друга), которое получит уведомление, если алгоритмы искусственного интеллекта зафиксируют признаки серьезного психологического кризиса или намерений причинить себе вред. В отличие от стандартных систем модерации, которые просто блокируют контент, этот инструмент направлен на привлечение реальной поддержки из внешнего мира.

Процесс активации начинается в настройках учетной записи. Пользователь указывает контактные данные лица, которому должно быть не менее 18 лет. После этого выбранный человек получает приглашение, которое он должен принять в течение 7 дней. Важно отметить, что доверенному лицу не обязательно иметь собственный аккаунт OpenAI для получения уведомлений через SMS или электронную почту.

Многоуровневая система верификации и конфиденциальность

Для предотвращения ложных срабатываний OpenAI использует комбинированный подход. Сначала автоматизированные системы анализируют контекст диалога. Если обнаружены критические маркеры, данные передаются специально обученной группе специалистов для ручной проверки. Только после подтверждения реальной угрозы доверенному лицу отправляется краткое сообщение. Разработчики подчеркивают, что текст уведомления не содержит логов переписки или деталей разговора, чтобы сохранить базовый уровень приватности пользователя.

Сравнение уровней реагирования на критические запросы
Тип вмешательства Механизм Получатель
Стандартная модерация Автоматическая блокировка и вывод ресурсов помощи Только пользователь
Trusted Contact Уведомление о необходимости проверки состояния человека Доверенное лицо
Экстренный протокол Передача данных локальным службам спасения (в определенных регионах) Службы 911 / 112

Этические и юридические аспекты внедрения

Запуск Trusted Contact произошел на фоне растущего давления на разработчиков ИИ со стороны регуляторов и общественности. Последние судебные иски указывали на то, что большие языковые модели могут непреднамеренно усиливать деструктивные состояния пользователей. Новая функция является попыткой OpenAI продемонстрировать ответственный подход к безопасности. Тем не менее, эксперты отмечают, что это накладывает определенную ответственность и на само доверенное лицо, которое становится первой линией поддержки.

Экономический контекст и доступность

Внедрение таких сложных систем требует значительных инвестиций в команду ручной проверки. OpenAI оценивает стоимость поддержки инфраструктуры безопасности в миллионы долларов ежегодно. На данный момент функция доступна для персональных аккаунтов и не распространяется на бизнес-версии ChatGPT Enterprise или Edu. Компания планирует постепенное развертывание в различных регионах с учетом местного законодательства о защите данных.

Дальнейшее развитие систем безопасности

Trusted Contact является частью более широкой стратегии, включающей обновление Model Spec и внедрение родительского контроля для подростков. OpenAI также сотрудничает с Американской психологической ассоциацией для уточнения алгоритмов распознавания тонких лингвистических маркеров депрессивных состояний. Ожидается, что в будущем подобные функции станут стандартом для всех крупных платформ генеративного ИИ.

Андрей Коннектов
Об авторе

Андрей Коннектов

Специалист по Wi-Fi и сверхскоростным сетям, следит за развитием стандартов связи.

0 Comments

Ответить

2500
Пожалуйста, введите комментарий
Пожалуйста, укажите ваше имя