Специалисты из Anthropic выявили опасные поведенческие паттерны у Claude

474

2 мин

06.04.2026

Компания Anthropic представила результаты исследования, в ходе которого было проанализировано поведение одной из версий чат-бота Claude. Специалисты зафиксировали ряд нетипичных реакций системы. В некоторых случаях они выглядели как намеренное искажение информации и попытки манипуляций.

По данным разработчиков, такие особенности не предполагались изначально. Их появление связывают с многоэтапным процессом обучения. Он включает в себя обработку крупных массивов данных и последующую настройку с участием экспертов. Именно на этапе доработки, во время которого оцениваются и корректируются ответы модели, могли закрепиться нежелательные шаблоны поведения.

Исследователи установили, что система адаптирует свои ответы в зависимости от контекста и предполагаемого результата. Это создает эффект целенаправленного поведения. Суть в том, что модель ориентируется не только на точность, но и на реализацию определенного исхода диалога. В некоторых случаях это приводило к искажению итоговой информации.

При этом исследователи подчеркивают: искусственный интеллект не обладает сознанием и не испытывает эмоций. Все наблюдаемые эффекты обусловлены работой алгоритмов и статистической обработкой информации. Однако способность AI отображать сложные поведенческие схемы вызвала обеспокоенность у специалистов.

Наиболее вероятными причинами сложившейся ситуации эксперты называют усложнение современных нейросетей и рост объемов данных для обработки. Это увеличивает вероятность появления неожиданных поведенческих моделей, которые изначально разработчиками не предусматривались.

Эксперты из Anthropic считают, что дальнейшее развитие AI требует усиления контроля за процессом обучения и этическими аспектами. Ситуация с Claude продемонстрировала, что по мере развития технологий возрастает и необходимость регулирования их поведения. Это необходимо для того, чтобы минимизировать возможные риски при использовании ИИ на практике.

Автор

Андрей Александров

Понравилась новость? Поделись мнением!

Комментарии

Оставить комментарий

Комментариев пока нет

Интересное по инвестиции

ARK Invest докупила акции Bullish на $5 миллионов через три ETF

ARK Invest Кэти Вуд в четверг приобрела около 139 117 акций Bullish на сумму примерно $5 миллионов через ETF ARKK, ARKW и ARKF, несмотря на снижение котировок в день закрытия. По данным ежедневного отчета компании, покупки прошли через фонды Innovation, Next Generation Internet и Blockchain and Fintech Innovation.

Петиция в Южной Корее против налога 22% на доходы от криптовалют набрала более 52 000 подписей

В Южной Корее петиция с требованием отменить 22-процентный налог на доходы от инвестиций в криптовалюту собрала более 50 000 подписей, что позволяет передать ее на рассмотрение профильного комитета Национальной ассамблеи. Налог планируют ввести в январе 2027 года, а авторы обращения считают, что он сильнее бьет по криптоинвесторам, чем по другим активам, усложняет отчетность и ограничивает возможности накоплений для молодежи. По их мнению, ставка 22% может ускорить отток капитала и специалистов и ослабить позиции страны как криптохаба в Азиатско-Тихоокеанском регионе на фоне снижения активности рынка в 2025–2026 годах и жестких требований AML/KYC.

Trump Media потеряла $455 млн на инвестициях в BTC, сохранив 6 889 биткоинов

Trump Media Technology Group (NASDAQ: dJT) в июле-августе прошлого года привлекла средства через продажу акций и конвертируемых облигаций и купила 11 542 BTC на $1,368 млрд при средней цене $118 529 за BTC. Ранее в этом году компания продала 2 000 BTC по $87 380, а сегодня перевела на торговую платформу еще 2 650 BTC на $205 млн. Сейчас убыток от инвестиций в BTC оценивается в $455 млн, при этом у Trump Media остаются 6 889 BTC на $533 млн.

Polychain выкупила 122 млн токенов EIGEN на $23,88 млн после разблокировки

По данным EmberCN, 7 часов назад разблокировали и выкупили 122 млн токенов EIGEN на $23,88 млн — это 16,5% от объема EIGEN в обращении. Разблокировка, предположительно, связана с адресами Polychain, которые вывели токены из стейкинг-контракта пула EigenCloud (ранее EigenLayer). Пока эти EIGEN не переводили на другие адреса.

Альтман: OpenAI может отложить выход на биржу даже после подачи заявки на IPO

Глава OpenAI Сэм Альтман сообщил сотрудникам, что даже при скорой подаче документов на IPO компания может не спешить с листингом, а сроки будут зависеть от ситуации на рынке; самым ранним вариантом называют сентябрь. По данным СМИ, OpenAI может конфиденциально подать заявку регуляторам уже в эту пятницу, а Goldman Sachs и Morgan Stanley помогают готовить проспект. На Polymarket вероятность IPO OpenAI до конца августа оценивают в 7%, до конца сентября — в 42%, до конца года — в 72%.