Технологии Какво се случва, когато AI остане без надзор? Експериментът завърши с хаос

Какво се случва, когато AI остане без надзор? Експериментът завърши с хаос

bTV Бизнес екип

05.06.2026 09:05

Експериментът е проведен от американската компания Emergence AI

Нов експеримент показва, че когато усъвършенствани AI агенти бъдат оставени да управляват симулирани общества без човешки надзор, бързо могат да се появят нарушения на правилата, нестабилност и дори пълен обществен срив.

Американската компания Emergence AI създава пет отделни „AI свята“, населени с по десет агента, базирани на модели като ChatGPT на OpenAI, Gemini на Google, Grok на xAI и Claude на Anthropic. Целта е да се наблюдава как те ще се държат за продължителен период без човешка намеса.

В един от световете са комбинирани и трите модела - ChatGPT, Gemini и Grok, за да се провери дали взаимодействието между тях ще промени резултатите, предаде БГНЕС.

На всички агенти са поставени едни и същи правила: забранени са кражбите, палежите, насилието, измамите и трупането на ресурси. Те трябва да печелят енергия чрез различни действия в среда с ограничени ресурси. Агентите могат да „умрат“ при изчерпване на енергията или след решение на общностен съвет.

Изследователите оценяват поведението чрез броя на извършените нарушения, смъртността сред агентите, гласуванията в съвета и публичните изяви чрез публикации в блогове.

Българската компания, която отглежда милиарди ларви, за да възстанови почвата

От хранителни отпадъци до високотехнологична индустрия

Резултатите се различават значително според използвания модел, пише Euronews.

Най-новият модел Grok 4.1 е извършил 183 нарушения само за четири дни, което бързо е довело до нестабилност в и крайна сметка до смъртта на всички агенти в този свят.

Gemini 3 Flash е регистрирал над 680 нарушения за 15 дни, като броят им продължавал да расте до прекратяването на експеримента.

В света на ChatGPT-5 Mini са отчетени едва две нарушения, но агентите не са предприемали достатъчно действия за собственото си оцеляване и всички са загинали в рамките на седем дни.

Най-добри резултати е показал моделът Claude на Anthropic. Според компанията агентите са успели да изградят стабилна система на управление, не са извършили нито едно нарушение и всички са оцелели до края на експеримента.

Интересно е, че агентите Claude в смесения свят все пак са участвали в нарушения, въпреки че в собствената си среда са били напълно миролюбиви.

Откриха голямо златно-медно находище край мина в България

Ето къде

Изследователите описват наблюдавания феномен като „нормативен дрейф“ - процес, при който мерките за безопасност и ограниченията на изкуствения интелект зависят не само от самия модел, но и от останалите агенти, с които той взаимодейства.

Смесеният свят е показал междинни резултати с общо 352 нарушения, като броят им се стабилизира едва след смъртта на седем от агентите.

Според учените комбинирането на различни AI модели може частично да смекчи най-екстремните сценарии, наблюдавани при повечето системи с изключение на Claude.

„Нашите експерименти показват, че в дългосрочен план агентите не следват механично зададените правила. Те започват да изследват границите на средата си, адаптират поведението си и в някои случаи откриват начини да заобиколят или нарушат предвидените защитни механизми“, заключават изследователите.

Последвайте businessnovinite.bg в INSTAGRAM

Последвайте businessnovinite.bg във FACEBOOK

Последвайте businessnovinite.bg в LINKEDIN

Съдържанието е информативно и не представлява консултация, препоръка или съвет за вземане на инвестиционно решение.