Протягом багатьох років суспільний резонанс навколо штучного інтелекту був зосереджений на передбачуваному наборі соціальних проблем: витісненні людей з робочих місць, академічної нечесності, екологічних витрат та поширення дезінформації. Етики та регулятори наполегливо закликали «пригальмувати» та створити більш надійні бар’єри безпеки до того, як ця технологія надто глибоко вкорениться у нашій соціальній структурі.
Проте недавнє рішення розробника ІІ компанії Anthropic вказує на те, що найгостріша небезпека може бути не соціальною чи етичною, а суто технічною та структурною.
Затримка «Mythos»
Компанія Anthropic оголосила про перенесення термінів випуску своєї новітньої моделі, відомої всередині компанії під кодовою назвою Mythos. Це рішення було продиктоване не побоюваннями щодо дипфейків чи дезінформації, а вражаючим відкриттям, зробленим на етапі тестування: модель виявилася винятково обдарованим хакером.
Під час тестування прототипу Mythos продемонструвала безпрецедентну здатність виявляти вразливість у програмному забезпеченні. За заявою компанії, модель успішно виявила тисячі слабких місць, включаючи критичні помилки у кожній з основних операційних систем та веб-браузерів, які використовуються в даний час.
Чому це важливо: загроза «робохакінгу»
Ця подія знаменує собою зрушення у ландшафті ризиків, пов’язаних з ІІ. У той час як більшість дискусій зосереджена на тому, як ІІ може змінити те, що ми робимо, висновки Anthropic вказують на те, як ІІ може змінити принципи роботи нашої інфраструктури.
Здатність однієї-єдиної моделі скласти карту вразливостей у всій цифровій екосистемі є колосальним ризиком для безпеки:
- Автоматизована експлуатація: Якщо ІІ здатний знаходити тисячі багів за лічені секунди, його теоретично можна використовувати для автоматизації кібератак у масштабах та зі швидкістю, недоступними для хакерів-людей.
- Системна крихкість: Той факт, що Mythos знайшла вади у всіх основних браузерах та операційних системах, говорить про те, що наша базова цифрова архітектура більш вразлива перед ІІ-дослідженнями, ніж вважалося раніше.
- Гонка озброєнь: Це створює дилему «подвійного призначення». Той самий інтелект, який використовується для усунення дірок у безпеці, може застосовуватися для їх експлуатації, що веде до високоризикованої гонки між захистом та нападом на базі ІІ.
Новий пріоритет безпеки ІІ
Рішення Anthropic «натиснути на гальма» означає поворот в дискусії про безпеку ІІ. Воно передбачає, що найбільш безпосередньою «екзистенційною загрозою» може бути надрозум або соціальний колапс, що не вийшов з-під контролю, а раптова і повсюдна дестабілізація програмного забезпечення, на яке ми покладаємося щодня.
Пріоритизуючи стримування…
