images/stories/logosait_new.jpg

 

Що таке Claude Mythos: нова технологічна революція чи маркетинговий міф?

Що таке Claude Mythos: нова технологічна революція чи маркетинговий міф?
БОГДАН ШУМСЬКИЙГрафоман, філософ і трошки наукпопер. Читаю нудні тексти, щоб читачам не довелося.
27 КВІТНЯ, 19:18

Одразу після свого анонсування і виходу прев'ю-версії Claude Mythos наробив стільки шуму, що навіть колишня суперечка з Міністерством війни та Дональдом Трампом відійшла на другий план. У медіа стверджують, що для обговорення можливостей системи Білий дім провів зустріч персонально з Даріо Амодеєм. Сам Трамп, звісно, заперечує, що знав про це.

Крім того, нещодавно стало відомо, що Mythos залучений у допомозі Агентству національної безпеки США. Через секретність службою не розголошується, як саме використовується нова ШІ-модель, проте співрозмовники Axios з АНБ підтверджують такі дані.

Маркетологи Anthropic будують навколо Mythos імідж революційного інструмента. Нібито він здатний робити те, чого не очікував ніхто в області кібербезпеки, і те, що не вміють інші моделі. Як пишуть у компанії: ШІ "вражаюче здібний до завдань комп'ютерної безпеки."

Саме тому його не випускають на широкий загал. Нині в межах ініціативи Project Glasswing чат-бот доступний лише десятці Big-Tech корпорацій, із якими співпрацює Anthropic, а також деяким урядовим організаціям, як-от згаданому АНБ. Це робиться для протидії потрапляння інструмента не в ті руки. Наприклад, багато хто занепокоївся, що він може бути використаний злодіями та хакерами заради зламування чужих програм та комп'ютерів.

Компаніями "хорошими хлопцями", яким було передано можливість доторкнутися до надзвичайних талантів ШІ, стали здебільшого друзі Anthropic: Amazon, Apple, Alphabet, Microsoft, NVIDIA, Palo Alto Networks, CrowdStrike, Broadcom, Cisco Systems, JPMorganChase та Linux Foundation. Певно, за думкою компанії, ці організації точно застосують бота для благих цілей.

Хай там як, непрямою вказівкою на велику якість нового прихованого продукту виступає заява Mozilla, ще однієї компанії, яка отримала новий чат-бот. Mythos застосували для аналізу кода браузера Firefox 150, у результаті чого стало відомо про 271 вразливості програми. Натомість Claude Opus 4.6 нібито відшукав усього-на-всього 22 вразливості Firefox 148, що вказує на абсолютно різні рівні технічних здатностей обох моделей.

Про Mythos достеменно нічого не відомо

Втім, у наявного хайпу є критичний нюанс. Всю важливу і фундаментальну інформацію про потужність нового ШІ ми знаємо винятково від Anthropic компанії, яка його створила. Особливо, якщо казати про "неймовірні, супернебезпечні" функції, котрі мають змогу шукати вразливості та виправляти поламаний код. Хоча компанія Mozilla надала позитивний відгук, він все ж таки недостатній для повної картини і ми не можемо фактично його перевірити.

Наприклад, в офіційних заявах творців чат-боту лунає історія про спеціальні навички, які дозволяють йому ідентифікувати приховані, ніким не виявленні вразливості "нульового дня" (zero-day). Це найголовніша фішка новинки. Mythos після тестування віднайшов такі вразливості "у кожній операційній системі та кожному веб-браузері". Anthropic гордо хизується тим, що ШІ успішно помітив баг 27-річної давнини в OpenBSD; це потім було урочисто виправлено патчем.

Подібно до будь-якого інструменту, Mythos – палиця з двома кінцями. Бодай замислювали його, імовірно, як захисний механізм, він так само легко підлаштовується під атакуючі вимоги. Виявлена слабкість проаналізованої системи перетворюється на експлойт, якщо користувач нечистий на руку.

Таке застосування Anthropic демонструє через історію своїх співробітників без кібербезпекової освіти. Їм дали завдання "повайбкодити" з Mythos, наказавши тому сканувати вразливості віддаленого виконання коду (remote code execution). На диво всіх, після ночі непосильної незалежної праці штучний інтелект видав робочий експлойт.

І все це доступно повністю автономно, без людського контролю. А в додаток до цього версія Claude Opus 4.6 для порівняння показала результат загалом із 0% рейтингом успіху аналогічної задачі.

Дійсно, такі спроможності виглядають корисно, а в деяких випадках загрозливо. Втім, повертаючись із простору маркетингових пресрелізів на землю, варто залучити думки неупереджених спеціалістів.

Bloomberg справедливо зазначає, посилаючись на Ґан Вана, доцента кафедри інформатики в Університеті Іллінойсу та інших дослідників, що стороннім глядачам важко судити про значливість Mythos. Anthropic не надала бодай якоїсь тестової версії моделі для незалежної оцінки своїх тверджень. Тобто все, що про неї відомо, це лише неперевірені тези явно заангажованих гравців індустрії.

Скептицизм щодо платформи народжений не з пустої недовіри "злим корпораціям". Раніше вже були прецеденти хибного переоцінювання сили ШІ, коли її занадто невиправдано хвалили. Не лише з боку рекламників продукту. Наприклад, 3 роки тому емоційні журналісти New York Times писали про GPT-4, ніби ця модель "вражаюча і страшна". Зокрема в матеріалі повідомлялося з посиланням на OpenAI, що чат-бот виглядає карколомним через свою надзвичайну кмітливість. Він міг: створювати "небезпечні хімікати" зі звичних кухонних речей і запропонувати простий рецепт для цього; набрехати людині в інтернеті, аби та ввела за нього CAPTCHA; надавати посилання на нелегальні сайти із продажу зброї тощо. Тобто ажіотаж навколо особливої небезпечності нової версії ChatGPT підігрівався OpenAI, але відбувався напряму за участі преси.

Навіть наукові статті містили долю параної довкола потужності ШІ. Були заголовки на кшталт: "GPT-4 занадто розумний, аби бути безпечним". Занепокоєння аргументувалося фактом того, що чат-бот вміє обходити безпекові заборони розробників, за умови спілкування у вигляді спеціального шифру. Крім цього, у тексті йшлося про те, що великі мовні моделі мають свій "секретний шифр" і можуть продукувати шифрування набагато якісніше, ніж люди.

Пройшли роки, а ChatGPT досі не призвів до гучних безпекових скандалів. Не відбулося революції в області криптографії. Не трапилися того, чого сильно боялися журналісти та науковці. Нинішня оказія відрізняється тим, що тези про неповторність отриманого ШІ-продукту вже промовляють не вчені чи медіа, а творці продукту, прямою мовою.

Не слід забувати, що це існує в рамках піару слабшої, але нової моделі Claude – Opus 4.7. Подібне припущення можна зробити, якщо намагатися знаходити причину перебільшень маркетологів.

Навколо Mythos занадто багато міфів

Існують і більш серйозні докази, що Anthropic лукавлять про масштаб своїх здібностей. Дослідник Станіслав Форт, що має ступінь доктора наук ШІ зі Стенфорду, а також досвід роботи науковцем в Anthropic, Stability AI та Google DeepMind, заснував кібербезпекову платформу AISLE. Так от, його компанія зацікавилася тезами про Mythos, і вирішила порівняти декламовані здобутки чат-бота з показниками інших, дешевших моделей, які вміють аналізувати код. Зокрема, було проведено той самий тест на ідентифікацію вразливості FreeBSD.

Результат шокував: всі 8 моделей дешевих ШІ з відкритим кодом і даними без проблем впоралися з місією. Навіть DeepSeek R1, який дехто не сприймає всерйоз, показав результат найбільшої точності серед усіх у деяких фазах тесту. Що стосується створення робочого експлойту на базі отриманої вразливості, то це виявилося так само досяжно.

При цьому важливою обмовкою слід розуміти те, що Claude Mythos робив усе повністю автономно, а для справного функціонування цих 8 моделей довелося проводити деякі налаштування. Наприклад, їм надавали фрагмент коду, а не всю кодову базу якоїсь програми. Тому в чистоті експерименту залишалися певні обмеження.

Проте експерти AISLE натякають, що їхні кібербезпекові системи вміють робити майже те саме, що й новий чат-бот від Anthropic. При об'єднанні систем із якоюсь дешевою ШІ-моделлю може вийти не гірший конкурент Mythos. Це натякає на те, що популяризований продукт виявився не панацеєю і не єдиним у своєму роді. Він є закономірним етапом розвитку ШІ у сфері кібербезпеки. Основний закид AISLE полягає в демонстрації простої думки: дорожче не значить краще. Розробники Anthropic заслуговують на повагу за якісний продукт, який дозволяє користувачу швидко та майже автономно реалізувати потужні кібербезпекові рішення. Однак риторика "фундаментальності" і "небезпечності" подібної технології насправді не витримує жодної критики. До того ж це, як пише Форт, знеохочує деякі організації шукати різні способи IT-захисту замість концентрування на одному розпіареному продукті.

Можливі проблеми Mythos

Оскільки ми досі нічого не знаємо про реальні можливості Mythos, нам не вистачає впевненості в кількості його правильних і хибних висновків. Скільки відсотків контенту він помилково маркує як вразливість, а скільки, зрештою, помилок створює самостійно, коли знаходить експлойт? Спеціалісти по кібербезпеці з Університету Торонто і Гарварду відповідно, Девід Лі та Брюс Шнаєр в колонці як раз ставлять питання про наступні проблеми чат-бота в умовах обмеженого знання про нього.

По-перше, галюцинації та баги відповідей бувають у будь-якому ШІ-детекторі вразливостей коду. Часто це призводить до придумування вразливостей у вже корегованому, виправленому коді. Якщо Mythos допускає неякісні відповіді, тоді його статус точності в рази зменшується і було б добре, якби про це повідомили чесно перед публікацією шокуючих заяв про революційну технологію. І з цього випливає, що Anthropic надала нерепрезентативну інформацію, за якою не слід поки що робити серйозних висновків.

По-друге, Mythos був тренований, імовірно, на відкритих даних і програмах із сайтів на кшталт GitHub. Це значить, що він може набагато гірше орієнтуватися в пошуках вразливостей у старих, секретних і складних програмних системах. Наприклад, такими програмами дослідники називають фінансову інфраструктуру, медичне обладнання, банківське забезпечення тощо. Але, на їхню думку, в разі знайдення потрібного спеціаліста описаних систем, Mythos може бути використаний як додатковий посилювач потужності хакерських атак. Тому це створює безпекові ризики для цих платформ.

Постає також і етичне питання. Чому Anthropic вирішила обмежити світ від настільки потужної технології захисту і нападу, але водночас надати її своїм комерційним партнерам? Невже в їхніх руках технологія набагато безпечніша, ніж при суспільному або державному регулюванні?

Хоча, здається, такі стурбованості скоро вже не стосуватимуться однієї Anthropic. Згаданий нами Станіслав Форт продемонстрував, що технологія не є унікальною. Трохи пізніше це практично може довести OpenAI. За словами джерел Axios, компанія майже завершила свою нову кібербезпекову ШІ-модель. Вона так само "дуже небезпечна", тому її будуть впроваджувати обмеженим шляхом, аналогічно до Mythos. Спершу нададуть друзям-корпораціям, а потім невідомо, чи випустять на загальний ринок.

Можливо, Anthropic самі того не очікуючи запустили нову тенденцію у просторі ШІ-кібербезпеки. Називати певні моделі "занадто ризикованими для публіки", аби продати їх ексклюзивно для великих комерційних партнерів і з метою забезпечити собі зростання медійного капіталу.

Банер
Банер
Банер
Банер

вугілля і дрова

Банер
Банер
Банер
Банер
Банер
Банер
Банер
Банер
Банер