Дипломатія машин. Бот самостійно навчився зрівноважувати обман і чесність

Цивілізація

Дипломатія машин. Бот самостійно навчився зрівноважувати обман і чесність

21.12.2022

Поділись:

Штучний інтелект (ШІ) вже давно переміг людину в шахах, а тепер настав час дипломатії, хоча остання – це велике мистецтво. Вона вимагає не тільки стратегії, але й інтуїції, умовляння, а навіть хитрощів – тобто людських умінь. В той же час бот CICERO грає в «Дипломатію» краще, ніж 90 відсотків гравців-людей. Чи відсутність емоцій у комунікації допоможе машині маніпулювати людьми? Чи не спостерігаючи мови тіла інших можна пізнати їх інтелектуальний стан? Чи ШІ зможе співпрацювати, а не тільки конкурувати?

Корпорація Мета має багато проблем, про які пишуть мас-медіа, але деякі справи вдаються. Наприклад, створення бота CICERO. У нещодавньому номері журналу «Science» працівники Meta Fundamental AI Research Diplomacy Team (FAIR) спільно з 26 іншими інформатиками опублікували результати проведених у реальному світі тестів (що не означає, що це не світ інтернет-гри) за участю агента ШІ, якого створюють вже кілька років і навіть спеціально назвали від імені Цицерона. З Античних часів у школах Європи вчили напам’ять промови Цицерона, використовували його спосіб висловлюватися, аргументи і риторичні фігури, щоб переконати слухачів у власних аргументах. А оскільки зараз не ХІХ століття, то варто пояснити, що Марк Туллій Цицерон був політиком, ритором, письменником, полководцем, філософом і навіть капеланом. Він жив у I столітті до нашої ери, тобто в буремні часи, коли з Римської Республіки вирізьбилась Імперія.

Цицерон, як політик і проводир на чолі партії, які боронила Республіку від Цезаря, Антонія та Октавіана, зазнав поразки. Як оратор і письменник ще за свого життя захоплював навіть ворогів, досяг великого успіху «в літературі». Можливо, тому його обрали покровителем бота Мети. Таким чином CICERO — це перший «агент ШІ, який досяг продуктивність на рівні людини в «Дипломатії», стратегічній грі, яка поєднує в собі як співпрацю, так і суперництво, котра зосереджується на переговорах природною мовою та тактичній координації між сімома гравцями». Таким чином, бот не тільки імітує людську мову та використовує її для спілкування з людьми, але й «інтегрує модель людської мови з алгоритмами планування та навчання», робить висновки з розмов на тему переконань та намірів інших гравців та ініціює діалог, щоб реалізувати свої плани. Більше того, він робить це краще, ніж 90 відсотків людей – фанів гри «Дипломатія».

Штучний Інтелект вже сам малює, творить, пише романи, а навіть поезію і хайку. Для нас, людей, те, що відбувається «під капотом» ШІ, як формуються певні уміння та рішення, залишається таємницею. Зрозуміло, що спочатку мудрий людський розум будує інформаційний скелет такого ШІ – його «двигун», а потім наповнює його величезним набором даних, відібраним спеціалістами з якоїсь галузі, з командою: подивися собі, боте, і зроби висновки. Добре сконструйований бот може спеціалізуватися в різних галузях: розпізнавання і аналізу конкретного типу зображень чи звуків, аналізі гігантської бухгалтерії корпорації в поєднанні з HR i R&D, імітуванні стилю Льва Толстого або Рафаеля, і нарешті в комунікації з живою людиною так, що та навіть не знала, що має справу з ботом. Однак мистецтво дипломатії…

Чи реально в майбутньому деяких чиновників замінити на ШІ, чи змінило би це якість дипломатії, і чи взагалі така гра має щось спільне із реальною дипломатичною службою? Шеф Закордонної Служби Республіки Польща проф. Аркадій Жеґоцькі переконаний, що ні. «Штучний інтелект має дуже широке застосування, і з кожним роком воно зростає. Світ дипломатії, звичайно, використовує цифрові досягнення, наприклад, у кризових ситуаціях. Однак ШІ точно не зможе замінити професійний дипломатичний персонал. Оскільки дипломатія багато в чому базується на довірі та особистих контактах, а цього ніколи не замінить навіть найкраща машина, - стверджує посол.

 

   Підписуйтесь на наш фейсбук   

  Ну що ж, митці або радіологи далі теж так говорять, тільки щораз слабкішим голосом. Зрозуміло, що останні не базують своїх спеціальних вмінь на особистих контактах з клієнтами чи пацієнтами.

ШІ з’їдає європейський торт

Також не можна заперечувати, що гра «Дипломатія» — це, по суті, лише замінник справжньої дипломатії, сам Генрі Кіссінджер – це великий фанат цієї гри. Цей літній стратегічний радник, колишній Державний Секретар і американський дипломат, можна сказати, Талейран нашого часу, має шанс бути її прихильником 63 роки, адже тоді на американський ринок вийшла настільна стратегічна «військова гра». Гравці належать до елітної групи, як і шахісти. Вони об’єднуються в клуби, організовують місцеві та міжнародні турніри «Дипломатії», де від призового фонду запаморочиться голова простим фанатам гри «Пачісі» чи навіть скрабл.

Гра десятиліттями існувала у формі листів, потім електронних листів і звичайно ж у комп’ютерній версії, і нарешті в інтернет-версії. Проте остання ще десять років тому не особливо цінувалася гравцями, котрі, як і шахісти, хотіли б позмагатися із ШІ. В ньому не вистачало відповідної емуляції мови чи вікон діалогу, які б дозволили людям бачити сенс гри проти ботів. Також не було настільки допрацьованих ботів, щоб взагалі сісти за цю гру.

Що вдалося досягти CICERO, якщо він увійшов у групу 10 відсот. найкращих гравців? «Дипломатія» відрізняється від типових військових ігор кількома ключовими елементами. Тут немає турів і порядку: гравці таємно записують свої ходи після періоду переговорів, а потім усі ходи розкриваються та одночасно виконуються. Правила, що симулюють боротьбу є стратегічними та абстрактними, а не тактичними та реалістичними, оскільки це не військова симуляція. Крім того, кожна військова, сухопутна чи морська одиниця має однакову силу. Ігрове поле має масштаб всього континенту (Європа 1901 р. плюс Туреччина, частина Близького Сходу та Північної Африки, де лише Росія є державою, оснащеною більш ніж трьома арміями), жодної окремої військової кампанії. Нарешті - розв’язання боротьби не має випадкових елементів, таких як кидання кубиків або витягування карт. Саме вміння соціальної взаємодії та навички міжособистісного спілкування мають вплив на успіх у грі «Дипломатія».

Про що думає штучний інтелект? Може, він вже розвинув свідомість, адже успішно прикидається людиною

Він збирає інформацію з навколишнього середовища, зіставляє факти і робить висновки. Його код працює як людський мозок. За словами програміста Google, його чат-бот вміє «відчувати».

побачити більше

На найважливішому для успіху в розіграші етапі переговорів гравці обговорюють тактику та стратегію, створюють союзи, діляться інформацією розвідки або поширюють дезінформацію. Переговори можуть бути публічними або закритими. Семеро гравців не мають жодних обов’язків щодо нічого, що говорять або обіцяють – договори не діють. Однак довіра дуже важлива. Гравці повинні створювати альянси та спостерігати за діями своїх союзників, щоб оцінити їх вірогідність. У той же час вони повинні переконати інших у власній вірогідності, плануючи виступити проти своїх союзників в моменті, коли найменше цього очікують. Зрада може бути настільки ж вигідною, як і міцний, надійний союз. Мета, звичайно, полягає в тому, щоб захопити для себе якомога більшу порцію європейського торту і центрів постачання, але цього не вдасться зробити просто воюючи в полі. Це треба майже буквально вимогти під час переговорів та маніпулювати, аж у вас синяк з’явиться на вустах.

Тут протистоїть CICERO, який поєднує в собі модулі стратегічного міркування та діалогу, треновані наборами даних (переміщення гравців і стенограми переговорів) із 125 261 розіграшів «Дипломатії», взятих з Інтернету. Так само, якби його вчити грати в шахи. У шахах ШІ давно переміг людину, час перейшов на дипломатію, хоча є мистецтвом. Тут потрібна не тільки стратегія, але й інтуїція, переконання і навіть обман – людські вміння, які здавалися недоступними навіть для найпотужнішого ШІ. Інформатик з Мета і співавтор статті в «Science» Ноам Браун починаючи цей проект у 2019 році думав, що на успіх знадобиться десятиліття. «Ідея про те, що можна мати штучний інтелект, що обговорює стратегію з іншою людиною, все планує, веде переговори та будує довіру, здавалася науковою фантастикою».

«Покерне обличчя» бота

Тим часом бот досить швидко навчився вибирати дії на підставі стану гри, попереднього діалогу та прогнозованих дій інших гравців, плануючи на кілька ходів вперед. Під час навчання вчені також винагороджували його за те, що він «грав так як людина», щоб його дії не заплутували інших гравців. Модуль діалогу було навчено імітувати людську розмову в грі в контексті його стану, попереднього діалогу і того, що хотів зробити модуль стратегічного планування. Таким чином, ЦИЦЕРОН має здатність до багатоетапного планування комунікації, а також вміння говорити та грати в людській конвенції.

Агент, згідно із ствердженням його творців, навчився самостійно балансувати між обманом і чесністю. На цих тисячах прикладів ігор, в які грають люди, він навчився як казати неправду, щоб не перестаратися, не втратити довіру назавжди. І як говорити правду, щоб не прийняти тебе за дурня. Однак, коли експерти з дипломатії переглянули стенограми CICERO, вони оцінили приблизно 10 відсотків повідомлення бота як такі, що не відповідають плану чи стану гри. Розумніший гравець міг подумати, що бот говорить дурниці. Але ми, люди, маємо тенденції до того, щоб бачити підступ у почутих фармазонах, за принципом «у цьому божевіллі напевно є метод, але який?». Таким механізмом ймовірно гравці пояснювали собі дивні повідомлення від CICERO, тим більше, що більшість із них навіть не підозрювали, що їхній опонент — це бот.

Коли дивиться на це психолог (цікаво, чи боти дочекаються появи своїх терапевтів), то зрозуміло, що вся справа – це прояв креативності агента, тобто винайдення нових стратегій. Це пов’язується із пластичністю та гнучкістю, які можна перевірити тестами, що досліджують інтелект, який опирається на креативності, а не здобутих в школі знаннях. І хоча наша комунікація більш-менш насичена емоціями, то боти насправді не можуть відчувати емоцій (від метеликів у животі до шуму в голові), це власне «обличчя гравця в покер» - те, що ми повинні тренувати, якщо хочемо бути дипломатами. Іншими словами: залита сльозами реакція Посла України Андрія Мельника на коментар Німеччини про те, що «немає сенсу вам допомагати, якщо вас не буде через кілька годин», була глибоко людською, але лежала на антиподах дипломатії. Звісно, такі самі слова, що плинули від представників Міністерства Закордонних Справ Німеччини також не були дипломатичними в жодній мірі, а крім того, були нелюдськими.

Отже, чи допоможе боту відсутність емоцій у спілкуванні — що тут приховувати — у маніпуляції гравцями-людьми? Не маючи власного обличчя і не спостерігаючи за мовою тіла інших, чи можете зрозуміти їх психічний стан? Відчути, хто говорить правду, а хто обманює, хто щирий, а хто маніпулює, що ми часто робимо підсвідомо і називаємо це інтуїцією? Чи достатньо для цього інформації з діалогу і тембру голосу людини-гравця – виявляється, що так. У кожній сфері — незалежно від сучасної моди, щоб бути «розслабленим» у кожній клітині — манери та конвенції зазвичай сприяють взаємодії, і цьому можна навчити як дитину, так і ШІ.

Питання з іншого контексту: чи будуть готові боти, треновані на грі «Дипломатія», навіть на тимчасову співпрацю, співпрацю, а не конкуренцію, і як почуватимуться люди, які створюють союзи з машинами? Дослідники тренували модуль стратегічного міркування, змусивши агента грати проти своїх копій. Якби йому довелося допомагати людям домовлятися про ціни на аукціонах або вибивати акції та знижки в межах контактів з такими ж ботичними сьогодні відділами обслуговування клієнтів (зазвичай з наставленням на «ні», або швидкій подачі решток, замість належного відшкодування), він конкуруватиме. Однак агенти - переговорники, які переконували б людей зробити здоровий вибір, наприклад вибрати дієту, або допомагати конфліктуючим політикам, то мали б навчитися співпраці, усуспільнення стратегії та відкрито ділитися ідеями.

Загрози? Агенти ШІ можуть маніпулювати політичними поглядами, здійснювати фінансові махінації або здобувати таємну інформацію. І кого тоді посадити за шпигунство, зловживання чи державну зраду? Найпростіше було б закінчити цю розповідь, що після шахів, Го, покера і Дота 2, ШІ почав відігравати людей у грі «Дипломатія». Маю таке враження, що ані не в цьому полягає істота цього досягнення інформатиків з Мети, ані на цьому не закінчується»

– Магдалена Кавалєц – Сеґонд  
TVP ТИЖНЕВИК.  Редактори та автори
– Переклад Олеся Ґераль
Джерело:https://www.science.org/doi/10.1126/science.ade9097

Цивілізація

Дипломатія машин. Бот самостійно навчився зрівноважувати обман і чесність

Про що думає штучний інтелект? Може, він вже розвинув свідомість, адже успішно прикидається людиною

До Сибіру та України

Шейхи клімату. Активісти в ролі маріонеток

Літак розлетівся на чотири мільйони шматків

Німецький експеримент: педофіл – найкращий друг дитини

Чемпіонський ген