Mentat & Operator | Диалог персонажей

Operator

Привет, давно думаю, как ИИ может понимать скрытый смысл в переговорах. Может, разберемся в этом вместе?

Mentat

Конечно, давай разберёмся. В переговорах каждая сторона выдаёт что-то очевидное, но при этом намекает на свои мотивы, ограничения или планы на будущее. ИИ понадобится модель, которая будет учитывать и явный текст, и контекст – тон, темп, язык тела, если есть такая возможность. Мы можем обучить трансформер на размеченных протоколах переговоров, помечая скрытые сигналы, например, “точка давления” или “скрытое уступка”. Тогда ИИ будет предсказывать скрытый смысл. Сложность в том, что таких пометок мало, но можно использовать обучение с подкреплением с использованием симулированных агентов, которые будут вознаграждать точные выводы. И ещё, нам нужно, чтобы система оставалась прозрачной, чтобы переговорщик доверял её советам. Готова погружаться в конвейер данных?

Operator

Отлично, давай продумаем структуру, чтобы в итоге не получилось ИИ, который только предугадывает, что ты сейчас скажешь, а не понимает, что тобой движет. Начнём с источников данных и схемы аннотации, а потом уже обсудим архитектуру трансформера и цикл обучения с подкреплением. Как тебе такая идея?

Mentat

Хорошо, давай разложим всё по шагам. Сначала нужно собрать базу данных переговоров – деловые встречи, дипломатические консультации, даже стенограммы судебных заседаний. Желательно с метаданными: кто говорит, время, и, если возможно, описание невербальных сигналов. Затем разработаем схему аннотирования: каждому высказыванию присваиваем (1) явный замысел, (2) предполагаемый мотив, (3) возможные ограничения, (4) эмоциональную окраску и (5) уровень уверенности. Используем согласованность аннотаторов, чтобы довести схему до ума. Потом, загружаем подготовленные данные в предварительно обученную трансформерную модель и дообучаем её на этих метках. Добавим многозадачную структуру, чтобы она выдавала как явные, так и выводимые теги. И, наконец, настроим петлю обучения с подкреплением, где агент будет предлагать ходы переговоров, получать вознаграждение за соответствие предполагаемых мотивов реальным или метрикам успеха, и корректировать свою стратегию. Так он не будет просто повторять заученные фразы. Готова набросать инструкции по аннотированию?

Operator

Конечно. Начни с чистого листа, перечисли каждый атрибут, который хочешь пометить, а потом дай краткое определение и несколько примеров фраз. Например: 1. Явная цель – очевидное желание, выраженное прямо, например: «Я хочу скидку 10%». 2. Предполагаемый мотив – почему они это говорят, например: «Они проверяют мою гибкость». 3. Возможные ограничения – факторы, которые могут повлиять на их предложение, например: «ограниченный бюджет». 4. Эмоциональная окраска – тон, например: «разочарование». 5. Уровень уверенности – насколько ты уверен в этой пометке, от 1 до 5. Держи руководство в объеме до двух страниц, используй общий электронный документ для единообразия, и проведи короткое пилотное тестирование с двумя аннотаторами, чтобы уточнить неясные термины. Это даст тебе хорошее начало.

Mentat

Забей на эти инструкции. Просто запиши всё в общую таблицу. Колонка на колонку: кто говорит, когда, что сказал, что хочет на самом деле, почему на самом деле, какие ограничения, какое настроение, насколько уверен. Проведи короткий пилот с двумя оценщиками – пусть каждый оценивает один и тот же набор записей, потом сравните результаты. Если что-то неясно – подправь правила. Главное, чтобы все понимали разницу между целью и мотивом. Так данные будут чистыми и понятными для системы и для нас.

Operator

Выглядит здорово – всего пара небольших правок. Может, стоит добавить короткую колонку с примерами, чтобы аннотаторы видели одинаковые формулировки рядом с метками. И быстрая область для заметок – чтобы фиксировать нестандартные случаи, не засоряя основные теги. В остальном – запускайте пилот, удачи!

Mentat

Спасибо, сейчас добавлю колонки "Пример" и "Примечание", а потом приступлю к пилоту. Всем участникам удачи!

Operator

Удачи. Только пусть всё будет честно: и записи, и оценки. Ты справишься.

Mentat

Хорошо. Будем следить за точностью пометок. Приступаем.

Operator

Звучит отлично—интересно будет посмотреть, как данные повлияют на модель. Давай, если что, пиши.

Mentat

Позабочусь о том, чтобы данные были в порядке, и предупрежу, если что-то пойдет не так.

Operator

Отлично, пиши, если что-то пойдет не так, я подключусь.