Интеллектуальный анализ литературных произведений

18 Июл 2016 статья

Интеллектуальный анализ литературных произведений обнаружил шесть основных эмоциональных арок в создании историй.

Ученые из Вычислительной сюжетной лаборатории выделили шесть эмоциональных арок, на основе которых строятся сюжеты.

В 1995 году Курт Воннегут прочитал лекцию, в которой изложил свою теорию о формах историй. В ходе лекции он схематично изобразил несколько сюжетов мелом на грифельной доске. «Ничто не мешает нам ввести простейшие формы в компьютер, — сказал он. — Это прекрасные формы».

Выступление Курта Воннегута


Воннегут представил в наглядном виде идею, которую другие писатели исследовали на протяжении столетий — он показал, что в своем развитии истории следуют за определенными эмоциональными арками, что эти арки имеют разную форму, и что одни формы лучше подходят для создания повествований, чем другие.

В своей лекции Воннегут упомянул несколько арок. Среди них были простые (человек падает в яму, человек выбирается из ямы) и более сложные (парень встречает девушку, парень теряет девушку, парень получает девушку).

Воннегут не был одинок в своих попытках подразделить рассказы по типам, хотя он стал, пожалуй, первым, кто выбрал для этого наглядную графическую форму. Еще две тысячи лет назад этим занимался Аристотель, а по его стопам следовали многие другие.

Однако споры относительно количества эмоциональных переходов, участвующих в создании истории, а также относительно рисунка этих арок еще очень далеки от завершения. По разным версиям предлагается выделять от трех до тридцати основных сюжетных схем. Однако научных подтверждений, которые дали бы преимущество одной версии перед другой, до сих пор не существовало.

emotional-arcs-in-stories.png

Метод анализа эмоциональной окраски высказываний

Сегодня положение изменилось благодаря исследованию Эндрю Рейгана и его коллег из Вычислительной сюжетной лаборатории Вермонтского университета в Берлингтоне. Применив метод анализа эмоциональной окраски высказываний, они составили схемы арок более 1700 произведений, а затем, обратившись к методам интеллектуального анализа, смогли определить, какие виды арок наиболее распространены. «Мы обнаружили шесть основных траекторий движения сюжета, которые служат своего рода строительным материалом для более сложных нарративов», — говорят они.

Их метод довольно прост. Суть анализа эмоциональной окраски высказываний заключается в том, что слова имеют положительный или отрицательный импульс. Таким образом, они могут служить мерой эмоциональной заряженности текста и изменения этой заряженности от одного момента к другому. Для того, чтобы определить рисунок сюжетной арки, нужно просто взвесить эмоциональную направленность истории в каждый выбранный момент и проследить за тем, как она изменяется.

Рейган и его коллеги сделали это, подвергнув анализу направленность «словесных окон» и пропуская эти окна через текст, чтобы получить картину изменения его эмоциональной заряженности. Они проанализировали таким образом более 1700 литературных произведений на английском языке, отобрав для исследования тексты, скачанные с сайта ProjectGutenberg более 150 раз.

Наконец, они обратились к методике интеллектуального анализа данных, чтобы выделить отдельные эмоциональные арки, сплетающиеся в одном повествовании.

Результат получился интересным. По словам Рейгана и его коллег, все результаты интеллектуального анализа данных указывают на существование шести основных эмоциональных арок, своего рода строительных блоков, из которых складываются более сложные истории. Они также смогли определить, какие рассказы ярче всего передают особенности той или иной арки.

Шесть основных эмоциональных арок

  • Непрерывное равномерное движение эмоциональной заряженности к подъему — истории типа «из бедности в богатство» или «Приключений Алисы в Стране чудес» Льюиса Кэрролла.

  • Непрерывное равномерное движение эмоциональной заряженности к падению — как в трагедии «Ромео и Джульетта».

  • Падение, затем подъем — сюжет о человеке, упавшем в яму, который привел в пример Воннегут.

  • Подъем, затем падение — как в греческом мифе об Икаре.

  • Подъем-падение-подъем — как в сказке о Золушке.

  • Падение-подъем-падение — как в мифе об Эдипе.

Наконец, команда изучила соотношение между формой эмоциональной арки и количеством скачиваний произведения, чтобы определить, какие типы арок пользуются наибольшей популярностью. Как выяснилось, наиболее популярны рассказы, развивающиеся по схеме мифов об Икаре и Эдипе, а также с более сложными арками, где основные сюжетные элементы используются в определенной последовательности. В особенности, по словам команды, популярны рассказы, в которых последовательно повторяется арка «человек в яме», а также Золушки с последующей трагедией.

Конечно, во множестве книг сюжетные арки сложнее и отличаются большим количеством тонких деталей. Методы Рейгана и его коллег не отражают изменений эмоциональной полярности, происходящих, например, на уровне параграфа. Однако они позволяют увидеть эмоциональные переходы, на которых строится рассказ, в перспективе. Ознакомиться с их версией сюжетных арок можно здесь.

Это любопытное исследование впервые дает эмпирическое подтверждение существования основных сюжетных арок. Кроме того, оно позволяет нам получить важный инсайт о природе рассказов и о причинах их привлекательности для человека.

Она также дает простор для выполнения более амбициозных задач. Рейган и коллеги рассматривали в основном художественные произведения на английском. Было бы интересно изучить, как отличаются эмоциональные арки в разных языках и культурах и как они изменяются со временем, а также сравнить их в художественных и фактографических произведениях.

Воннегут изложил теорию о формах историй в своей кандидатской диссертации по антропологии, которую писал в Чикагском университете. Его работа была решительно отвергнута — по словам Воннегута, «потому что все это выглядело слишком просто и весело». Сегодня он, пожалуй, усмехнулся бы, но вряд ли удивился.

Ref: arxiv.org/abs/1606.07772: The Emotional Arcs of Stories Are Dominated by Six Basic Shapes
Оригинал текста >>>