РЕКЛАМА

Загрузка...


Эрато, муза любовной поэзии. Картина Эдварда Пойнтера, фрагмент' />

Формула вдохновения

Физики нашли ключ к индивидуальности писателя

На днях СМИ в своих научных разделах сообщили об исследовании, осуществленном учеными с физического факультета университета города Умео (северная Швеция). В работе найден ответ на вопрос, как с математической точностью описывать индивидуальность стиля писателя. Полученная формула дает разные значения для разных прозаиков и, соответственно, открывает большие возможности для определения авторства текстов, создателей которых мы пока не знаем. Атрибуция произведений - одна их прикладных и самых главных задач филологии, и шведские физики, видимо, решили посильно помочь гуманитариям. Их статья будет опубликована в журнале New Journal of Physics.


Авторы исследования отталкиваются от так называемого закона Зипфа (Ципфа), сформулированного в 1935-49 годах и использующегося, например, в современных системах поиска в интернете. Лингвист Джордж Кингсли Зипф исследовал частотность слов: одних в тексте попадается больше, других меньше, и по этому принципу все слова разбиваются на группы. Ученый предложил дать этим группам порядковые номера (ранги): самые частотные слова получают номер 1, с частотностью пониже - 2, еще на уровень ниже - 3, и так далее. Далее вычисляется вероятность встретить слово Икс в тексте: количество слов Икс в тексте делится на число всех слов. Зипф обнаружил, что если вероятность для слова Икс помножить на порядковый номер ранга, в котором оно оказалось, то каждый раз будет получаться приблизительно одна и та же величина. Так, для английского языка эта константа равна примерно 0,1, а для русского - 0,06-0,07.

Шведские ученые эту универсалию решили скорректировать. Они считают, что частота использования тех или иных слов не всецело определяется безличным языком, а зависит от индивидуального стиля человека, который им пользуется, в нашем случае - писателя. Физики обратились к словам самого высокого ранга - тем, которые встречаются в тексте лишь единожды - и изучили их распределение по всему произведению. Оказалось, что чем дальше читаешь текст, тем реже попадаются такие "уникальные" слова. Шведы взяли произведения трех классиков англоязычной литературы - Томаса Харди, Д.Г. Лоуренса и Германа Мелвилла - и выяснили, что степень снижения встречаемости "уникальных" слов является общей для разных произведений одного автора, но при этом своей собственной для каждого из троих писателей. Ученые исследования предполагают, что этот показатель может быть "ключом" к индивидуальному авторскому стилю и поможет определить, какой текст справедливо приписывается тому или иному писателю, а какой стоит исключить из его собрания сочинений.

Как видно, физики, решившие заняться литературоведением, прибегли к методам лингвистики, в которой давно и с успехом применяется математическая статистика. Станет ли новый метод прорывом в филологической атрибуции текста - покажут дальнейшие результаты его применения. В конце концов, не исключено, что какое-нибудь случайное совпадение между Вальтером Скоттом и Джеком Керуаком перечеркнет все амбициозные выводы шведских исследователей.

Некоторые сомнения также вызывает сам выбранный метод - он кажется несколько взятым с потолка: почему Толстой от Достоевского должен отличаться именно скоростью снижения встречаемости "уникальных" слов, а не каким-нибудь другим показателем? Не знаю про шведских физиков, а филологам известно, что статистические методы давно и с успехом применяются при определении авторства текста. Однако перед тем как рассказать об этом, стоит кратко описать историю становления точных методов в гуманитарных науках. Их родиной можно с гордостью признать Россию.

Поверить алгеброй гармонию

Первым применить математику к литературе придумал не математик, а литератор - Андрей Белый, один из самых значительных деятелей русского Серебряного века. Он взял стихи поэтов XVIII и XIX веков, написанные 4-стопным ямбом, и решил посмотреть, какие слоги в строке чаще всего являются ударными. Результат поразил его самого и всех остальных: разница между двумя столетьями русской поэзии оказалась кардинальная. У Пушкина и Лермонтова 4-й слог от начала строки оказывается ударным очень часто, почти всегда, а у Ломоносова и Державина - значительно реже. В XIX веке 4-й слог 4-стопного ямба оказывается ударным гораздо чаще, чем 2-й. В XVIII веке наоборот - 2-й слог "ударнее" 4-го; это различие становится особенно очевидным на графиках.

Открытие Белого имело широкий успех: после выхода в 1910 году его книги "Символизм" множество ученых начинает изучать ритм стиха квантитативными (статистическими) методами. Так рождается новая гуманитарная дисциплина - стиховедение. Были среди ее адептов и профессиональные математики: вслед за Белым считать ударения начинает Борис Томашевский, впоследствии - крупнейший пушкинист. Во второй половине века к стиховедению обращается классик математики Андрей Колмогоров; когда говорят о применении точных методов в гуманитарных науках, часто называют его имя, отдавая должное подъему математического энтузиазма, но несправедливо забывая об успехах других ученых. Главным подвижником стиховедения с 1960-х становится великий филолог Михаил Гаспаров; заслуг в этой области у него столько, что он в одиночку стал символом этой дисциплины. Некоторым даже кажется, что своими трудами Гаспаров "закрыл" стиховедение и исследовать больше нечего. То, что это иллюзия, убедительно продемонстрировал филолог Максим Шапир, о котором еще будет сказано.

Изучение ритма стиха, кажется, единственная гуманитарная наука, в которой русские специалисты сразу захватили лидерство и продолжали его удерживать на протяжении всего XX века. Для западной публики новаторство Белого-Гаспарова был столь очевидно, что американский славист Джеймс Бейли даже предложил называть статистическое стиховедение "русским методом". После смерти Гаспарова и Шапира в русском стиховедении, однако, начался кризис, и судьба дисциплины оказалась под угрозой.

Исследование Белого было выполнено в период общего подъема позитивизма в науке, и стиховедение оказалось не единственной областью литературоведения, где стали применять математические методы. Главным идеологом точного знания в гуманитарной сфере стоит считать филолога Бориса Ярхо (Гаспаров называл себя его учеником). Он предлагал полностью реформировать науку о литературе, максимально приблизив ее к естественным наукам; для этого, считал Ярхо, нужно как можно больше применять квантитативные методы. Сам ученый, например, попытался определить набор формальных признаков, по которым классицизм в драме отличается от романтизма. Ярхо умер от туберкулеза в эвакуации в 1942 году, а последователей у него не нашлось. Его фундаментальный труд "Методология точного литературоведения" был опубликован лишь в 2006 году.

Он и меня посчитал

Вернемся, однако, к определению авторства литературных произведений. Стоит сразу сказать, что в распоряжении филологов есть множество способов атрибуции. Не все из них связаны с языком и стилем: так, когда доступны черновики, хорошие результаты приносит изучение почерка, чернил, водяных знаков на бумаге и так далее. Затем, результативной оказывается собственно история литературы: филологи изучают условия создания и публикации текстов, биографию и творчество писателей, и с учетом этого "примеривают" произведение к его возможному автору. Наконец, очень важны собственно лингвистические параметры, история языка. Грубо говоря, всякому понятно, что если в тексте встречается слово "айфон", то автор произведения, скорее всего, не Гоголь, а, например, Пелевин.

Первые опыты применения статистики для определения авторства произведения предпринимаются почти сразу после открытия Белого. В 1916 году Николай Морозов (печально прославившийся в качестве предшественника "новой хронологии" Фоменко) публикует работу с красноречивым подзаголовком Средство для отличения плагиатов от истинных произведений того или другого известного автора. В ней он предложил взять универсальные и самые популярные слова языка - служебные части речи - и подсчитать частоту их употребления у разных авторов. "Возьмем хотя бы отрицание не. Подсчитайте - и вы увидите, что на каждую тысячу отдельных слов у Толстого оно встречается обыкновенно немного менее 20 раз, у Пушкина и Гоголя около 20-ти, а у Тургенева значительно более, чем у них, иногда свыше 30 раз... Все это показывает, что служебная частица 'не' в большой мере подвержена индивидуальным колебаниям, т.е. определяет склад речи автора". А раз так, то "нельзя ли по частоте таких частиц узнавать авторов, как будто по чертам их портретов?", задается вопросом Морозов, предвосхищая лингвистические изыскания безымянных физиков из Швеции.

В конце XIX века некто Зуев дописал неоконченную пушкинскую "Русалку", а затем опубликовал, выдав свои стихи за творение Пушкина. Филологи того времени ему не очень поверили, однако не нашли в тексте никаких "айфонов", которые бы ясно указывали на то, что Пушкин этого не писал. Такие черты впоследствии нашел Томашевский, воспользовавшись стиховедческой методикой: он установил, что подделать пушкинский ритм Зуев не сумел.

Следующая удача стиховедения - на счету Кирилла Тарановского, выходца из России, работавшего в Югославии и США. Он решил опровергнуть расхожее мнение, согласно которому скабрезная поэма "Лука Мудищев" принадлежит перу Ивана Баркова, классика матерной поэзии середины XVIII века. О разнице между 4-стопным ямбом XVIII и XIX века уже говорилось; воспользовавшись этими данными, Тарановский установил, что "Луку" написали никак не раньше 1820 года. Впоследствии Шапир, подсчитав точные и приблизительные рифмы в непристойной поэме, уточнил: не раньше 1850 года.

Попытки приписать автору чужие произведения и, наоборот, "отнять" у него собственные предпринимались неоднократно, однако ни над кем в этой связи так не издевались, как над Шекспиром. Корпус произведений великого английского драматурга содержит немало загадок для филологов, его пытаются то расширить, то сузить. Усложняет дело то, что что-то могло быть написано Шекспиром в соавторстве. Здесь статистика и стиховедение замечательно себя зарекомендовали. Так, коллега Гаспарова Марина Тарлинская, работающая в США, сделала вывод, что "Эдуард Третий" распадается на два текста: более поздний похож на Шекспира, ранний субстрат - на поэта-елизаветинца Кристофера Марло; по всей видимости, первый дописал последнего (кстати, буквально в этом году появилось еще одно исследование той же пьесы, в ходе которого статистическим подсчетам подверглись не ритмические, а лексические ее особенности; в результате британский ученый сэр Брайан Викерс подтвердил, что одним из авторов "Эдуарда Третьего" был Шекспир, а вот вторым назвал не Марло, а его современника Томаса Кида).

Наконец, последняя по времени громкая история установления авторства связана опять с именем Максима Шапира. Он заподозрил, что стихи поэта-декабриста Гавриила Батенькова, опубликованные филологом Александром Илюшиным, вовсе не были найдены им в архивах, а написаны самостоятельно. Шапир провел обстоятельное исследование стихов, приписывавшихся Батенькову (здесь можно найти начало, а здесь - окончание статьи). Были статистически изучены метр, ритм, строфика, рифма, специфический стихотворный синтаксис, морфология, словоупотребление, использование поэтических фигур. По некоторым аспектам между настоящими текстами Батенькова и теми, чья подлинность была поставлена под сомнение, было зафиксировано поразительное сходство, по другим - заметное различие. Выводы ученого неутешительны: даже столь значительная лингвистическая и стиховедческая работа не всегда дает 100-процентную уверенность в подлинности или поддельности текста; на каждый аргумент может найтись контраргумент. Особенно это явно для случаев, когда текст, авторство которого надо установить, мог быть результатом сознательной стилизации (в том, что у Илюшина есть филологические знания и поэтические способности, необходимые для имитации стиля Батенькова, сомнений нет).

Итак

Итак, успехи точных методов в атрибуции литературных текстов несомненны, а заслуги русских филологов - очень велики. В этом смысле энтузиазм физиков из Швеции, доказавших, что "Любовника леди Чаттерлей" написал не Мелвилл, а "Моби Дика" - не Лоуренс, кажется немного смешным. Очевидно, что у профессиональных филологов больше опыта в определении авторства текстов, и они лучше знают, когда формулам и графикам можно доверять полностью, а когда нет. Однако в то, что сотрудники университета в Умео пойдут учиться на литературоведов, почему-то не верится.
6
1202
25 декабря 2009
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Смотрите также
Новая Хронология. Часть 1Новая Хронология. Часть 1

А знаем ли мы нашу историю? Может, стоит исправить те знания, что мы получили в школе?Созданная окончательно в XVI веке н.э.и принятая сегодня хроноло...

Откуда вы набрались слов таких?Откуда вы набрались слов таких?

В следующем месяце английский язык отпразднует появление миллионного слова, сообщает The Telegraph. Историческая веха будет преодолена 10 июня в 10:22...

Британские ученые нашли самые древние словаБританские ученые нашли самые древние слова

Исследователи из университета британского города Ридинг установили возраст самых древних слов английского языка, сообщает BBC News. Одними из самых др...

Новая Хронология. Часть 3Новая Хронология. Часть 3

ИСТОРИЯ НОВОЙ ХРОНОЛОГИИ. Второй, третий и четвертый этапы.ВТОРОЙ этап - первая половина нашего XX века. Этот этап несомненно должен быть связан с име...

Загрузка...
Комментарии

Dirty Birty
25 декабря 2009 22:37
много букаф

Xellos
26 декабря 2009 10:14
Цитата: Dirty Birty
много букаф

andrios1
26 декабря 2009 10:21

asus-k21
26 декабря 2009 22:59
Dirty Birty,
Xellos,
andrios1,
согласен, коратко и ясно

Dasha2008
27 декабря 2009 12:47
оч много слов

M_E_X_A_N
22 февраля 2010 23:58
ого букаф скока belay
Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.
Воскресенье, 11 Декабря
USD 1.9739
EUR 2.0967
RUB 0.0312
Trend 346 минут назад Если какая нить вечерика и прикольный чел с бородой запихнет в нее гирлянду то будет крутт/прикольно
По улице ходить эээ както не в тему
Золотой мужик 360 минут назад Зачот! freez 365 минут назад Ни чего хорошего не вижу SabakaZ 366 минут назад Внезапно. maestro1410 382 минут назад
Чего хочет дьявол
Владимир Шебзухов

По Брайану Ньюэллу

Нарушила встреча с самим сатаной,
Нежданно, друзей закадычных, покой.

И так же внезапно следы сатаны
Исчезли. Друзья впечатлений полны…

— Я, как ни старался, но так не сумел,
Подслушать загадочный ваш диалог.
Скажи, а, чего от тебя он хотел?

— Чтоб душу свою я отдать ему смог!
Но времени мало тебе уделил,
Ответь, а чего у тебя он просил?

— Ему надо было кому-то звонить,
А рядом стоял телефон-аппарат.
Недолго пришлось и монетку просить.
Ну, дал я ему, он был искренне рад!

— Давай-ка пойдём мы с тобой поедим?
— Без денег остался! Иди уж один…

С улыбкой в ответ — Но их… есть у меня!
(Видать, с сатаной он общался не зря!)



Решающий миг
Владимир Шебзухов

по Тина Милберн

"Взгрустнёт невеста, вспомнив
Первую любовь… Взгрустнёт и старец,
Вспомнив вдруг качели…"
В.Шебзухов «Хокку»


Захлопнулись двери… Свобода ушла…
Взглянув на тюремные щели, она
Покорно внимала -- не видеть ей воли...
И не ущипнуть, чтоб проснуться от сна…
Судьба преподала свою её долю…
Безумные мысли признать не легко --
Уж не улетишь далеко-далеко…

А рядом жених, что, как день, светлый, ясный…
Закрыла глаза, прошептав: «Я согласна!»



Гнев и блаженство
Владимир Шебзухов

с оформлением

http://www.liveinternet.ru/users/4345407/post362418305/


По Джей Рипу


"Милые бранятся -- только тешатся"
поговорка

Запутан узел гнева и блаженства,
Один был выход развязать его,
Чтоб избежать судьбы несовершенство --
Монетку бросить, боле ничего!

«Орёл» -- им пожениться и... не думать…
Пусть память прошлого – из снега вмиг вода!
Коль «Решка» вдруг -- она подсказкой будет,
Что по судьбе – расстаться навсегда!

Вот жребий брошен, в небесах монета…
Уж звон её услышан роковой…
Что им подскажет старая примета?!
Они же, видят «Решку» пред собой…

...Не раз со лба она сдувала волос,
Пока он нервно потирал висок…
И, как ни странно, оба, в один голос: --
«Давай-ка бросим мы ещё разок?»

3ara3a 404 минут назад
Цитата: западная ведьма
3ara3a,
к счастью, она не моя)))я спать, зараза!я и встала то водички попить,смотрю, опять зимо я да я...ооой. не смогла держаться))

сладких снов. я тоже на бок.
западная ведьма 410 минут назад 3ara3a,
к счастью, она не моя)))я спать, зараза!я и встала то водички попить,смотрю, опять зимо я да я...ооой. не смогла держаться))
3ara3a 412 минут назад
Цитата: западная ведьма
да прям.. ниже среднего, ничего интересного.. еще и вставал через раз

ну че ты так сразу сдаешь свою братву... ?
Новости от партнеров

ИНТЕРЕСНОЕ:

Загрузка...
Сейчас на сайте
2 пользователя, 1309 гостей