Простейшим видом статистического подхода к изучению языка писателей или отдельных произведений является подсчет употребляемых слов, так как богатство словаря, видимо, должно определенным образом характеризовать и самого автора. Однако результаты подобных подсчетов дают несколько неожиданные в этом плане результаты и никак не способствуют эстетическому познанию и оценке литературного произведения, что не в последнюю очередь входит в число задач стилистики. Вот некоторые данные относительно общего количества слов, употребляемых в ряде произведений:
Библия (латинская). . . . . 5649 слов
Библия (древнееврейская). . 5642 слова
Демосфен (речи). . . . . . 4972 слова
Саллюстий. . . . . . . . . 3394 слова
Гораций. . . . . . . . . . 6084 слова
Данте (Божественная комедия) 5860 слов
(сюда входит 1615 имен собственных и географич. названий)
Тассо (Неистовый Орланд). . 8474 слова
Милтон. . . . . . . . . . .8000 слов (прибл. дан.)
Шекспир. . . . . . . . . .15000 слов
(приблизительно, по другим данным 20 000 слов)
О. Есперсен указывает, что словарь Золя, Киплинга и Джека Лондона значительно превышает словарь Милтона, т. е. число в 8000 [149] 69 О. Jеspersen. Die Sprache. Heidelberg, 1925, S. 105.
69. Подсчет словаря речей президента США В. Вилсона установил, что он богаче, чем у Шекспира. К этому следует добавить данные психологов. Так, Терман на основе наблюдений над большим количеством случаев установил, что словарь среднего ребенка составляет около 3600 слов, а в 14 лет — уже 9000. Средний взрослый употребляет 11700 слов, а человек «повышенной интеллигентности» до 13500 [150] 70 Tеrman. The Measurment of Intelligence, p. 226.
70. Таким образом, подобные числовые данные сами по себе не дают никаких оснований для выявления стилистических качеств произведений и только «объективно» кон<119>статируют употребление разного количества слов разными авторами, что, как показывают приведенные подсчеты, не связано с относительной художественной ценностью их произведений.
Несколько по-иному строятся подсчеты относительной частоты употребления слов у отдельных авторов. В этом случае учитывается не только общая сумма слов, но и частота употребления отдельных слов. Статистическая обработка полученного таким образом материала заключается в том, что слова с равной частотой употребления группируются по классам (или рангам), что приводит к установлению частотной дистрибуции всех употребляемых данным автором слов. Частным случаем такого рода подсчетов является определение относительной частотности специальных слов (например, романской лексики в произведениях Чосера, как это было сделано Мерсандом [151] 71 J. Mersand Chaucer's Romance Vocabulary. N. Y., 1935.
71). Относительная частотность употребляемых авторами слов содержит такие же объективные сведения о стиле отдельных авторов, как и вышеприведенные суммарные подсчеты, с той только разницей, что в результате получаются более точные числовые данные. Но она используется и для датировки отдельных произведений одного и того же автора на основе предварительно произведенного подсчета относительной частоты употребления им слов в разные периоды его жизни (по датированным самим автором произведениям). Другим видом использования данных подобных подсчетов является установление подлинности авторства произведений, относительно которых этот вопрос представляется сомнительным [152] 72 G. Herdan. Chaucer's autorship of «The Equatorie of the planetis». «Language», 1956, vol. 32, No. 2.
72. В этом последнем случае все строится на сравнении статистических формул частоты употребления в подлинных и спорных произведениях. Нет надобности говорить об очень большой относительности и приблизительности результатов, полученных такими методами. Ведь относительная частота употребления меняется не только с возрастом автора, но и в зависимости от жанра, сюжета, а также и исторической среды действия произведения (ср., например, «Хлеб» и «Петр I» А. Толстого). <120>
Углубляя вышеописанный метод, стилостатистика в качестве стилевой характеристики стала прибегать к критерию стабильности относительной частоты наиболее употребительных слов. Применяемый в данном случае метод можно проиллюстрировать статистической обработкой рассказа Пушкина «Капитанская дочка», произведенной Есселсоном и Эпштейном в Институте славянских языков при Детройтском университете (США) [153] 73 H. H. Yosselson. (Sect. V by W. Epstein). The Russian Word Count. А. С. Пушкин «Капитанская дочка». Detroit, 1953.
73. Обследованию был подвергнут весь текст рассказа (около 30000 случаев употребления слов), а затем отрывки, содержащие около 10000 и 5000 случаев употребления. Далее, с целью определения стабильности относительной частоты употребления слов, у 102 наиболее употребительных слов (с частотой от 1160 раз до 35) было произведено сравнение расчетной относительной частоты (сделанной на основе выборочных отрывков) с действительной. Например, союз «и» во всем рассказе употреблялся 1 160 раз. В отрывке, содержащем 5 000 случаев употреблений всех слов, следует ожидать, что этот союз будет использоваться 5 000 x 1 160: 30 000, или округло 193 раза, а в отрывке, содержащем 10 000 случаев употреблений всех слов, он предположительно используется 10 000 x 1 160: 30 000, или 386 раз. Сравнение полученных с помощью подобного рода расчетов данных с фактическими показывает очень незначительное отклонение (в пределах 5 %). На основе подобных расчетов было установлено, что в данном рассказе Пушкина предлог «к» используется в два раза чаще, чем «у», а местоимение «ты» в три раза чаще, чем «их» и т. д. Таким образом, несмотря на все перипетии сюжета, как на протяжении всего рассказа, так и в отдельных его частях, наблюдается стабильность относительной частоты употребления слов. То, что наблюдается в отношении некоторых (наиболее употребительных) слов, предположительно применимо и по отношению ко всем использованным в произведении словам. Отсюда следует, что стиль автора можно характеризовать определенным соотношением изменчивости средней частоты употребления слова к общей для данного языка<121> частоте его употребления. Это соотношение и рассматривается в качестве объективной квантитативной характеристики стиля автора.
Читать дальше