В 1980 году Буса опубликовал описание своего сотрудничества с IBM , продолжавшегося несколько десятилетий. Это поистине пророческий документ, содержащий множество глубоких замечаний для дальнейшего осмысления. К примеру, предвидя необходимость реформы гуманитарных наук (см. также наше обсуждение этого вопроса в главе 7), Буса пишет: «Представляется, что нынешняя научная жизнь нацелена на проведение краткосрочных исследовательских проектов и быструю публикацию результатов, а не на проекты, требующие совместной командной работы, предполагающей скорее продвижение на один сантиметр в глубину и километр в ширину, чем на километр исследований при сантиметровом их основании». Более тридцати лет спустя Энтони Графтон, занимавший в то время пост президента Американской ассоциации историков, высказал похожую мысль: «По мере того как новые формы научного исследования предлагают историкам исследовательские методы, дополняющие работу с текстами, поскольку цифровые архивы становятся все более масштабными, а цифровые исследовательские методы становятся все более доступными, историкам придется учиться тому, как формировать команды и работать в них… Сотрудничество предлагает – потенциально очень мощный – способ работы для ученых традиционного склада. Они могут создавать глобальные истории экономических, культурных и политических отношений, построенные на мощной архивной и текстовой основе». Работа Бусы, которую можно считать манифестом движения за цифровые методы в гуманитарных науках, не теряет своей актуальности и по сей день. См. Busa R. The Annals of Humanities Computing: Index Thomisticus // Computers and the Humanities 14 (1980). P. 83–90. Доступно в сети Интернет: http:// goo.gl/FgVWQ. Grafton A. Loneliness and Freedom // Perspectives on History (март 2011 г.), доступно в сети Интернет: http://goo.gl/dOx3J.
Некоторые конкордансы оказываются мощнее других. Следует отметить, что, даже если оставить в стороне вопрос более сложного исходного источника, конкорданс Бусы значительно масштабнее конкорданса Реймер. К примеру, Index Thomisticus включает в себя полную лемматизацию (приведение всех словоформ к единой словарной форме) исходного текста, группирующую все слова в лексически связанные классы (в английском языке лемматизация предполагает группировку различных родственных слов типа run, running, runs, ran, outrun и also - ran под одним заголовком). Эта лемматизация сама по себе выглядит значительным достижением. Наборы списков данных, с которыми мы работали, не содержат лемматизации (ее очень сложно провести правильно).
См. Miller G. A. Introduction to The Psycho-Biology of Language. Cambridge, MA: MIT Press, 1965, доступно в сети Интернет: http://goo.gl/KYvOcK. Полная цитата из введения к изданию книги 1965 года кажется теперь актуальной, как никогда раньше: «Цель книги The Psycho - Biology of Language („Психобиология языка“) состоит в не том, чтобы удовлетворить всем вкусам. Ципф был из той породы людей, которые разделяют розы на части, чтобы посчитать их лепестки; если вы считаете кощунством переставление местами слов в шекспировском сонете и их подсчет, то эта книга не для вас. Ципф относился к языку как ученый – и для него это означало статистический анализ языка как биологического, психологического и социального процесса. Если такой анализ отталкивает вас, то оставьте язык в покое и бегите от Джорджа Кингсли Ципфа как от чумы. Вам будет куда приятнее читать цитаты Марка Твена: „Существует три вида лжи: ложь, наглая ложь и статистика“ или У. Х. Одена: „Да не будешь ты сидеть рядом со статистиками или заниматься социальными науками“. Однако тем, кто не побоится убить красоту ради благого дела, научные старания Ципфа помогут прийти к прекрасным и неожиданным результатам, поражающим разум и дразнящим воображение».
См. Jenkins Sally. Burned-out Phelps Fizzles in the Water Against Lochte // Washington Post (29 июля 2012 г.).
См. Rohlin Melissa. Kobe Bryant Says He Learned a Lot from Phil Jackson // Los Angeles Times (14 ноября 2012 г.), доступно в сети Интернет: http://goo.gl/bKGDTg.
См. обсуждение этого вопроса в книге Pinker Steven. Words and Rules: The Ingredients of Language. New York: Basic Books, 1999; статье Lieberman et al. Quantifying the Evolutionary Dynamics of Language и вспомогательных материалах к ней; Michel2011 и Michel2011S.
Мы предполагаем, что соотношение частоты употребления слов burned и burnt отражает пропорцию англоговорящих жителей Великобритании, использующих каждую из форм.
См. Meldrum Jeff. Sasquatch: Legend Meets Science. New York: Forge, 2006.
Читать дальше
Конец ознакомительного отрывка
Купить книгу