• Stephens-Davidowitz, S. Everybody lies. Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are. 2017.
Глава 2. От данных к мудрости
Прежде чем начать разбираться в вопросах управления и извлечения ценности из данных, стоит подробнее остановиться на терминах «данные» (data) и «информация» (information) и их значениях. Применительно к сфере управления данными эти термины часто используют как синонимы, но во многих случаях значения различают [27] DAMA International. DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition. Technics Publications, 2017. (Русский перевод: DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / Dama International. – М.: Олимп-Бизнес, 2020.)
[28] Laney D. B. Infonomics: How to Monetize, Manage, and Measure Information as an Asset for Competitive Advantage; Routledge; 1st edition, 2017. (Русский перевод: Д. Лейни. Инфономика: информация как актив: монетизация, оценка, управление. – М.: Точка, 2020. – [Библиотека «Айтеко»].)
. Понять разницу поможет экскурс в историю их происхождения.
В английском языке слово information появилось гораздо раньше, чем слово data, – в конце XIV века. Слово пришло из старофранцузского языка. Французские information, informateur – производные от informer – «осведомлять, сообщать, делать известным». Первоисточник – латинское informatio – «разъяснение, истолкование, сообщение». От in – «в, к, в направлении» + forma – «форма». Истоки слова «форма» неизвестны [29] https://www.etymonline.com/word/information .
[30] https://ecanet.ru/word/Информация .
.
Во второй половине XV века за словом information закрепилось значение «переданные сведения, относящиеся к определенной теме». Сфера применения постепенно расширялась. В частности, в XX веке слово стало появляться в документальных источниках в связи с передачей телевизионных сигналов – с 1937 года, применением перфокарт – c 1944-го, анализом ДНК – с 1953-го. Термин «теория информации» (information theory) используется с 1950 года, «информационная технология» (information technology) – с 1958-го (впервые появился в журнале Harvard Business Review ), «информационная революция» (information revolution) – с 1966-го, «информационная перегрузка» (information overload) – с 1967-го.
В русский язык слово «информация» пришло из западноевропейских языков при Петре I – в начале XVIII века (но в словарях появляется лишь во второй половине XIX века). Основные значения – «сообщения, сведения, пояснения».
Что же касается слова data, то оно в английском языке стало использоваться (в значении, близком к сегодняшнему) в 1640-х годах – более чем на два столетия позже слова information.
Слово data произошло от латинского datum – «данная вещь» (от латинского dare – «давать»). Оно применяется как во множественном, так и в единственном числе, однако в научной литературе для единственного числа может использоваться термин datum.
1640-е годы – время начала Английской гражданской войны, открывшей путь к промышленной революции XVIII–XIX веков. Одновременно это было время осуществления первой научной революции и возникновения классической европейской науки. Слова data и datum в значении «данные или предоставленные факты» впервые появились в работах английского священника Генри Хаммонда (Henry Hammond), который, как и многие представители его профессии в то время, участвовал в формировании основ классической науки [31] https://circa-navigate.corsairs.network/a-daring-history-of-data-4ae39ba9459 .
[32] В частности, Хаммонд перевел на английский язык ряд сочинений французского ученого и философа Блеза Паскаля.
.
Начиная с работ Хаммонда слово information стало все чаще и чаще дублироваться словом data, чему способствовала научная революция, наступление «Века разума» (The Age of Reason) и эпохи Просвещения. Появилось (благодаря быстрому распространению книгопечатания, изобретенного Гуттенбергом в 1450 году) большое количество книг по уже существовавшим и вновь появляющимся отраслям науки. Таким образом, был создан и активно обрабатывался огромный объем совместно используемых сведений. Для обозначения таких сведений, предоставляемых для обсуждения и осмысления, начал применяться термин data (сначала в классическом значении – «факты, данные в качестве основы для вычислений при решении математических задач»), более подходящий в данном случае, чем термин information [33] https://circa-navigate.corsairs.network/the-history-of-data-5663fc4f1398 .
.
Необходимо отметить еще одно важное слово, появление которого оказало существенное влияние на дальнейшее распространение термина «данные». В 1798 году Джон Синклер [34] Сэр Джон Синклер (Sir John Sinclair) – шотландский политический деятель и экономист, первый президент Совета сельского хозяйства Шотландии.
в своем «Статистическом отчете о Шотландии» ввел в английский язык термин «статистика». По определению Синклера, статистика – это собрание фактов, которые совершенно не обязательно должны были быть представлены (и даже в основном не были представлены) в числовом виде. Однако с 1829 года слово statistics стало употребляться в английских документальных источниках в более строгом значении – «собранные и классифицированные числовые данные». С этого момента изучение любого предмета стало сопровождаться проведением всеобъемлющих подсчетов [35] https://www.etymonline.com/word/statistics .
.
Читать дальше