Джон Уолш - Создание инструмента научных исследований на основе XML - Проблемы и методология

Здесь есть возможность читать онлайн «Джон Уолш - Создание инструмента научных исследований на основе XML - Проблемы и методология» весь текст электронной книги совершенно бесплатно (целиком полную версию без сокращений). В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: Программирование, Базы данных, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Создание инструмента научных исследований на основе XML: Проблемы и методология: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Создание инструмента научных исследований на основе XML: Проблемы и методология»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

"В своем докладе я опишу процесс создания электронного исследовательского инструмента, имеющего в своей основе печатный библиографический указатель, который предназначен для использования в научных целях, а также проанализирую некоторые трудности, с которыми мы столкнулись в ходе реализации данного проекта, и расскажу об избранных нами вариантах решения возникших проблем."

Создание инструмента научных исследований на основе XML: Проблемы и методология — читать онлайн бесплатно полную книгу (весь текст) целиком

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Создание инструмента научных исследований на основе XML: Проблемы и методология», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
), библиографического указателя советских периодических изданий, издающегося с 1926 года по настоящее время. Указатель охватывает более чем 1700 журналов, серий и продолжающихся публикаций академий, университетов, научно-исследовательских институтов в областях гуманитарных, естественных наук, наук об обществе, а также популярную периодическую литературу. Переведенная в электронный формат и помещенная в World Wide Web Летопись обеспечит доступ к периодической литературе важного периода российской истории, начинающегося с хрущевской «оттепели», следующей за двадцатым съездом коммунистической партии советского союза (КПСС), и продолжающегося вплоть до первой половины так называемой брежневской «эпохи застоя». Студенты и ученые, изучающие российскую политологию, литературу или историю периода 1956—1975 гг. безусловно оценят по достоинству «Летопись журнальных статей».

1.2. Мотивы осуществления проекта

Стимулов осуществления проекта оцифровывания было два. Первый — увеличение возможностей использования указателя. Использование печатного варианта Летописи представляет определенные трудности. Летопись издавалась еженедельными выпусками, общего указателя по Летописи не существует, так что поиск по ней довольно сложен и занимает много времени. Цифровая версия позволит осуществлять поиск по всему двадцатилетнему периоду Летописи, который мы переводим в электронный формат, что существенно облегчит использование и увеличит полезность указателя.

Второй мотивирующий фактор реализации проекта это необходимость сохранения указателя. Печатная версия была издана на бумаге с высоким содержанием кислоты, которая со временем стала очень хрупкой и в настоящее время стремительно разрушается. Перевод в электронный формат поможет сохранить ценный научный источник, каким является Летопись. Помимо XML версии указателя мы заархивируем оцифрованные изображения страниц.

1.3. Структура «Летописи журнальных статей»

Структура DTD Летописи повторяет структуру печатного варианта. В печатном варианте Летописи библиографические ссылки структирировны по более чем 300 предметным заголовкам. Предметные заголовки имеют трех-ступенную иерархию. Первый уровень включает 33 предметных заголовка, подразделяемых в свою очередь на подзагловки второго и третьего уровня. Заголовки первого уровня пронумерованы с использованием римских цифр; разделы второго уровня пронумеровны с использованием арабских цифр. Для третьего уровня подзаголовков были использованы строчные кириллические буквы. Ниже приведены некоторые примеры заголовков из иерархии:

I. Марксизм-ленинизм

1. Произведения основоположников марксизма-ленинизма.

2. Литература об основоположниках марксизма-ленинизма. Работы по марксизму-ленинизму.

XIII. Государство и право

1. Общие вопросы. Теория и история государства и права.

2. Государство и право СССР.

а. Общие вопросы. Советское строительство. Государственное и административное право.

б. Другие отрасли советского права.

в. Суд и прокуратура. Работа органов юстиции.

1.4. DTD «Летописи журнальных статей»

Ниже приводится DTD, которое мы используем для кодирования Летописи. Оно имеет элемент letopis, который вбирает в себя выпуски за несколько лет. В нем таже имеются контейнерные элементы для года и еженедельных выпусков. Мы использовали три элемента подразделов (div1, div2 и div3) для обозначения предметных подзаголовков внутри трехступенчатной предметной иерархии. Элемент cit заключает в себе одну библиографическую ссылку. Дополнительная информация об этих и других элементах и атрибутах содержится в комментариях к DTD приводимых ниже.

target IDREF #REQUIRED >

2. Процесс оцифровывания

Основные этапы процесса оцифровывания таковы:

Выпуски Летописи в печатном виде без переплета отосыляются фирме-подрядчику для перевода в электронный формат. Страницы Летописи сканируются и сохраняются с параметрами 600 точек на дюйм (dpi) в двухцветном режиме TIFF образов.

• По получении цифровых изображений страниц от подрядчика они подвергаются обработке системой Оптического Распознавания Символов (OCR) компании ABBYY( http://www.abbyy.com/). Программный продукт “Fine Reader” российской компании ABBYY, единственный из известных нам, способен распознавать русский (киррилический) текст. Тексты, распознанные при помощи процесса OCR, сохраняются как UTF-8 файлы Unicode.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Создание инструмента научных исследований на основе XML: Проблемы и методология»

Представляем Вашему вниманию похожие книги на «Создание инструмента научных исследований на основе XML: Проблемы и методология» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Создание инструмента научных исследований на основе XML: Проблемы и методология»

Обсуждение, отзывы о книге «Создание инструмента научных исследований на основе XML: Проблемы и методология» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x