В другом примере требуется найти все английские слова, состоящие из шести или более букв, в которых буквы следуют в алфавитном порядке:
$ cat monotonic
^a?b?c?d?e?f?g?h?i?j?k?l?m?n?o?p?r?s?t?u?v?w?x?y?z?$
$ egrep -f monotonic /usr/dict/web2 | grep '......' | 5
abdest acfcnow adipsy agnosy almost
bedfist behint befcnow bijoux biopsy
chintz dehors dehort demos dimpsy
egilops ghosty
(Egilops — это болезнь, поражающая пшеницу.) Обратите внимание на использование команды grep
для фильтрации выходного потока egrep
.
Для чего нужны три сходные программы? Программа fgrep
не интерпретирует метасимволы, но может параллельно обрабатывать тысячи слов (после инициации время ее работы не зависит от числа слов), и поэтому она применяется прежде всего для заданий типа библиографического поиска. Размеры типичных шаблонов для программы fgrep
превосходят возможности алгоритмов, используемых в программах grep
и egrep
. Различия между двумя последними указать труднее. Программа egrep
появилась намного раньше. Она интерпретирует регулярные выражения, используемые в командах редактора ed
, в ней есть помеченные регулярные выражения и большой набор флагов. Программа egrep
интерпретирует более общие выражения (не считая помеченных), и выполняется значительно быстрее (со скоростью, не зависящей от шаблона), но ее стандартная версия требует большего времени на инициацию в случае сложного выражения. Существует новая версия, начинающая работу мгновенно, так что программы egrep
и grep
теперь можно было бы скомбинировать в одну программу поиска по шаблону.
Упражнение 4.1
Прочтите о регулярных выражениях (\(
и \))
в приложении 1 или справочном руководстве по ed(1)
. Используйте программу grep
для поиска палиндромов — слов, читающихся одинаково с конца и начала. Подсказка: составьте свой шаблон для слов каждой длины.
Упражнение 4.2
Алгоритм программы grep
таков: прочесть одну строку, проверить ее на вхождение шаблона, затем продолжить цикл. Как повлияло бы на работу программы то, что регулярные выражения могли бы задавать перевод строки?
Здесь мы представим вам набор небольших системных фильтров, покажем их возможности и дадим несколько примеров использования. Список этих фильтров далеко не полон — существует еще множество фильтров, входящих в седьмую версию, и, конечно, каждая работающая система имеет свои специфические фильтры. Все стандартные фильтры описаны в разд. 1 справочного руководства по UNIX.
Рассмотрим сначала программу sort
, как наиболее часто используемую. В гл. I было указано ее назначение: сортировка входного потока по строкам в порядке, задаваемом множеством ASCII. Хотя это очевидный порядок для сортировки по умолчанию, существует множество других полезных способов сортировки данных, и программа sort
пытается удовлетворить всех, предоставляя множество различных флагов. Например, флаг -f
устраняет различие между прописными и строчными буквами, флаг -d
(словарный порядок) игнорирует при сравнении все символы, кроме букв, цифр и пробелов.
Способ сравнения в алфавитном порядке является наиболее распространенным, но иногда требуется произвести сравнение в числовом порядке, флаг -n
сортирует по числовому значению, а флаг -r
изменяет смысл на противоположный любого условия. Итак, имеем
$ ls | sort -f
Сортировка имен файлов в алфавитном порядке
$ ls -s | sort -n
Сортировка в порядке возрастания размеров файлов
$ ls -s | sort -nr
Сортировка в порядке убывания размеров файлов
Программа sort
обычно сортирует целые строки, но ее можно заставить работать только с определенными полями. Обозначение +m
показывает, что при сравнении пропускается m полей, а +0
обозначает начало строки, например:
$ ls -l | sort +3nr
Сортировка по счетчику байтов в порядке убывания
размеров
$ who | sort +4nr
Сортировка по времени входа в систему, в порядке
возрастания размеров файлов
Еще одним полезным флагом программы является -о
, задающий имя файла для выходного потока (это может быть один из входных файлов), и флаг -u
, который удаляет все, за исключением одной из строк, совпадающих в сортируемых полях. Можно использовать несколько флагов, как показано в примере на странице sort(1)
справочного руководства:
$ sort +0f +0 -u filenames
здесь флаг +0f
сортирует строку, совмещая строчные и прописные буквы, но идентичные строки могут не быть соседними. Поэтому вводится второй флаг +0
, который сортирует одинаковые строки после первой сортировки в обычном порядке ASCII. Наконец, флаг -u
выбрасывает все, кроме одной из соседних повторяющихся строк. Таким образом, получив список слов по одному в строке, команда выдает неповторяющиеся слова. Указатель для этой книги был подготовлен с помощью сходной команды sort
, обладающей еще большими возможностями (см. руководство по sort(1)
).
Читать дальше
Конец ознакомительного отрывка
Купить книгу