Образцы для сравнения могут состоять из одного или нескольких паттернов, которые перечисляются через знак " |". Для того чтобы соответствовать такому перечислению в целом, узел должен соответствовать хотя бы одному из паттернов, входящих в него. Здесь тоже есть определенная аналогия с множествами, оператор " |" означает как бы объединение: узел входит в объединение множеств, если он входит хотя бы в одно из объединяемых множеств. Но, конечно же, и здесь упрощенный синтаксис играет свою роль для оптимизации — оперировать множествами, выбираемыми каждым из паттернов, было бы очень неэкономно.
Паттерны и их продукции описываются в спецификации самого языка XSLT, но мы приводим их в той же главе, что и выражения языка XPath, поскольку они очень похожи и имеют к тому же практические одинаковые семантические принципы. Паттерны используют также некоторые продукции языка XPath (такие, как NodeTest, Predicateи другие).
При нумерации EBNF-продукций паттернов мы будем нумеровать их с префиксом PT( [PT1], [PT2]и т.д.), чтобы не путать с продукциями других языков, рассматриваемых в этой книге.
Самая общая продукция паттерна называется Patternи показывает, что образец соответствия может быть как одиночным паттерном, так и перечислением нескольких паттернов с разделяющими символами " |". Продукция LocationPathPatternсоответствует одиночному паттерну, показывая своим названием (англ. location path pattern — образец пути выборки) конструкционную близость к самим путям выборки.
[PT1] Pattern ::= LocationPathPattern
| Pattern '|' LocationPathPattern
Одиночный паттерн определяется следующим образом:
[PT2] LocationPathPattern
::= '/' RelativePathPattern?
| IdKeyPattern (('/' | '//') RelativePathPattern)?
| '//'? RelativePathPattern
Упростив эту продукцию, мы получим следующее правило:
LocationPathPattern ::= '/'
| RelativePathPattern
| '/' RelativePathPattern
| '//' RelativePathPattern
| IdKeyPattern
| IdKeyPattern '/' RelativePathPattern
| IdKeyPattern '//' RelativePathPattern
Если учесть, что нетерминал RelativePathPatternсоответствует образцу относительного пути, можно легко заметить, как похожи первые четыре возможности в этом правиле на то, что мы разбирали при описании самих абсолютных и относительных путей.
□ Паттерну '/'соответствует только корневой узел.
□ Паттерн RelativePathPatternзадает образец относительного пути. Например, паттерну a/bсоответствуют элементы b, находящиеся в элементах a.
□ Паттерну '/' RelativePathPatternсоответствуют узлы, которые соответствуют образцу относительного пути при отсчете от корневого узла. Например, паттерну /a/bсоответствуют элементы b, находящиеся в элементах a, находящихся в корне документа.
□ Паттерну '//' RelativePathPatternсоответствуют узлы, которые соответствуют относительному пути при отсчете от любого узла документа. Например, паттерну //a/bсоответствуют любые элементы b, имеющие родителем элемент с именем а. Фактически, этот паттерн не отличается от паттерна a/b(единственное различие в том, что они могут иметь разные приоритеты).
Последние три случая в правиле LocationPathPatternотносятся к таким механизмам XSLT, как адресация по уникальным идентификаторам и ключам.
В первой главе книги, когда мы описывали синтаксис и семантику языка разметки документов XML, мы коротко остановились на уникальных атрибутах — атрибутах, которые определяются типом IDи значения которых должны быть уникальны внутри документа. Как мы узнали, это позволяет более эффективно обращаться к элементам в документе.
XSLT позволяет использовать уникальные атрибуты элементов при помощи функции id, которая возвращает множество, состоящее из узла, уникальный атрибут которого равен переданному ей значению, или пустое множество, если такого элемента нет.
Кроме того, XSLT предоставляет похожий механизм, механизм ключей, который выбирает узлы не по уникальным атрибутам, а по значениям именованных ключей, определенных в преобразовании. Для этого служит функция key.
Поскольку два этих механизма схожи по семантике, они определяются в XSLT в едином паттерне:
[PT3] IdKeyPattern ::= 'id' '(' Literal ')'
| 'key' '(' Literal ',' Literal ')'
Этому паттерну соответствуют только узлы, принадлежащие результату одной из двух функций — idили key.
Оставим детали использования ключей и ID-атрибутов на потом и вернемся к разбору вариантов синтаксиса паттернов.
Читать дальше