Как следует из названия, страничный кэш (page cache) — это кэш страниц; памяти. Соответствующие страницы памяти получаются в результате чтения и записи обычных файлов на файловых системах, специальных файлов блочных устройств и файлов, отображаемых в память. Таким образом, в страничном кэше содержатся страницы памяти, полностью заполненные данными из файлов, к которым только что производился доступ. Перед выполнением операции страничного ввода-вывода, как, например, read()
[84] Как было показано в главе 12," Виртуальная файловая система", операции страничного ввода-вывода непосредственно выполняются не системными вызовами read() и write() , а специфичными для файловых систем методами file->f_op->read() и file->f_op->write() .
, ядро проверяет, есть ли те данные, которые нужно считать, в страничном кэше. Если данные находятся в кэше, то ядро может быстро возвратить требуемую страницу памяти.
Физическая страница памяти может содержать данные из нескольких несмежных физических дисковых блоков [85] Например, размер страницы физической памяти для аппаратной платформы x86 равен 4 Кбайт, в то время как размер дискового блока для большинства устройств и файловых систем равен 512 байт. Следовательно, в одной странице памяти может храниться 8 блоков. Блоки не обязательно должны быть смежными, так как один файл может быть физически "разбросанным" по диску.
.
Проверка наличия определенных данных в страничном кэше может быть затруднена, если смежные блоки принадлежат совершенно разным страницам памяти. Невозможно проиндексировать данные в страничном кэше, используя только имя устройства и номер блока, что было бы наиболее простым решением.
Более того, страничный кэш ядра Linux является хранилищем данных достаточно общего характера в отношении того, какие страницы памяти в нем могут кэшироваться. Первоначально страничный кэш был предложен в операционной системе System V (SVR 4) для кэширования только данных из файловых систем. Следовательно, для управления страничным кэшем операционной системы SVR 4 использовался эквивалент файлового объекта, который назывался struct vnode
. Кэш операционной системы Linux разрабатывался с целью кэширования любых объектов, основанных на страницах памяти, что включает множество типов файлов и отображений в память.
Для получения необходимой общности в страничном кэше операционной системы Linux используется структура address_space
(адресное пространство), которая позволяет идентифицировать страницы памяти, находящиеся в кэше. Эта структура определена в файле следующим образом.
struct address_space {
struct inode *host; /* файловый индекс, которому
принадлежит объект */
struct radix_tree_root page_tree; /* базисное дерево
всех страниц */
spinlock_t tree_lock; /* блокировка для защиты
поля page_tree */
unsigned int i_mmap_wrltable; /* количество областей
памяти
с флагом VM_SHARED */
struct prio_tree_root i_mmap; /* список всех отображений */
struct list_head i_mmap_nonlinear; /* список областей
памяти с флагом VM_NONLINEAR */
spinlock_t i_mmap_lock; /* блокировка поля i_mmap */
atomic_t truncate_count; /* счетчик запросов
truncate */
unsigned long nrpages; /* общее количество страниц */
pgoff_t writeback_index; /* смещения начала
обратной записи */
struct address_space_operations *a_ops; /* таблица операций */
unsigned long flags; /* маска gfp_mask
и флаги ошибок */
struct backing_dev_info *backing_dev_info; /* информация
упреждающего чтения */
spinlock_t private_lock; /* блокировка
для частных отображений */
struct list_head private_list; /* список
частных отображений */
struct address_spacs *assoc_mapping; /* соответствующие
буферы */
};
Поле i_mmap
— это дерево поиска по приоритетам для всех совместно используемых и частных отображений. Дерево поиска по приоритетам— это хитрая смесь базисных и частично упорядоченных бинарных деревьев [86] Реализация ядра основана на базисном дереве поиска по приоритетам, предложенном в работе Edward M. McCreight, опубликованной в журнале SIAM Journal of Computing, May 1985, vol. 14. №2, P. 257–276.
.
Всего в адресном пространстве nrpages страниц памяти.
Объект address_space
связан с некоторым другим объектом ядра, обычно с файловым индексом. Если это так, то поле host
указывает на соответствующий файловый индекс. Если значение поля host
равно NULL
, то соответствующий объект не является файловым индексом; например, объект address_space
может быть связан с процессом подкачки страниц (swapper).
Читать дальше