В ядрах серий до 2.6 работа потоков pdflush
выполнялась двумя другими потоками ядра bdflush
и kupdated
.
Поток пространства ядра bdflush
выполнял фоновую обратную запись измененных страниц, когда количество доступной памяти становилось достаточно малым. Также был определен ряд пороговых значений, аналогично тому как это делается для демона pdflush
. Демон bdflush
возвращался к выполнению с помощью функции wakeup_bdflush()
, когда количество свободной памяти становилось меньше этих пороговых значений.
Между демонами bdflush
и pdflush
существует два главных отличия. Первое состоит в том, что демон bdflush
был всего один, а количество потоков pdflush
может меняться динамически. Об этом более подробно будет рассказано в следующем разделе. Второе отличие состоит в том, что демон bdflush
работал с буферами, он записывал на диск измененные буферы. Демон pdflush
работает со страницами, он записывает на диск целые измененные страницы памяти. Конечно, страницы памяти могут соответствовать буферам, но единицей ввода-вывода является целая страница памяти, а не один буфер. Это дает преимущество, поскольку работать со страницами памяти проще, чем с буферами, так как страница памяти — более общий и более часто используемый объект.
Так как демон bdflush
выполнял обратную запись, только когда количество свободной памяти очень сильно уменьшалось или количество буферов было очень большим, то был введен поток ядра kupdated
, который периодически выполнял обратную запись измененных страниц памяти. Он использовался для целей, аналогичных функции wb_kupdate()
демона pdflush
.
Потоки bdflush
и kupdated
и их функциональность сейчас заменены потоками pdflush
.
Предотвращение перегруженности: для чего нужны несколько потоков
Один из главных недостатков решения на основе демона bdflush
состоит в том, что демон bdflush
имел всего один поток выполнения. Это приводило к возможности зависания демона при большом количестве операций обратной записи, когда один поток демона bdflush
блокировался на очереди запросов ввода-вывода перегруженного устройства, в то время как очереди запросов других устройств могли быть в этот момент сравнительно свободными. Если система имеет несколько дисков и соответствующую процессорную мощность, то ядро должно иметь возможность загрузить работой все диски. К сожалению, даже при большом количестве данных, для которых необходима обратная запись, демон bdflush
может оказаться загруженным работой с одной очередью и не сможет поддерживать все диски в нагруженном состоянии. Это происходит потому, что пропускная способность диском конечна и, к несчастью, очень низкая. Если только один поток выполняет обратную запись страниц, то он может проводить много времени в ожидании одного диска, так как пропускная способность диска ограничена. Для облегчения этой ситуации ядру необходима многопоточная обратная запись. В таком случае ни одна очередь запросов не может стать узким местом.
В ядрах серии 2.6 эта проблема решается путем введения нескольких потоков pdflush
. Каждый поток самостоятельно выполняет обратную запись страниц памяти на диск, что позволяет различным потокам pdflush
работать с разными очередями запросов устройств.
Количество потоков изменяется в процессе работы системы в соответствии с простым алгоритмом. Если все существующие потоки pdflush
оказываются занятыми в течение одной секунды, то создается новый поток pdflush
. Общее количество потоков не может превышать значения константы MAX_PDFLUSH_THREADS
, которая по умолчанию равна 8. И наоборот, если поток pdflush находился в состоянии ожидания больше одной секунды, то он уничтожается. Минимальное количество потоков равно, по крайней мере, значению константы MIN_PDFLUSH_THREADS,
что по умолчанию соответствует 2. Таким образом, количество потоков pdflush
изменяется динамически в зависимости от количества страниц, для которых необходима обратная запись, и загруженности этих потоков. Если все потоки pdflush
заняты обратной записью, то создается новый поток. Это гарантирует, что ни одна из очередей запросов устройств не будет перегружена, в то время как другие очереди устройств не так загружены и в них тоже можно выполнять обратную запись. Если перегрузка предотвращается, то количество потоков pdflush
уменьшается, чтобы освободить память.
Читать дальше