В следующем примере создается временный файл, куда записываются данные и затем читаются:
Листинг
import tempfile
f = tempfile.TemporaryFile()
f.write(«0»*100) # записывается сто символов 0
f.seek(0) # уст. указатель на начало файла
print len(f.read()) # читается до конца файла и вычисляется длина
Как и следовало ожидать, в результате будет выведено 100. Временный файл будет удален, как только будут удалены все ссылки на его объект.
Обработка текстов
Модули этой категории будут подробно рассмотрены в отдельной лекции.
Многопоточные вычисления
Модули этой категории станут предметом рассмотрения отдельной лекции.
Хранение данных. Архивация
К этой категории отнесены модули, которые работают с внешними хранилищами данных.
Модуль pickle
Процесс записи объекта в виде последовательности байтов называется сериализацией. Для того чтобы сохранить объект во внешней памяти или передать его по каналам связи, его нужно вначале сериализовать.
Модуль pickle позволяет сериализовывать объекты и сохранять их в строке или файле. Следующие объекты могут быть сериализованы:
встроенные типы: None, числа, строки (обычные и Unicode).
списки, кортежи и словари, содержащие только сериализуемые объекты.
функции, определенные на уровне модуля (сохраняется имя, но не реализация!).
встроенные функции.
классы, определенные на уровне модуля.
объекты классов, __dict__ или __setstate__() которых являются сериализуемыми.
Типичный вариант использования модуля приведен ниже.
Сохранение:
Листинг
import pickle, time
mydata = («abc», 12, [1, 2, 3])
output_file = open(«mydata.dat», «w»)
p = pickle.Pickler(output_file)
p.dump(mydata)
output_file.close()
Восстановление:
Листинг
import pickle
input_file = open(«mydata.dat», «r»)
mydata = pickle.load(input_file)
print mydata
input_file.close()
Модуль shelve
Для хранения объектов в родном для Python формате можно применять полку (shelve). По своему интерфейсу полка ничем не отличается от словаря. Следующий пример показывает, как использовать полку:
Листинг
import shelve
data = («abc», 12) # - данные (объект)
key = «key» # - ключ (строка)
filename = «polka.dat» # - имя файла для хранения полки
d = shelve.open(filename) # открытие полки
d[key] = data # сохранить данные под ключом key
# (удаляет старое значение, если оно было)
data = d[key] # загрузить значение по ключу
len(d) # получить количество объектов на полке
d.sync() # запись изменений в БД на диске
del d[key] # удалить ключ и значение
flag = d.has_key(key) # проверка наличия ключа
lst = d.keys() # список ключей
d.close() # закрытие полки
Модули anydbm и gdbm
Для внешнего хранения данных можно использовать примитивные базы данных, содержащие пары ключ–значение. В Python имеется несколько модулей для работы с такими базами: bsddb, gdbm, dbhash и т.п. Модуль anydbm выбирает один из имеющихся хэшей, поэтому его можно применять для чтения ряда форматов (any — любой).
Доступ к хэшу из Python мало отличается от доступа к словарю. Разница лишь в том, что хэш еще нужно открыть для создания, чтения или записи, а затем закрыть. Кроме того, при записи хэш блокируется, чтобы не испортить данные.
Модуль csv
Формат CSV (comma separated values — значения, разделенные запятыми) достаточно популярен для обмена данными между электронными таблицами и базами данных. Следующий ниже пример посвящен записи в CSV–файл и чтению из него:
Листинг
mydata = [(1, 2, 3), (1, 3, 4)]
import csv
# Запись в файл:
f = file(«my.csv», «w»)
writer = csv.writer(f)
for row in mydata:
writer.writerow(row)
f.close()
# Чтение из файла:
reader = csv.reader(file(«my.csv»))
for row in reader:
print row
Платформо–зависимые модули
Эта категория модулей имеет применение только для конкретных операционных систем и семейств операционных систем. Довольно большое число модулей в стандартной поставке Python посвящено трем платформам: Unix, Windows и Macintosh.
При создании переносимых приложений использовать платформо–зависимые модули можно только при условии реализации альтернативных веток алгоритма, либо с отказом от свойств, которые доступны не на всех платформах. Так, под Windows не работает достаточно обычная для Unix функция os.fork(), поэтому при создании переносимых приложений нужно использовать другие средства для распараллеленных вычислений, например, многопоточность.
В документации по языку обычно отмечено, для каких платформ доступен тот или иной модуль или даже отдельная функция.
Поддержка сети. Протоколы Интернет
Почти все модули из этой категории, обслуживающие клиентскую часть протокола, построены по одному и тому же принципу: из модуля необходим только класс, объект которого содержит информацию о соединении с сервером, а методы реализуют взаимодействие с сервером по соответствующему протоколу. Таким образом, чем сложнее протокол, тем больше методов и других деталей требуется для реализации клиента.
Читать дальше