4.15. Преобразование между табуляциями и пробелами в текстовых файлах
Проблема
Имеется текстовый файл, содержащий табуляции или пробелы, и требуется преобразовать одни в другие. Например, может потребоваться заменить все табуляции на последовательности из трех пробелов или сделать наоборот и заменить все вхождения некоторого числа пробелов на табуляции.
Решение
Независимо от того, производится ли замена табуляций на пробелы или пробелов на табуляции, используйте классы ifstreamи ofstreamиз . В первом (более простом) случае прочтите данные по одному символу с помощью входного потока, изучите их и, если очередной символ — это табуляция, запишите в выходной поток некоторое количество пробелов. Пример 4.23 демонстрирует, как это делается.
Пример 4.23. Замена табуляций на пробелы
#include
#include
#include
using namespace std;
int main(int argc, char** argv) {
if (argc < 3)
return(EXIT_FAILURE);
ifstream in(argv[1]);
ofstream out(argv[2]);
if (!in || !out) return(EXIT_FAILURE);
char c;
while (in.get(c)) {
if (c == '\t')
out << " "; // 3 пробела
else
out << c;
}
out.close();
if (out)
return(EXIT_SUCCESS);
else
return(EXIT_FAILURE);
}
Если же требуется заменить пробелы на табуляции, обратитесь к примеру 4.24. Он содержит функцию spacesToTabs, которая читает из входного потока по одному символу, ища три последовательных пробела. Когда они найдены, она записывает в выходной поток табуляцию. Для всех остальных символов или меньшего количества пробелов в выходной поток записывается то, что было прочитано во входном.
Пример 4.24. Замена пробелов на табуляции
#include
#include
#include
#include
#include
using namespace std;
void spacesToTabs(istream& in, ostream& out, int spaceLimit) {
int consecSpaces = 0;
char c;
while (in.get(c)) {
if (c != ' ') {
if (consecSpaces > 0) {
for (int i = 0; i < consecSpaces; i++) {
out.put(' ');
}
consecSpaces = 0;
}
out.put(c);
} else {
if (++consecSpaces == spaceLimit) {
out.put('\t');
consecSpaces = 0;
}
}
}
}
int main(int argc, char** argv) {
if (argc < 3)
return(EXIT_FAILURE);
ifstream in(argv[1]);
ofstream out(argv[2]);
if (!in || !out)
return(EXIT_FAILURE);
spacesToTabs(in, out, 3);
out.сlose();
if (out)
return(EXIT_SUCCESS);
else
return(EXIT_FAILURE);
}
Обсуждение
Механизм обоих этих решений один и тот же, отличаются только алгоритмы. Символы читаются из входного потока с помощью get, а в выходной поток помещаются с помощью put. Логика, выполняющая преобразования, помещается между этими двумя функциями.
Вы, вероятно, заметили в примере 4.24, что в функции main inи outобъявлены как переменные типов ifstreamи ofstreamсоответственно и что параметры spacesToTabs — это istreamи ostream. Это сделано для того, чтобы позволить spacesToTabsработать с любыми типами входных и выходных потоков (ну, не любыми типами потоков, а теми, которые наследуются от basic_istreamили basic_ostream), а не только с файловыми потоками. Например, текст, который требуется переформатировать, может находиться в строковом потоке ( istringstreamи ostringstreamиз ). В этом случае сделайте что-то похожее на следующее.
istringstream istr;
ostringstream ostr;
// заполняем istr текстом...
spacesToTabs(istr, ostr);
Как и в случае со строками, потоки — это на самом деле шаблоны классов, параметризованные по типу символов, с которыми работает поток. Например, ifstream— это typedefдля basic_ifstream, a wifstream— это typedefдля basic_ifstream. Таким образом, если требуется, чтобы spacesToTabsиз примеров 4.23 или 4.24 работала с потоками любых символов, то вместо typedefиспользуйте эти шаблоны классов.
template
void spacesToTabs(std::basic_istream& in,
std::basic_ostream& out, int spaceLimit) { //...
4.16. Перенос строк в текстовом файле
Проблема
Требуется сделать перенос текста файла после определенного количества символов. Например, если требуется сделать перенос текста после 72 символов, то после каждого 72 символа файла требуется вставить символ новой строки. Если файл содержит текст, читаемый человеком, то, вероятно, потребуется избежать разделения слов.
Читать дальше