Пример 4.31. Автозамена текста
#include
#include
#include
#include
using namespace std;
typedef map StrStrMap;
// Класс для хранения текстовых полей
class TextAutoField {
public:
TextAutoField(StrStrMap* const p) : pDict_(p) {}
~TextAutoField() {}
void append(char c);
void getText(string& s) {s = buf_;}
private:
TextAutoField();
string buf_;
StrStrMap* const pDict ;
};
// Добавление с автозаменой
void TextAutoField::append(char c) {
if ((isspace(c) || ispunct(c)) && // Выполнять автоза-
buf_.length() > 0 && // мену, только когда вводятся
!isspace(buf_[buf_.length() - 1])) { // ws или punct
string::size_type i = buf_.find_last_of(" \f\n\r\t\v");
i = (i == string::npos) ? 0 : ++i;
string tmp = buf_.substr(i, buf_.length() - i);
StrStrMap::const_iterator p = DDict_->find(tmp);
if (p != pDict_->end()) { // Нашли, так что стираем
buf_.erase(i, buf_.length() - i); // и заменяем
buf_ += p->second;
}
}
buf_ += с;
}
int main() {
// Создаем map
StrStrMap dict;
TextAutoField txt(&dict);
dict["taht"] = "that";
dict["right"] = "wrong";
dict["bug"] = "feature";
string tmp = "He's right, taht's a bug.";
cout << "Оригинальная версия: " << tmp << '\n';
for (string::iterator p = tmp.begin(); p != tmp.end(); ++p) {
txt.append(*p);
}
txt.getText(tmp);
cout << "Исправленная версия. " << tmp << '\n';
}
Вывод примера 3.2 таков.
Оригинальная версия: He's right, taht's a bug.
Исправленная версия: He's wrong, that's a feature.
Обсуждение
stringи mapудобны в ситуациях, когда требуется отслеживать ассоциации string. TextAutoField— это простой текстовый буфер, использующий stringдля хранения данных. Интересной TextAutoFieldделает ее метод append, который «слушает» пробелы или знаки пунктуации и при их появлении выполняет обработку.
Чтобы сделать автозамену работающей, требуется две вещи. Во-первых, требуется некий словарь, который содержит неправильно написанные варианты слов и связанные с ними правильные написания, map хранит пары ключ/значение, где ключ и значение могут быть любого типа, так что он является идеальным кандидатом на эту роль. В начале примера 4.31 имеется typedefдля пар string:
typedef map StrStrMap;
За более подробным описанием map обратитесь к рецепту 4.18. TextAutoFieldхранит указатель на map, так как, вероятнее всего, для всех полей потребуется только один общий словарь.
Предполагая, что клиентский код помещает в mapчто-то осмысленное, appendпросто должен периодически проверять trap. В примере 4.31 appendждет появления пробела или знака пунктуации. Для проверки на пробел можно использовать isspace, а для поиска знаков пунктуации можно использовать ispunct. Обе эти функции для узких символов определены в (см. табл. 4.3).
Если вы не знакомы с использованием итераторов и методов поиска в контейнерах STL, то код, который выполняет проверку, требует некоторых пояснений, string tmpсодержит последний фрагмент текста, который был добавлен в TextAutoField. Чтобы увидеть, был ли он написан с ошибками, поищите его в словаре вот так.
StrStrMap::iterator p = pDict->find(tmp);
if (p != pDict_->end()) {
Здесь важно то, что map::findв случае успеха поиска возвращает итератор, который указывает на пару, содержащую соответствующий ключ. Если поиск не дал результатов, то возвращается итератор, указывающий на область памяти после последнего элемента map, на который указывает map::end(именно так работают контейнеры STL, поддерживающие find). Если слово в mapнайдено, стираем из буфера старое слово и заменяем его правильной версией.
buf_.erase(i, buf_.length() - i);
buf_ += p->second;
Добавьте символ, который инициировал весь процесс (либо пробел, либо знак пунктуации), и все.
Смотри также
Рецепты 4.17, 4.18 и табл. 4.3.
4.23. Чтение текстового файла с разделителями-запятыми
Проблема
Требуется прочитать текстовый файл, чье содержимое разделено запятыми и новыми строками (или любой другой парой разделителей). Записи разделяются одним символом, а поля записи разделяются другим символом. Например, текстовый файл с разделителями-запятыми, содержащий информацию о сотрудниках, может выглядеть вот так.
Smith, Bill, 5/1/2002, Active
Stanford, John, 4/5/1999, Inactive
Такие файлы обычно временно хранят наборы данных, экспортируемые из электронных таблиц, баз данных или других форматов файлов.
Читать дальше