Интерфейс программы интуитивно понятен. Необходимо отметить, что рассматривается интерфейс 9-ой версии программы.

На рынке она уже давно и широко распространена. В недавно появившейся 10-ой версии программы интерфейс изменился. Рабочие блоки поменяли привычные места, однако порядок работы сохранился.

В десятой версии появились важные нововведения, основное из которых поддержка Юникода. Но пока отсутствуют даже взломанные версии программы. Так что говорить об этой версии несколько преждевременно.

Вернемся к девятой версии. Меню, все элементы программы и файл помощи на английском языке. Есть русскоязычная локализация. Скажу честно, на панели инструментов я использую только кнопку со знаком вопроса – помощь. Файл помощи исчерпывающе описывает все вопросы функционирования программы и другие вещи. Например, регулярные выражения.

Русскоязычный вариант перевода помощи существовал до пятой версии и - к сожалению - уже давно не поддерживается. Но даже несмотря на это - может оказаться очень полезным.

Интерфейс программы

Рассмотрим подробно интерфейс программы. Область, обозначенная цифрой 1. Это – перечень всех доступных правил или фильтров, объединенных в 10 групп по назначению. Группы называются: Convert (Конвертация), Mainframe (Мэйнфрэйм), Unicode (Юникод), Add (Добавить), Remove (Удалить), Replace (Заменить), Extract (Извлечь), Special (Специальные), Maps (Карты), Restrict(Ограничитель). Основная рабочая область показана цифрой 2. В ней определяется порядок следования применяемых правил. Цифрой 3 обозначена вкладка ввода. Здесь определяется источник поступления информации в программу. То, откуда - из какого файла(ов), из какой папки - будет взята обрабатываемая информация.

 

Добавление списка обрабатываемых файлов

Красной галочкой обозначено очень важное место. Важно оно потому, что тут определяется, что делать с двоичными файлами. Двоичные файлы – это программы или что-то подобное. Но в ряде случаев TextPipe может посчитать двоичным обычный текстовый файл. При определении, является ли файл двоичным, TextPipe применяет следующие правила:

  • Если четыре символа подряд в строке имеют код ASCII от 128 до 255, то TextPipe считает, что файл двоичный;
  • Если любой считанный символ имеет код ASCII меньше чем 32, но не является одним из стандартных кодов форматирования 9,10,12,13,26 или 27, то TextPipe считает, что файл двоичный;
  • Если меньше чем 80% символов в выборке являются читабельными, TextPipe подразумевает, что файл двоичный. Количество символов в выборке можно настроить с помощью поля Sample Size field (Размер образца).

По умолчанию стоит положение Skip (Пропустить). Это означает, что файлы, определяемые программой как двоичные, будут пропускаться и не будут обрабатываться. С одной стороны – это правильно, но с другой стороны при таком подходе некоторые не двоичные файлы могут пропускаться при обработке. Такова особенность работы программы. О ней необходимо помнить и контролировать ситуацию, проверяя, сколько файлов должно было быть обработано и сколько было обработано реально. Если вы уверены, что все заданные к обработке файлы имеют правильный формат – перенесите выбор с Skip на Process, что означает, что двоичные файлы будут обрабатываться. Я выделил специальную отдельную папку для обрабатываемых файлов, куда ничего постороннего не попадает, поэтому ставлю галочку постоянно.

На вкладке Files To Process определяются правила, какие файлы будут обрабатываться. Здесь может указываться их название, расширение, местоположение, указывается правило обрабатывать директорию и поддиректорию или нет. Кстати – правил для обрабатываемых файлов может быть несколько.

Files to Process (обрабатываемые файлы). В этой части вы должны задать программе какие файлы следует обрабатывать. Вы можете одновременно использовать несколько вариантов:

  • Add files (добавить файлы) - служит для добавления нескольких конкретных файлов, имена которых указываются.
  • Add folder (добавить папку) - позволяет добавить папку с файлами. При этом предоставлена возможность уточнить какие именно файлы должны принять участие в обработке. Для этого вы можете задать шаблон. Например, D:\Temp\*.html - обрабатывать только html файлы на директории D:\Temp. Еще одна возможность - определить количество вложенных папок, в которых файлы будут обрабатываться. Раздел Subfolders (Поддиректории) позволяет задать от 0 до любого числа поддиректорий или просто все. Раздел Action дает возможность еще точнее определить файлы добавляя их в обработку или, наоборот, исключая из нее. Еще две дополнительные вкладки есть внизу. Они позволяют ограничить обрабатываемые файлы по дате создания (Filters by Date) и по размеру (Filters by Size), например, исключить файлы с нулевым размером.

TextPipe Trial Text Area

Последняя вкладка называется Trial Run Area (пробная область). Запускается процесс обработки пробной области кнопкой F5.

Несмотря на простоту — вещь это мега полезная. Слева в пробной области задан некий текст на английском языке для проверки правильности выполнения задания обработки. В поддиректории Sample data программы вы можете найти другие примеры файлов. Там есть пример базы данных CSV и TAB, текстовых файлов в разных кодировках, XML и HTML файлы. Разумеется, вы можете скопировать сюда собственный текст. Я довольно часто так и поступаю. Копирую нужный текст, отлаживаю работу фильтров прямо в окне и забираю результат из правой области. Если у вас есть только единственный файл или текст можно обрабатывать только в этом окне. Обратите внимание на надписи внизу под левым и правым окном. Line (Строка) 1, Column (Колонка) 1 – указывает на положение курсора в тексте, Length (Длина): 405, Lines (Число строк): 16 – длина текста и количество строк.

И еще одна вкладка появляется после рабочего запуска фильтра на исполнение. Сделать это можно нажав кнопку Go-Backup (F9) или клавишу F9. Go-Backup можно перевести как Выполнить, создав копию. TextPipe при выполнении модифицирует оригинальные, задаваемые вами файлы (если был предусмотрен вывод в файл), о чем, естественно, следует помнить. Речь о том, что если вы обрабатываете, например, файл myfile.txt, то на директории появится еще один файл myfile.txt.bak. При этом в файле myfile.txt.bak будет исходный файл, а в файле myfile.txt – обработанный программой вариант этого файла. На этой вкладке есть кнопки Restore .BAK files нажатие на которую восстанавливает оригинальный файл и Delete .BAK files которая удаляет оригинальный файл. Соответственно, если вы обрабатываете сразу несколько файлов – это будет справедливо для всех файлов. В окне вы также можете видеть лог файл и убедиться, что обработка прошла успешно. Последнее замечание. Следует помнить, что программа сохраняет копии только тех файлов, которые обрабатывались в последний раз и многократных копий типа .BAK.BAK.BAK не создает.
Поймал себя на том, что начал рассказывать о работе фильтров, не рассказав об их применении. Об этом - в следующей главе.