Следующая группа фильтров, которые будут рассмотрены, называется Extract (Извлечь). Фильтры этой группы предназначены для извлечения информации из текста.

Мы можем извлечь следующее:

  • Extract lines matching/nonmatching Извлечь строки соответствующие/несоответствующие поисковой строке. См. скриншот. Если мы напишем слово text в строке (цифра 3 на скриншоте), то из тестового примера будут извлечены 3 строки. Это число может быть увеличено, т.к. есть возможность включить в выдачу несколько строк до и после строки, удовлетворяющей запросу (цифра 2 на скриншоте);
  • Extract email address (Извлечь адреса электронной почты) Для сбора адресов электронной почты;
  • Extract URL (Извлечь адреса на ресурсы) Извлечение всех ссылок, использую, когда из текста надо извлечь адреса и передать их другой программе - менеджеру закачек;
  • Extract matches (Извлекаются точные совпадения) Например, для тестового примера: если задать слово text мы получим список из трех слов text. Фильтр имеет возможность подсчета числа совпадений, т.е. можно подсчитать сколько раз то или иное слово встречается в тексте;
  • Extract lines from list (Извлечение точно соответствующих строк);
  • Extract lines matching pattern list (Извлечь соответствия заданные списком). Если задать список из слов to и text мы получим 5 строк, где эти слова встречаются.