![]() |
|
|
Google unix.com
|
|||||||
| Форумы | Регистрация | Правила форума | Ссылки | Альбомы | ЧАВО | Список участников | Календарь | Поиск | Сегодняшние сообщения | Отметить форумы читать |
| Shell программирование и сценарии Почтовые вопросы о KSH, CSH, SH, BASH, Perl, PHP, SED, AWK и скрипты оболочки и оболочки скриптовых языков здесь. |
Подробнее UNIX и Linux Темы форума можно найти полезные
|
||||
| Нить | Резьба для начинающих | Форум | Ответы | Последнее сообщение |
| Удаление HTML тегов с Баш | dejavu88 | Shell программирование и сценарии | 4 | 05-22-2008 02:58 PM |
| Как в дополнение к HTML-тегов с SED | DocBrewer | Shell программирование и сценарии | 3 | 04-25-2008 10:40 AM |
| Как удалить только HTML-теги внутри файла? | btech_raju | Linux | 2 | 11-23-2007 12:25 PM |
| Автоматизированная замена HTML тегов | nem_kirk | SUN Solaris | 1 | 11-17-2005 01:24 AM |
| unsing SED раздеться HTML-теги - Справка | Зап | Shell программирование и сценарии | 3 | 04-18-2004 05:03 AM |
![]() |
|
|
LinkBack | Резьба Инструменты | Искать в этом Thread | Оценить Thread | Режимы дисплея |
|
|
|
||||
|
HTML-теги
привет новым для форума, так привет каждый надеюсь вы все хорошо,
IAM пытается написать сценарий Баш на данный момент в ее скребком / граббер помощью Wget для загрузки веб-страниц, связанных с запросом пользователя. эта часть не probs, когда я на странице нужно stipr все бесполезно (для меня) данных из HTML т.е. источник: -- Цитата:
Как вы видели из приведенных выше данных, я должен взять с между новым теги они всегда на источник, какие когда-либо использования запроса. Может ли кто-нибудь поможет мне или точки в правильном направлении какой-либо помощи будет высоко оценивает благодарность для прослушивания dunryc |
|
||||
|
Вы рассмотрел XMLStarlet командной строки XML Toolkit: Обзор
|
|
||||
|
Цитата:
Код:
Example <new>This is the text to catch</new> <new> This is some text to catch</new> Оба могут быть подкреплены простых регулярных выражений. Для каждого регулярного выражения Даю соответствует части в синий: Код:
sed -n 's/.*<new>\(.*\)<\/new>.*/\1/p'
blabla <new>text to match</new> blabla
sed -n '/<new>/,/<\/new>/ {
s/.*<new>//
s/<\/new>.*//
/^$/d
p
}'
blabla <new>text
to
match</new> blabla
Бакунин |
|
||||
|
спасибо за указателями, ребята, я, посмотрите на XMLStarlet извлекать данные, и он прекрасно работает, но я хотел бы использовать инструменты, которые будут присутствовать в большинстве дистрибутивов команды Бакунин, что работа еще раз большое спасибо за помощь
|
![]() |
| Закладки |
| Теги |
| Regex, регулярные выражения |
| Резьба Инструменты | Искать в этом Thread |
| Режимы дисплея | Оценить эту ветку |
|
|