The UNIX and Linux Forums  


Go Back   В UNIX и Linux Форумы > Топ форумы > Shell программирование и сценарии
.
Google unix.com



Shell программирование и сценарии Почтовые вопросы о KSH, CSH, SH, BASH, Perl, PHP, SED, AWK и скрипты оболочки и оболочки скриптовых языков здесь.

Подробнее UNIX и Linux Темы форума можно найти полезные
Нить Резьба для начинающих Форум Ответы Последнее сообщение
Удаление HTML тегов с Баш dejavu88 Shell программирование и сценарии 4 05-22-2008 02:58 PM
Как в дополнение к HTML-тегов с SED DocBrewer Shell программирование и сценарии 3 04-25-2008 10:40 AM
Как удалить только HTML-теги внутри файла? btech_raju Linux 2 11-23-2007 12:25 PM
Автоматизированная замена HTML тегов nem_kirk SUN Solaris 1 11-17-2005 01:24 AM
unsing SED раздеться HTML-теги - Справка Зап Shell программирование и сценарии 3 04-18-2004 05:03 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered By Powered by Google
 
LinkBack Резьба Инструменты Искать в этом Thread Оценить Thread Режимы дисплея
Old 11-28-2007
dunryc dunryc is offline
Зарегистрированный пользователь
  
 

Регистрация: Nov 2007
Сообщений: 4
HTML-теги

привет новым для форума, так привет каждый надеюсь вы все хорошо,

IAM пытается написать сценарий Баш на данный момент в ее скребком / граббер помощью Wget для загрузки веб-страниц, связанных с запросом пользователя. эта часть не probs, когда я на странице нужно stipr все бесполезно (для меня) данных из HTML т.е. источник: --

Цитата:

<html>
тест тест тест
тэг испытания ttest </ тэг>
<new>
это данные, я хочу захватить между новой метки
</ новых>
<html>

Как вы видели из приведенных выше данных, я должен взять с между новым теги они всегда на источник, какие когда-либо использования запроса. Может ли кто-нибудь поможет мне или точки в правильном направлении какой-либо помощи будет высоко оценивает благодарность для прослушивания dunryc
Old 11-28-2007
Бакунин bakunin is offline Forum Staff  
Bughunter Extraordinaire
  
 

Регистрация: May 2005
Расположение: в крайнем левом байт / Dev / KMEM
Сообщений: 1635
Цитата:
Первоначально Послано dunryc View Post
данные, мне нужно захватить с между новым теги они всегда на источник, какие когда-либо использования запроса.
Существуют два различных дел, которые будут рассмотрены: начальный и конечный теги расположены на одной линии или они по различным направлениям:


Код:
Example

<new>This is the text to catch</new>

<new>
This is some text
to catch</new>

Оба могут быть подкреплены простых регулярных выражений. Для каждого регулярного выражения Даю соответствует части в синий:


Код:
sed -n 's/.*<new>\(.*\)<\/new>.*/\1/p'

blabla <new>text to match</new> blabla

sed -n '/<new>/,/<\/new>/ {
               s/.*<new>//
               s/<\/new>.*//
               /^$/d
               p
               }'

blabla <new>text
to
match</new> blabla

Бакунин
Old 11-29-2007
dunryc dunryc is offline
Зарегистрированный пользователь
  
 

Регистрация: Nov 2007
Сообщений: 4
спасибо за указателями, ребята, я, посмотрите на XMLStarlet извлекать данные, и он прекрасно работает, но я хотел бы использовать инструменты, которые будут присутствовать в большинстве дистрибутивов команды Бакунин, что работа еще раз большое спасибо за помощь
Closed Thread

Закладки

Теги
Regex, регулярные выражения

Резьба Инструменты Искать в этом Thread
Искать в этом Thread:

Расширенный поиск
Режимы дисплея Оценить эту ветку
Оценить эту ветку:

Отправка Правила
Вы не может Начать новую нитей
Вы не может Почтовые ответы
Вы не может Почтовые вложения
Вы не может Редактировать Ваши сообщения

BB код быть На
Смайлики являемся На
[IMG] код На
HTML-код Вне
Trackbacks являемся На
Pingbacks являемся На
Refbacks являемся На




Часовой пояс GMT -4. Текущее время 11:18 PM.


Powered By: Справка, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Язык Переводы на питание от .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
В UNIX и Linux форумы Содержание Copyright © 1993-2009. Все права Reserved.Ad управления по RedTyger

Содержание соответствующие URL-адреса в vBSEO 3.2.0