The UNIX and Linux Forums  
Ciao e benvenuto da parte degli Stati Uniti al UNIX e Linux Forum! Grazie per la visita ed unirsi alla nostra Comunità Globale.

Go Back   UNIX e Linux Forum > Inizio Forum > Shell scripting e di programmazione
.
google unix.com



Shell scripting e di programmazione Pubblica domande su KSH, CSH, SH, Bash, Perl, PHP, sed, awk e da altri script di shell e linguaggi di scripting shell qui.

Più di UNIX e Linux Forum Argomenti potreste trovare utili
Filo Thread Starter Forum Risposte Ultimo Post
Rimuovere i tag html con bash dejavu88 Shell scripting e di programmazione 4 05-22-2008 02:58 PM
Come integrare con i tag HTML SED DocBrewer Shell scripting e di programmazione 3 04-25-2008 10:40 AM
Come rimuovere solo tag html all'interno di un file? btech_raju Linux 2 11-23-2007 12:25 PM
Automatizzato di sostituzione dei tag HTML nem_kirk SUN Solaris 1 11-17-2005 01:24 AM
unsing sed a striscia tag html - help zap Shell scripting e di programmazione 3 04-18-2004 05:03 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Cerca in questo Thread Rate Thread Modalità di visualizzazione
  #1 (permalink)  
Old 11-28-2007
dunryc dunryc is offline
Utente Registrato
  
 

Iscriviti Data: novembre 2007
Interventi: 4
tag html

hi nuovo al forum in modo hi ogni speranza voi tutti bene,

Iam cercando di scrivere uno script bash in questo momento la sua raschietto / grabber utilizzando wget per scaricare le pagine web relative alle query degli utenti. che una parte non è probs quando ho la pagina ho bisogno di Stipr tutte le inutili (per me) i dati di sorgente HTML ossia: --

Citazione:

<html>
prova prova prova
<tag> prova TEST.T </ tag>
<new>
si tratta di dati che voglio prendere tra le nuove etichette
</ new>
<html>

come si può vedere da quanto precede, la necessità per i dati è da prendere tra le nuove etichette sono sempre alla fonte che cosa mai gli usi query. Can anyone help me o punto nella direzione corretta di aiuto sarebbe molto apprezzato grazie per l'ascolto dunryc
  #2 (permalink)  
Old 11-28-2007
porter porter is offline Forum Advisor  
Utente Registrato
  
 

Iscriviti Data: gennaio 2007
Interventi: 2.965
Avete considerato XMLStarlet Command Line XML Toolkit: Panoramica
  #3 (permalink)  
Old 11-28-2007
Bakunin bakunin is offline Forum Staff  
Bughunter Extraordinaire
  
 

Iscriviti Data: maggio 2005
Situazione: Nel byte sinistra di / dev / kmem
Messaggi: 1.628
Citazione:
Originalmente inviato da dunryc View Post
i dati sono necessari per poter afferrare è tra le nuove etichette sono sempre alla fonte che cosa mai gli usi query.
Ci sono due casi diversi da prendere in considerazione: l'inizio e fine tag sono sulla stessa linea o si trovano in diverse linee:

Codice:
Example

<new>This is the text to catch</new>

<new>
This is some text
to catch</new>
Entrambi possono essere accompagnati da semplici espressioni regolari. Per ogni regexp dare i trovato la porzione di blu:

Codice:
sed -n 's/.*<new>\(.*\)<\/new>.*/\1/p'

blabla <new>text to match</new> blabla

sed -n '/<new>/,/<\/new>/ {
               s/.*<new>//
               s/<\/new>.*//
               /^$/d
               p
               }'

blabla <new>text
to
match</new> blabla
Bakunin
  #4 (permalink)  
Old 11-29-2007
dunryc dunryc is offline
Utente Registrato
  
 

Iscriviti Data: novembre 2007
Interventi: 4
grazie per i puntatori ragazzi, ho fatto un'occhiata a XMLStarlet a prendere i dati e le grandi opere, ma che ho voluto utilizzare strumenti che potrebbero essere presenti nella maggior parte delle distribuzioni che Bakunin i comandi funzionano molto bene, ancora una volta, grazie per l'aiuto
Closed Thread

Segnalibri

Tag
regex, le espressioni regolari

Thread Tools Cerca in questo Thread
Cerca in questo Thread:

Ricerca Avanzata
Modalità di visualizzazione Vota questo thread
Vota questo thread:

Distacco regolamento
Tu non può post nuovo thread
Tu non può inviare una risposta
Tu non può postare allegati
Tu non può modificare i tuoi post

BB codice è Su
Smilies sono Su
[IMG] codice Su
Codice HTML è Chiuso
Trackbacks sono Su
Pingbacks sono Su
Refbacks sono Su




Tutti gli orari sono GMT -4. La data di oggi è 03:43 AM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traduzioni Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX e Linux Forum Content Copyright © 1993-2009. Tutti i diritti Reserved.Ad di gestione da RedTyger

Contenuti pertinenti URL da vBSEO 3.2.0