The UNIX and Linux Forums  

Go Back   UNIX og Linux Forums > Top Forums > Shell programmering og Skripting
.
google unix.com



Shell programmering og Skripting Post spørsmål om ksh, csh, SH, Bash, Perl, PHP, SED, awk og ANDRE shell scripts og Shell skriptespråk her.

Mer UNIX og Linux Forum Emner Du kan finne nyttig
Tråd Tråd startet Forum Svar Siste innlegg
Fjern html koder med bash dejavu88 Shell programmering og Skripting 4 05-22-2008 02:58
Slik supplement HTML kodene med SED DocBrewer Shell programmering og Skripting 3 04-25-2008 10:40
Slik fjerner du bare html-koder i en fil? btech_raju Linux 2 11-23-2007 12:25
Automatisk utskifting av HTML-koder nem_kirk Sun Solaris 1 11-17-2005 01:24
unsing sed til strip html-koder - hjelp zappe Shell programmering og Skripting 3 04-18-2004 05:03

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Søk i denne tråden Rate Thread Visningsmoduser
  #1 (permalink)  
Old 11-28-2007
dunryc dunryc is offline
Registrert bruker
  
 

Bli Dato: november 2007
Innlegg: 4
html-koder

hi nye forumet så hi hvert håper dere vel,

Engasjert prøver å skrive et bash script for øyeblikket sin en skraper / grabben ved hjelp av wget laste ned websider relatert til brukerens spørring. at en del er ingen probs når jeg har siden jeg må stipr alle ubrukelig (for meg) data i HTML-kilden dvs.: --

Sitat:

<html>
test test test
<tag> test ttest </ tag>
<new>
dette er data jeg ønsker å hente mellom de nye kodene
</ nye>
<html>

som du kan sett fra over data jeg trenger å ta tak er fra mellom de nye kodene, disse er alltid på kildedatamaskinen det noen gang de bruker søket. Kan noen hjelpe eller peke meg i riktig retning alle hjelpe ville være verdsatt takk for lytting dunryc
  #2 (permalink)  
Old 11-28-2007
porter porter is offline Forum Advisor  
Registrert bruker
  
 

Bli Date: Jan 2007
Innlegg: 2965
Har du vurdert XMLStarlet Kommandolinje XML Toolkit: Oversikt
  #3 (permalink)  
Old 11-28-2007
Bakunin bakunin is offline Forum Staff  
Bughunter Extraordinaire
  
 

Bli Dato: mai 2005
Beliggenhet: I venstre byte av / dev / kmem
Innlegg: 1641
Sitat:
Originally Posted by dunryc View Post
dataene jeg trenger å ta tak er fra mellom de nye kodene, disse er alltid på kildedatamaskinen det noen gang de bruker søket.
Det er to forskjellige tilfeller skal vurderes: startstreken og sluttkodene er på samme linje eller de er på forskjellige linjer:


Code:
Example

<new>This is the text to catch</new>

<new>
This is some text
to catch</new>

Begge kan matches med enkle regeluttrykk. For hver regexp i gi Matchet del i blå:


Code:
sed -n 's/.*<new>\(.*\)<\/new>.*/\1/p'

blabla <new>text to match</new> blabla

sed -n '/<new>/,/<\/new>/ {
               s/.*<new>//
               s/<\/new>.*//
               /^$/d
               p
               }'

blabla <new>text
to
match</new> blabla

Bakunin
  #4 (permalink)  
Old 11-29-2007
dunryc dunryc is offline
Registrert bruker
  
 

Bli Dato: november 2007
Innlegg: 4
Takk for tips folkens, jeg skulle ta en titt på XMLStarlet å hente data og det fungerer bra, men jeg ønsket å bruke verktøy som vil være til stede i de fleste distros kommandoene som Bakunin fungerer fint en gang takk for hjelpen
Closed Thread

Hugseliste

Tags
regex, regeluttrykk

Thread Tools Søk i denne tråden
Søk i denne tråden:

Avansert søk
Visningsmoduser Ranger denne tråden
Ranger denne tråden:

Innleggsaktivitet Regler
Du kanskje ikke poste nye tråder
Du kanskje ikke poste svar
Du kanskje ikke post vedlegg
Du kanskje ikke redigere innleggene dine

BB-kode er
Smilefjes er
[IMG] koden
HTML-koden Av
Pingbacks er
Refbacks er




Alle klokkeslett er GMT -4. Nå er klokken 08:56.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Language Translations Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX og Linux Forums Content Copyright © 1993-2009. All Rights Reserved.Ad Management by RedTyger

Content Relevant nettadresser av vBSEO 3.2.0