The UNIX and Linux Forums  
Hallo en welkom van de Verenigde Staten aan de UNIX en Linux Forum! Bedankt voor uw bezoek en Deelnemen aan onze wereldwijde gemeenschap.

Go Back   De Unix-en Linux Forum > Top Forums > Programmeren en Shell Scripting
.
google unix.com



Programmeren en Shell Scripting Post vragen over KSH, CSH, SH, Bash, Perl, PHP, sed, awk en andere shell scripts en shell scripting talen hier.

Meer UNIX en Linux Forum Onderwerpen Misschien vindt u Helpful
Draad Thread Starter Forum Antwoorden Last Post
Verwijder html tags met bash dejavu88 Programmeren en Shell Scripting 4 05-22-2008 01:58 PM
Hoe aan te vullen met HTML-tags SED DocBrewer Programmeren en Shell Scripting 3 04-25-2008 09:40
Hoe verwijder alleen html-tags in een bestand? btech_raju Linux 2 11-23-2007 12:25
Automatische vervanging van HTML-codes nem_kirk SUN Solaris 1 11-17-2005 01:24
unsing sed strippen html-tags - help zap Programmeren en Shell Scripting 3 04-18-2004 04:03

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Zoeken in deze Thread Rate Thread Display Modes
  #1 (permalink)  
Old 11-28-2007
dunryc dunryc is offline
Geregistreerde gebruiker
  
 

Join Date: november 2007
Posten: 4
html-tags

hi nieuw op het forum zodat hi every one hopen u allen goed,

Iam probeert om een bash-script op het moment van haar schraper / grabber met wget te downloaden webpagina's die verband houden met de gebruikers zoekopdracht. dat gedeelte is geen probs toen heb ik de pagina Ik moet stipr alle nutteloos (voor mij) gegevens uit de HTML-bron te weten: --

Citaat:

<html>
test test test
<tag> test ttest </ tag>
<new>
dit is de gegevens die ik wil grijpen tussen de nieuwe tags
</ new>
<html>

zoals je kunt zien vanaf het boven de gegevens die ik moet pakken is tussen de nieuwe tags, deze zijn altijd in de broncode van wat ooit het gebruik zoekopdracht. Kan iemand me helpen of in de juiste richting alle hulp zou zeer gewaardeerd bedankt voor het luisteren dunryc
  #2 (permalink)  
Old 11-28-2007
portier porter is offline Forum Advisor  
Geregistreerde gebruiker
  
 

Join Date: Jan 2007
Berichten: 2965
Hebt u overwogen XMLStarlet Opdrachtregelparameters XML Toolkit: Overzicht
  #3 (permalink)  
Old 11-28-2007
bakunin bakunin is offline Forum Staff  
Bughunter Extraordinaire
  
 

Join Date: May 2005
Ligging: In het linkse byte van / dev / kmem
Berichten: 1628
Citaat:
Oorspronkelijk geplaatst door dunryc View Post
de gegevens die ik moet pakken is tussen de nieuwe tags, deze zijn altijd in de broncode van wat ooit het gebruik zoekopdracht.
Er zijn twee verschillende zaken te worden beschouwd: het begint en eindigt tags zijn op dezelfde lijn, ofwel zijn ze op verschillende lijnen:

Code:
Example

<new>This is the text to catch</new>

<new>
This is some text
to catch</new>
Beide kunnen worden geëvenaard door eenvoudige reguliere expressies. Voor elk regexp Ik geef de afgedekte gedeelte in blauw:

Code:
sed -n 's/.*<new>\(.*\)<\/new>.*/\1/p'

blabla <new>text to match</new> blabla

sed -n '/<new>/,/<\/new>/ {
               s/.*<new>//
               s/<\/new>.*//
               /^$/d
               p
               }'

blabla <new>text
to
match</new> blabla
bakunin
  #4 (permalink)  
Old 11-29-2007
dunryc dunryc is offline
Geregistreerde gebruiker
  
 

Join Date: november 2007
Posten: 4
dank voor de suggesties jongens, ik heb eens een kijkje op XMLStarlet ophalen van de gegevens en het werkt geweldig, maar ik wilde het gebruik van hulpmiddelen die aanwezig zijn in de meeste distributies de commando's die bakunin werk geweldig nogmaals bedankt voor de hulp
Closed Thread

Bladwijzers

Labels
regex, reguliere expressies

Thread Tools Zoeken in deze Thread
Zoeken in deze Thread:

Uitgebreid zoeken
Display Modes Beoordeel deze draad
Beoordeel deze draad:

Posting Regels
Jij mag niet Post Nieuwe threads
Jij mag niet na antwoorden
Jij mag niet post attachments
Jij mag niet bewerk uw berichten

BB code is Aan
Smilies zijn Aan
[IMG] code Aan
HTML-code is Uit
Trackbacks zijn Aan
Pingbacks zijn Aan
Refbacks zijn Aan




Alle tijden zijn GMT -4. Het is nu 11:59 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Vertalingen Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
De Unix-en Linux Forums Copyright © 1993-2009. Alle rechten Reserved.Ad Beheer door RedTyger

Content Relevante URL's door vBSEO 3.2.0