The UNIX and Linux Forums  
Hej och välkommen från USA till UNIX och Linux Forum! Tack för ditt besök och gå med i vår globala gemenskapen.

Go Back   UNIX och Linux Forum > Upp Forum > Shell-programmering och Skript
.
google unix.com



Shell-programmering och Skript Post frågor om ksh, CSH, SH, bash, PERL, PHP, sed, awk och andra skalskript och skal skriptspråk här.

Mer UNIX och Linux Forum Ämnen Du kan hitta Helpful
Tråd Thread Starter Forum Svar Senaste Inlägg
Ta bort HTML-taggar med bash dejavu88 Shell-programmering och Skript 4 05-22-2008 01:58
Hur man komplettera HTML-taggar med SED DocBrewer Shell-programmering och Skript 3 04-25-2008 09:40
Ta bort bara html-taggar i en fil? btech_raju Linux 2 11-23-2007 12:25
Databehandlade ersätta HTML Tags nem_kirk Sun Solaris 1 11-17-2005 01:24
unsing sed för remsor html taggar - help zap Shell-programmering och Skript 3 04-18-2004 04:03

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Sök i denna tråd Rate Thread Visningslägen
  #1 (permalänk)  
Old 11-28-2007
dunryc dunryc is offline
Registered User
  
 

Join Date: Nov 2007
Inlägg: 4
HTML-taggar

Hej ny på forumet så hej alla hoppas att ni alla väl,

Nu försöker skriva ett bash-script för närvarande sin skrapa / grabberen använder wget för att hämta webbsidor med anknytning till användare sökfråga. den delen är inga probs när jag har den sidan måste jag stipr alla värdelös (för mig) uppgifter ur den html källan, dvs: --

Citat:

<html>
test test test
<tag> test ttest </ tag>
<new>
detta är de uppgifter som jag vill ta mellan Mera
</ nya>
<html>

Som ni kan se av ovanstående uppgifter som jag behöver få tag på är från mellan Mera dessa alltid på källan vad någonsin använder sökfråga. Kan någon hjälpa eller peka mig i rätt riktning någon hjälp skulle vara mycket uppskattat tack för att lyssna dunryc
  #2 (permalänk)  
Old 11-28-2007
porter porter is offline Forum Advisor  
Registered User
  
 

Join Date: Jan 2007
Inlägg: 2965
Har ni XMLStarlet Command Line XML Toolkit: Översikt
  #3 (permalänk)  
Old 11-28-2007
Bakunin bakunin is offline Forum Staff  
Bughunter extraordinär
  
 

Join Date: maj 2005
Ort: I det vänstra byte av / dev / kmem
Inlägg: 1.628
Citat:
Ursprungligen postat av dunryc View Post
de uppgifter jag behöver få tag på är från mellan Mera dessa alltid på källan vad någonsin använder sökfråga.
Det finns två olika fall som skall beaktas: den börjar och slutar taggar på samma rad eller de är på olika linjer:

Kod:
Example

<new>This is the text to catch</new>

<new>
This is some text
to catch</new>
Båda kan kombineras med enkla reguljära uttryck. För varje regexp Jag ger Matchat del i blå:

Kod:
sed -n 's/.*<new>\(.*\)<\/new>.*/\1/p'

blabla <new>text to match</new> blabla

sed -n '/<new>/,/<\/new>/ {
               s/.*<new>//
               s/<\/new>.*//
               /^$/d
               p
               }'

blabla <new>text
to
match</new> blabla
Bakunin
  #4 (permalänk)  
Old 11-29-2007
dunryc dunryc is offline
Registered User
  
 

Join Date: Nov 2007
Inlägg: 4
tack för tips grabbar, det gjorde jag ta en titt på XMLStarlet få tag på de uppgifter och det fungerar bra men jag ville använda verktyg som skulle vara närvarande i de flesta distros kommandon som Bakunin arbeta mycket än en gång tack för hjälpen
Closed Thread

Komihåglista

Taggar
regex, reguljära uttryck

Thread Tools Sök i denna tråd
Sök i denna tråd:

Avancerad sökning
Visningslägen Betygsätt denna tråd
Betygsätt denna tråd:

Utstationering Regler
Du får inte efter nya trådar
Du får inte efter svar
Du får inte skicka bilagor
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG] kod
HTML-koden är Av
Trackback är
Pingbacks är
Refbacks är




Alla tider är GMT -4. Klockan är nu 05:26.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Översättningar Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX och Linux Forum Innehållet upphovsrättsskyddat © 1993-2009. All Rights Reserved.Ad förvaltning RedTyger

Content Relevant webbadresser från vBSEO 3.2.0