The UNIX and Linux Forums  

Go Back   De Unix-en Linux Forum > Besturingssystemen > Linux
.
google unix.com



Linux Red Hat, Ubuntu, SUSE, Fedora, Debian, Mandriva, Slackware, Gentoo Linux, PCLinuxOS. Alle Linux vragen hier!

Meer UNIX en Linux Forum Onderwerpen Misschien vindt u Helpful
Draad Thread Starter Forum Antwoorden Last Post
Verwijder html tags met bash dejavu88 Programmeren en Shell Scripting 4 05-22-2008 02:58 PM
Hoe aan te vullen met HTML-tags SED DocBrewer Programmeren en Shell Scripting 3 04-25-2008 10:40
html-tags dunryc Programmeren en Shell Scripting 3 11-29-2007 06:14 PM
Hoe te splitsen bestand tags binnen-bestand? spookyrtd99 Programmeren en Shell Scripting 1 07-31-2006 01:50
Automatische vervanging van HTML-codes nem_kirk SUN Solaris 1 11-17-2005 01:24

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Zoeken in deze Thread Rate Thread Display Modes
  #1 (permalink)  
Old 11-23-2007
btech_raju
Score
  
 

Berichten: n / a
Bits: 0 [Banking]
Hoe verwijder alleen html-tags in een bestand?

Hi All,

Ik heb volgende voorbeeld bestand

i want to remove all html tags alleen

Input File:

<html>
<head>
<title> Software Solutions Inc, </ title>
<meta http-equiv\u003d"Content-Type" content\u003d"text/html; charset\u003diso-8859-1">
</ head>
<body bgcolor\u003dwhite leftmargin\u003d"0" topmargin\u003d"0" marginwidth\u003d"00" marginheight\u003d"0" class\u003dNormalFont>
<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TR> <TD Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Iswar Ramamoorthy </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Datum </ b> </ td>
<td align\u003dcenter> <b> Totaal Uren </ b> </ td>
<td align\u003dcenter> <b> Totaal in tijd </ b> </ td>
<td align\u003dcenter> <b> Totaal Break Uren </ b> </ td>
</ tr>


</ table>


<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TR> <TD Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Aman Jain </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Datum </ b> </ td>
<td align\u003dcenter> <b> Totaal Uren </ b> </ td>
<td align\u003dcenter> <b> Totaal in tijd </ b> </ td>
<td align\u003dcenter> <b> Totaal Break Uren </ b> </ td>
</ tr>


</ table>


<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TR> <TD Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Anilkumar Kaandukuri </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Datum </ b> </ td>
<td align\u003dcenter> <b> Totaal Uren </ b> </ td>
<td align\u003dcenter> <b> Totaal in tijd </ b> </ td>
<td align\u003dcenter> <b> Totaal Break Uren </ b> </ td>
</ tr>


<tr class\u003dnormalfont>
<td align\u003dcenter> 11.16.2007 </ td>
<td align\u003dcenter> 1:16:0 </ td>
<td align\u003dcenter> 01:16 </ td>
<td align\u003dcenter> 0 </ td>
</ tr>

</ table>


<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TR> <TD Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Arun Sivaraman </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Datum </ b> </ td>
<td align\u003dcenter> <b> Totaal Uren </ b> </ td>
<td align\u003dcenter> <b> Totaal in tijd </ b> </ td>
<td align\u003dcenter> <b> Totaal Break Uren </ b> </ td>
</ tr>

Mijn verwachte resultaat:

Software Solutions Inc

Iswar Ramamoorthy

Datum
Totaal aantal uren
Totaal in Time
Totaal Break Uren

Aman Jain

Datum
Totaal aantal uren
Totaal in Time
Totaal Break Uren

Anilkumar Kaandukuri

Datum
Totaal aantal uren
Totaal in Time
Totaal Break Uren

11/16/2007
1:16:0
01:16
0

............
...........

etc. ...........
  #2 (permalink)  
Old 11-23-2007
radoulov's Avatar
radoulov radoulov is offline Forum Staff  
addict
  
 

Join Date: Jan 2007
Locatie: Варна, България / Milano, Italia
Berichten: 2.926

Code:
sed -n '/^$/!{s/<[^>]*>//g;p;}' filename

Of, met een beetje anders output:


Code:
lynx --dump filename

(het bestand moet htm [L] extensie)

Of gebruik html2text

Laatst gewijzigd door radoulov; op 11.23.2007 12:17..
  #3 (permalink)  
Old 11-23-2007
btech_raju
Score
  
 

Berichten: n / a
Bits: 0 [Banking]
Alle commando's zijn goed te doen,

sed -n'/^$/!{ s /<[^>]*>// g; p;) 'bestandsnaam

Leg uit het bovenstaande sed commando

Bedankt,
Thangaraju.

Laatst gewijzigd door btech_raju; op 11.23.2007 12:39..
Closed Thread

Bladwijzers

Thread Tools Zoeken in deze Thread
Zoeken in deze Thread:

Uitgebreid zoeken
Display Modes Beoordeel deze draad
Beoordeel deze draad:

Posting Regels
Jij mag niet Post Nieuwe threads
Jij mag niet na antwoorden
Jij mag niet post attachments
Jij mag niet bewerk uw berichten

BB code is Aan
Smilies zijn Aan
[IMG] code Uit
HTML-code is Uit
Trackbacks zijn Aan
Pingbacks zijn Aan
Refbacks zijn Aan




Alle tijden zijn GMT -4. Het is nu 01:19.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Vertalingen Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
De Unix-en Linux Forums Copyright © 1993-2009. Alle rechten Reserved.Ad Beheer door RedTyger

Content Relevante URL's door vBSEO 3.2.0