The UNIX and Linux Forums  
Hola y bienvenida de los Estados Unidos a la UNIX y Linux Foros! Gracias por su visita y formar parte de nuestra comunidad global.

Go Back   El UNIX y Linux Foros > Sistema Operativo > Linux
.
google unix.com



Linux Red Hat, Ubuntu, SUSE, Fedora, Debian, Mandriva, Slackware, Gentoo, PCLinuxOS. Todas las preguntas Linux aquí!

Más UNIX y Linux Foro Temas usted puede encontrar útiles
Hilo Hilo para principiantes Foro Respuestas Último mensaje
Eliminar etiquetas html con bash dejavu88 Programación de scripts de shell y 4 05-22-2008 02:58 PM
Cómo completar las etiquetas HTML con SED DocBrewer Programación de scripts de shell y 3 04-25-2008 10:40 AM
etiquetas html dunryc Programación de scripts de shell y 3 11-29-2007 06:14 PM
Cómo dividir el archivo por archivo dentro de las etiquetas? spookyrtd99 Programación de scripts de shell y 1 07-31-2006 01:50 AM
Automatizado de la sustitución de etiquetas HTML nem_kirk Sun Solaris 1 11-17-2005 01:24 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
Linkback vínculo Herramientas de hilo Buscar en este Hilo Tasa de Hilo Modos de visualización
  #1 (Enlace permanente)  
Old 11-23-2007
btech_raju
Guest
  
 

Mensajes: n / a
Bits: 0 [Banca]
Cómo quitar sólo etiquetas html dentro de un archivo?

Hi All,

He siguiente fichero de ejemplo

i desea eliminar todas las etiquetas html sólo,

Archivo de entrada:

<html>
<head>
<title> de Soluciones de Software Inc., </ title>
<meta http-equiv\u003d"Content-Type" content\u003d"text/html; charset\u003diso-8859-1">
</ head>
<body bgcolor\u003dwhite leftmargin\u003d"0" topmargin\u003d"0" marginwidth\u003d"00" marginheight\u003d"0" class\u003dNormalFont>
<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TD <TR> Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Iswar Ramamoorthy </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Fecha </ b> </ td>
<td align\u003dcenter> <b> total de horas </ b> </ td>
<td align\u003dcenter> <b> total en tiempo </ b> </ td>
<td align\u003dcenter> <b> total Descanso Horas </ b> </ td>
</ tr>


</ table>


<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TD <TR> Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Aman Jain </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Fecha </ b> </ td>
<td align\u003dcenter> <b> total de horas </ b> </ td>
<td align\u003dcenter> <b> total en tiempo </ b> </ td>
<td align\u003dcenter> <b> total Descanso Horas </ b> </ td>
</ tr>


</ table>


<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TD <TR> Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Anilkumar Kaandukuri </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Fecha </ b> </ td>
<td align\u003dcenter> <b> total de horas </ b> </ td>
<td align\u003dcenter> <b> total en tiempo </ b> </ td>
<td align\u003dcenter> <b> total Descanso Horas </ b> </ td>
</ tr>


<tr class\u003dnormalfont>
<td align\u003dcenter> 11/16/2007 </ td>
<td align\u003dcenter> 1:16:0 </ td>
<td align\u003dcenter> 01:16 </ td>
<td align\u003dcenter> 0 </ td>
</ tr>

</ table>


<table ID\u003d"Table2" Bordercolor\u003dblack border\u003d2 cellspacing\u003d2 cellpadding\u003d2>
<TD <TR> Colspan\u003d4 align\u003dleft bgcolor\u003d"yellow"> <font color\u003dblue> <b> Arun Sivaraman </ b> </ font> </ TD> </ TR>
<tr>
<td align\u003dcenter> <b> Fecha </ b> </ td>
<td align\u003dcenter> <b> total de horas </ b> </ td>
<td align\u003dcenter> <b> total en tiempo </ b> </ td>
<td align\u003dcenter> <b> total Descanso Horas </ b> </ td>
</ tr>

Mi resultado esperado:

Soluciones de Software Inc.

Iswar Ramamoorthy

Fecha
Total de Horas
Tiempo total en
Total de Horas de Descanso

Aman Jain

Fecha
Total de Horas
Tiempo total en
Total de Horas de Descanso

Anilkumar Kaandukuri

Fecha
Total de Horas
Tiempo total en
Total de Horas de Descanso

11/16/2007
1:16:0
01:16
0

............
...........

etc ...........
  #2 (Enlace permanente)  
Old 11-23-2007
radoulov's Avatar
radoulov radoulov is offline Forum Staff  
adicto
  
 

Fecha: enero 2007
Ubicación: Варна, България / Milán, Italia
Mensajes: 2.869
Código:
sed -n '/^$/!{s/<[^>]*>//g;p;}' filename
O, con un poco diferente de salida:

Código:
lynx --dump filename
(el archivo debe tener htm [l] de extensión)

O el uso html2text

Última edición por radoulov; al 11-23-2007 12:17 PM..
  #3 (Enlace permanente)  
Old 11-23-2007
btech_raju
Guest
  
 

Mensajes: n / a
Bits: 0 [Banca]
Todos los comandos están haciendo bien,

sed -n'/^$/!{ s /<[^>]*>// g, p;) 'filename

Por favor, explique el por encima de sed comando

Gracias,
Thangaraju.

Última edición por btech_raju; al 11-23-2007 12:39 PM..
Closed Thread

Marcadores

Herramientas de hilo Buscar en este Hilo
Buscar en este Hilo:

Búsqueda avanzada
Modos de visualización Vota a este hilo
Vota a este hilo:

Normas de envío
puede que no nuevo puesto de hilos
puede que no enviar respuestas
puede que no enviar archivos adjuntos
puede que no editar sus puestos

Código BB es Encendido
Emoticones son Encendido
[IMG] código Apagado
Código HTML es Apagado
Trackbacks son Encendido
Pingbacks son Encendido
Refbacks son Encendido




Todas las horas son GMT -4. La hora es 02:56 AM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traducciones de idiomas Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Estudios
El UNIX y Linux Foros Contenido Copyright © 1993-2009. Todos los derechos Reserved.Ad Gestión por RedTyger

Las direcciones URL de contenido vBSEO 3.2.0