. Pero quiero extraer sólo" /> ¿Cómo extraer sólo el texto de archivo html sin etiqueta HTML - Los Foros UNIX y Linux
The UNIX and Linux Forums  

Go Back   El UNIX y Linux Foros > Arriba Foros > UNIX for Dummies Preguntas y Respuestas
.
google unix.com



UNIX for Dummies Preguntas y Respuestas Si no está seguro de que para publicar un UNIX o Linux cuestión, puesto que aquí. Todos los novatos en Linux, UNIX y bienvenida!

Más UNIX y Linux Foro Temas usted puede encontrar útiles
Hilo Hilo para principiantes Foro Respuestas Último mensaje
extraer datos de tablas html Streetrcr UNIX for Dummies Preguntas y Respuestas 8 03-20-2008 06:14 AM
html coverting datos a texto en 'c' phani_sree Programación de Alto Nivel 3 10-18-2007 11:06 AM
Mensaje HTML con archivo adjunto (archivo de texto) Felix2511 UNIX for Dummies Preguntas y Respuestas 2 09-12-2007 03:59 AM
html - archivo de texto pregunta frustrated1 Programación de scripts de shell y 5 09-21-2005 06:23 AM
unix vincular archivo de texto generado a página html alexd Programación de scripts de shell y 1 11-13-2002 12:21 PM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
Linkback vínculo Herramientas de hilo Buscar en este Hilo Tasa de Hilo Modos de visualización
  #1 (Enlace permanente)  
Old 09-20-2005
los111 los111 is offline
Usuario Registrado
  
 

Fecha: Sep 2005
Publicaciones: 2
¿Cómo extraer sólo el texto de archivo html sin etiqueta HTML

Tengo un archivo html llamado miarchivo. Si yo simplemente "gato miarchivo.html" en UNIX, que muestra todas las etiquetas HTML, como <a href\u003dr/26> <img src\u003d"http://www>. Pero quiero extraer sólo parte de texto.

Mismo problema ocurre en el "tipo" en el comando de MS-DOS.

Sé que puede hacerlo mediante la apertura en Internet Explorer y, a continuación, "guardar como texto", a continuación, abra de nuevo. Pero tengo que hacerlo de UNIX, como he miles de archivos html y no tienen tiempo para convertir a archivos de texto, uno por uno. Fui a través de muchos libros, pero no puede encontrar un camino. Yo realmente agradezco su ayuda.
  #2 (Enlace permanente)  
Old 09-20-2005
LanceBoyles LanceBoyles is offline
Usuario Registrado
  
 

Fecha: Sep 2005
Puestos: 8
Con el uso Lynx - volcado de opción, así:

Lince - volcado miarchivo.html> miarchivo.txt

O

Lince - vertedero http://some.where.com/whatever.html > Miarchivo.txt

Puede escribir un script de shell que lo hará por muchos archivos sin tener que tocarlo.
  #3 (Enlace permanente)  
Old 09-20-2005
los111 los111 is offline
Usuario Registrado
  
 

Fecha: Sep 2005
Publicaciones: 2
gracias

¡Muchas gracias! Voy a tratar esto. Nunca he usado antes de lince, pero espero mi Fedora Core ya la tiene.
  #4 (Enlace permanente)  
Old 11-28-2007
ali560045's Avatar
ali560045 ali560045 is offline
Usuario Registrado
  
 

Fecha: octubre 2007
Puestos: 328
mismo problema

Tengo un script llamado archivo1 en ksh

#! / bin / ksh

gato my.html

---------------------------
y un archivo html hy.html

u puede decirme que si i ejecutar "archivo1" script se abrirá hy.html bt aquí se muestran todas las etiquetas, junto con el texto .........

debe abrir el navegador sólo parte .......

PLZ ayuda, cualquier comando
  #5 (Enlace permanente)  
Old 11-28-2007
infyanurag infyanurag is offline
Usuario Registrado
  
 

Fecha: noviembre 2007
Puestos: 65
Cita:
Publicado originalmente por LanceBoyles View Post
Con el uso Lynx - volcado de opción, así:

Lince - volcado miarchivo.html> miarchivo.txt

O

Lince - vertedero http://some.where.com/whatever.html > Miarchivo.txt

Puede escribir un script de shell que lo hará por muchos archivos sin tener que tocarlo.
hola

i no se puede obtener el lince comando en linux.
¿Qué debo hacer?
Closed Thread

Marcadores

Herramientas de hilo Buscar en este Hilo
Buscar en este Hilo:

Búsqueda avanzada
Modos de visualización Vota a este hilo
Vota a este hilo:

Normas de envío
puede que no nuevo puesto de hilos
puede que no enviar respuestas
puede que no enviar archivos adjuntos
puede que no editar sus puestos

Código BB es Encendido
Emoticones son Encendido
[IMG] código Encendido
Código HTML es Apagado
Trackbacks son Encendido
Pingbacks son Encendido
Refbacks son Encendido




Todas las horas son GMT -4. La hora es 02:38 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traducciones de idiomas Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Estudios
El UNIX y Linux Foros Contenido Copyright © 1993-2009. Todos los derechos Reserved.Ad Gestión por RedTyger

Las direcciones URL de contenido vBSEO 3.2.0