. Aber ich möchte nur, um die" /> Wie kann ich Nur-Text-Auszug aus der HTML-Datei ohne HTML-Tag - Die UNIX-und Linux-Foren
The UNIX and Linux Forums  


Go Back   Die UNIX-und Linux-Foren > Top Foren > UNIX for Dummies Questions & Answers
.
Google unix.com



UNIX for Dummies Questions & Answers Wenn Sie nicht sicher sind, wo Sie eine UNIX-oder Linux-Frage, post it here. Alle UNIX-und Linux-Anfänger willkommen!

Mehr UNIX-und Linux-Forum Themen Vielleicht finden Sie hilfreiche
Faden Thread Starter Forum Antworten Last Post
Extrahieren von Daten aus HTML-Tabellen Streetrcr UNIX for Dummies Questions & Answers 8 03-20-2008 06:14 AM
coverting HTML-Daten zum Text in "C" phani_sree High-Level-Programmierung 3 10-18-2007 11:06 AM
HTML-Nachricht mit Anhang (Text-Datei) Felix2511 UNIX for Dummies Questions & Answers 2 09-12-2007 03:59 AM
HTML - Text-Datei Frage frustrated1 Shell Programmierung und Scripting 5 09-21-2005 06:23 AM
Verknüpfung von Unix-Text-Datei, die Sie in die HTML-Seite alexd Shell Programmierung und Scripting 1 11-13-2002 12:21 PM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Suche diesen Thread Rate Thread Anzeige-Modi
  #1 (permalink)  
Old 09-20-2005
los111 los111 is offline
Registrierte Nutzer
  
 

Join Date: Sep 2005
Beiträge: 2
Wie kann ich Nur-Text-Auszug aus der HTML-Datei ohne HTML-Tag

Ich habe eine HTML-Datei mit dem Namen myfile. Wenn ich einfach "cat myfile.html" in UNIX, es zeigt alle HTML-Tags wie <a href\u003dr/26> <img src\u003d"http://www>. Aber ich möchte zu extrahieren nur Textteil.

Diese Problem tritt in der "Art"-Befehl in MS-DOS.

Ich weiß, Sie können es, indem Sie es in Internet Explorer, dann "Speichern als Text", dann öffnen Sie es erneut. Aber ich muss dies von UNIX, wie ich bereits Tausende von HTML-Dateien und haben keine Zeit zu wandeln sie in die Text-Dateien eine nach der anderen. Ich ging durch viele Bücher, aber nicht einen Weg finden. Ich würde wirklich zu schätzen Ihre Hilfe.
  #2 (permalink)  
Old 09-20-2005
LanceBoyles LanceBoyles is offline
Registrierte Nutzer
  
 

Join Date: Sep 2005
Beiträge: 8
Verwenden Sie mit dem Lynx - Dump-Option wie folgt aus:

lynx - dump myfile.html> myfile.txt

ODER

lynx - dump http://some.where.com/whatever.html > Myfile.txt

Sie können ein Shell-Skript, wird dies für viele Dateien, ohne dass Sie es zu berühren.
  #3 (permalink)  
Old 09-20-2005
los111 los111 is offline
Registrierte Nutzer
  
 

Join Date: Sep 2005
Beiträge: 2
Danke

Thanks a lot! Ich werde versuchen diese. Ich habe selber nie Luchs vor, aber ich hoffe, dass meine Fedora Core noch nicht vorliegen.
  #4 (permalink)  
Old 11-28-2007
ali560045's Avatar
ali560045 ali560045 is offline
Registrierte Nutzer
  
 

Join Date: Oct 2007
Beiträge: 328
gleiche Problem

Ich habe ein Skript in ksh genannten Datei1

#! / bin / ksh

Katze my.html

---------------------------
und eine HTML-Datei hy.html

u kann mir sagen, dass, wenn ich ausführen "datei1"-Skript wird geöffnet hy.html BT hier ist es mit der alle Tags mit Text .........

Es sollte den Browser öffnen, nur .......

plz helfen, einen Befehl
  #5 (permalink)  
Old 11-28-2007
infyanurag infyanurag is offline
Registrierte Nutzer
  
 

Join Date: Nov 2007
Beiträge: 65
Zitat:
Zitat von LanceBoyles View Post
Verwenden Sie mit dem Lynx - Dump-Option wie folgt aus:

lynx - dump myfile.html> myfile.txt

ODER

lynx - dump http://some.where.com/whatever.html > Myfile.txt

Sie können ein Shell-Skript, wird dies für viele Dateien, ohne dass Sie es zu berühren.
Hi

Ich kann nicht der Luchs-Kommando unter Linux.
Was soll ich tun?
Closed Thread

Lesezeichen

Thread Tools Suche diesen Thread
Suche diesen Thread:

Erweiterte Suche
Anzeige-Modi Rate this thread
Rate this thread:

Forumregeln
Du möglicherweise nicht neue Themen
Du möglicherweise nicht nach Antworten
Du möglicherweise nicht post-Anlagen
Du möglicherweise nicht bearbeiten Sie Ihre Beiträge

BB-Code ist Auf
Smilies sind Auf
[IMG] Code Auf
HTML-Code ist Aus
Trackbacks sind Auf
Pingbacks sind Auf
Refbacks sind Auf




Alle Zeiten sind GMT -4. Es ist jetzt 01:31 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Ltd. Sprachliche Übersetzungen Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
Die UNIX-und Linux-Foren Content © Copyright 1993-2009. Alle Rechte Reserved.Ad Management von RedTyger

Content Relevant URLs durch vBSEO 3.2.0