Discussion:
Text aus HTML extrahieren
(zu alt für eine Antwort)
Arno Schuh
2015-05-05 13:59:47 UTC
Permalink
Hi,

dunkel kann ich mich noch erinnern, dass ich unter DOS einmal ein Tool
hatte, womit man reinen Text aus einer HTML-Datei extrahieren konnte.
Vielleicht kann mir hier ja einer auf die Sprünge helfen.

Freundliche Grüße

Arno
Stefan Reuther
2015-05-05 16:37:24 UTC
Permalink
Post by Arno Schuh
dunkel kann ich mich noch erinnern, dass ich unter DOS einmal ein Tool
hatte, womit man reinen Text aus einer HTML-Datei extrahieren konnte.
Vielleicht kann mir hier ja einer auf die Sprünge helfen.
Welches Tool du hast, weiß ich natürlich nicht, aber mein erster
Anlaufpunkt für DOS-Software (neben "selbst in Perl was hacken") wäre
Garbo. Einer der ersten Suchtreffer:
ftp://ftp.lyx.org/pub/pc/garbo/pc/hypertext/
Hierin
ftp://ftp.lyx.org/pub/pc/garbo/pc/hypertext/htmlcon.zip
schaut zumindest der Überschrift nach passend aus.
HTMLCon Version 2.2 (September, 1995)
An HTM(L) to ASCII Document Converter
...ansonsten vielleicht eins der anderen Tools dort.


Stefan
Arno Schuh
2015-05-05 22:45:49 UTC
Permalink
Hi,

danke für den FTP-Server. Das war zwar nicht das Programm, das ich suchte,
aber die Liste hat mich wieder darauf gebracht. Das Programm hieß, glaube
ich, einfach View. Es war ein Textbetrachter, der u. a. auch HTML-Dateien
anzeigen konnte. Und über eine Batch ließen sich so ganze Ordner mit
HTML-Dateien in damals noch ASCII-Text konvertieren.
Mist, da hatte ich tatsächlich etwas falsches in Erinnerung.
Trotzdem noch mal vielen Dank für die Mühe!

Freundliche Grüße

Arno

Loading...