textutil: Das Tool für doc | html | txt | rtf | rtfd | wordml | webarchiv

Textutil ist ein schönes Beispiel dafür was beim Mac OS X Tiger so alles unter der Haube schlum­mert. Damit kann man so eben mal auf einen Rutsch z.B. aus diversen .txt-Dateien eine .doc-Datei machen. Oder eine .html-Datei in .txt umwan­deln. Oder sich ein par Infos zu den .Dateien anzeigen lassen, ohne sie alle zu öffnen.

Ich schreibe unter anderem gerne auf meiner Alphasmart Dana im Zug Artikel für den Textservice. Die spe­ichere ich direkt auf einer SD-Card (lei­der unter­stützt das Palm-Os/Programm nur Latin1). Wenn ich jetzt einen fer­ti­gen Artikel in eine Word-Datei mit der Schrift Arial in 12 pt kon­vertieren will, stecke ich die SD-Card in meinen USB-Kartenleser und gebe im Terminal fol­gen­des ein:

textutil -convert doc -inputencoding latin1 -font Arial -fontsize 12 /Volumes/SDCard/Pfad/zur/Datei.txt

Soll die Datei woan­ders abgelegt wer­den, kann ich auch -output ~/Desktop/NeueDatei.doc hinzufü­gen, um die Datei z.B. auf dem Schreibtisch able­gen zu lassen.

Hier ein paar weit­ere Beispiele, einige von mir, andere aus den manpages:

Von .doc zu .html textutil -convert html -encoding latin1 /Pfad/zur/datei.doc

Von latin1 codierter .html-Datei zu utf-8 codierter .txt-Datei textutil -convert txt -inputencoding latin1 -encoding utf-8 /Pfad/zur/datei.html

Informationen über foo.rtf abrufen textutil -info foo.rtf

Alle .rtf-Dateien im aktuellen Verzeichnis laden und als einzige index.html-Datei mit dem Titel «Several Files» aus­geben. textutil -cat html -title "Several Files" -output index.html *.rtf

Über frank

Vater von 4 Töchtern (mit 1 Frau), Creative Director, Texter, Journalist, Leser, Mac-Nerd, Jogger

14. September 2007 von frank
Kategorien: CLI, Freeware, Geek stuff, Mac, OsX, Praktisch, terminal, Tipps, Tricks, writing | Schlagwörter: , , , , , , , , | 2 Kommentare

Kommentare (2)

  1. hallo…

    ich hätte hierzu noch eine kleine bescheide frage.

    Wen ich *.doc Datein in *.txt umwan­del (was nach dieser Anleitung, super uns schnell funk­tion­iert) habe ich das Problem mit Umlauten, Intigrierten Links und Zeilenumbrüchen.

    Kann man da was machen?

    Hier mal ein Textauszug, als Beisiel:

    DOC-Datei:

    001 «Wir sprechen von Randgruppen — und welcher Rand ist damit gekennze­ich­net? Der Rand des Produktionsprozesses natür­lich. Die Vokabel erfaßt die Alten, die Asozialen, die Hilflosen, die Konsum– oder Produktionsverweigerer in dem Augenblick, wo sie, eben vom gesellschaftlichen Bulldozer erfaßt, an den Rand des zivil­isatorischen Müllbergs geschoben werden.»

    002 «Recycling‹ wurde zu einem flo­ri­eren­den Geschäft. Die Industrie kon­nte weiter in Massen pro­duzieren, nur standen jetzt überall Sammelbehälter rum.»

    .….

    TXT-DATEI

    001 «Wir sprechen von HYPERLINK «minderh.html«Randgruppen — und welcher Rand ist damit gekennze­ich­net? Der Rand des Produktionsprozesses natür­lich. Die Vokabel erfaßt die Alten, die AHYPERLINK «sozial.html«sozialen, die HYPERLINK «armut.html«Hilflosen, die HYPERLINK «konsum.html«Konsum– oder Produktionsverweigerer in dem Augenblick, wo sie, eben vom HYPERLINK «society.html«gesellschaftlichen Bulldozer erfaßt, an den Rand des zivil­isatorischen Müllbergs geschoben werden.»

    002 «HYPERLINK «natur.html«Recycling‹ wurde zu einem flo­ri­eren­den HYPERLINK «profit.html«Geschäft. Die Industrie kon­nte weiter in Massen pro­duzieren, nur standen jetzt überall Sammelbehälter rum.»

  2. Hmm, vielle­icht pro­bierst Du mal, die .doc Dateien erst in .html und diese dann in .txt umzuwandeln?

    Probleme mit Umlauten liegen an der Codierung des Textes. Da würde ich mal mit den ver­schiede­nen –encod­ing Einstellungen latin1 oder utf-8 rumprobieren.

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert

*