• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Es regnet, ist neblig und kalt, alle sind krank und der Chef wird zunehmend cholerisch. Das Thema des Monats ist also folgerichtig --> Das Grau(en)
    Wir sind gespannt, war Euch dazu einfällt! Zum Wettbewerb --> Klick

Wortliste aus Text erstellen ?

Wolfgang K.

Empire
Registriert
20.02.06
Beiträge
89
Hallo,
ich möchte gerne aus verschiedenen umfänglichen Fachtexten ( unter Word 2008)
die Worte als Liste erstellt haben,
um sie in Wörterbücher für die Word-Rechtschreibung eingeben zu können.

Für Windows scheint es einige wenige Programme zu geben,
aber für MAC finde ich einfach nichts..........???

Kann vielleicht jemand Helfen?
Gruß, WK
 

MacAlzenau

Golden Noble
Registriert
26.12.05
Beiträge
22.589
Vielleicht hilft es, nicht nach Programmen für Word-Dateien zu suchen. Wenn du die Texte als Nur-Text abspeicherst zum Durchsuchen, müsste sich das auch über das Terminal machen lassen - ich bin mir aber ziemlich sicher, daß es dafür dann kleine Progrämmchen gibt.
 

Wolfgang K.

Empire
Registriert
20.02.06
Beiträge
89
Die Suche ging nach" wortliste aus Text erstellen",
da kamen meist Progrämmchen, die aus verschiedenen Formaten auslesen können!
Aber wie gesagt, windowsbasiert.
Mit selbst erstellten Makros kenne ich mich leider nicht aus....
Trotzdem Danke,WK
 

Guy.brush

Weißer Winterkalvill
Registriert
15.12.08
Beiträge
3.545
Ein paar mehr Infos wären gut. Wie muss die Liste aussehen? Nummeriert? Deutsch/englische Texte?

Ich biete jetzt mal Perl an. So oder so ähnlich könnte das aussehen:

Code:
#!/usr/bin/perl -w
use strict;

my $input = shift;

open(FILE, $input);
my @file = <FILE>;

foreach(@file){
#hier alle auszuschliessenden Zeichen angeben, zwischen den ersten beiden / / und mit vorangestelltem \ 
	$_ =~ tr/\(\)\&\!\?\"\.\,\;\:\-\n\t\r/ /; 
	my @words = split(/ /, $_);

	foreach(@words){
		print $_ . "\n";
	}
}

Das in einen Texteditor kopieren und z.b. als words.pl speichern. Dann im Terminal (Ordner Dienstprogramme) in den Ordner des Skripts wechseln und aufrufen mit:
Code:
perl words.pl DieDateiMitDemText.txt
Oder als Liste in einer neuen Datei speichern:
Code:
perl words.pl DieDateiMitDemText.txt > DieNeueDatei.txt
Der Perl-Interpreter ist hoffentlich auch ohne die Developer Tools schon vorhanden (?). Den Text am besten als reine .txt Datei abspeichern. Ich weiß leider nicht wie es mit Umlauten aussieht, vielleicht weiß das jemand.
 

Wolfgang K.

Empire
Registriert
20.02.06
Beiträge
89
DAnke Guy.brush,

einfache Liste untereinander, Alphab. sortiert, Dubletten gelöscht, deutsch.
Genau das machen diese Progrämmchen.

Dein Vorschlag überfordert so leider meine Kenntnisse.

Es gibt wohl auch die Möglichkeit den Text als .txt in EXCEL zu importieren mit dem Befehl
Leerzeichen durch Absatz zu ersetzen.
Allerdings werden die Worte alle nebeneinander ausgegeben,
nicht sortiert, und Umlaute "ü" durch Ä1/4 ersetzt.....

Danke soweit, WK
 

docXter

Erdapfel
Registriert
02.02.08
Beiträge
5
Hallo,

das ist soweit recht einfach mit WOrd, Excel und einer Stoppwortliste (in Mac OS X enthalten oder frei im Web) möglich.
Den Text in Word laden. Leerzeichen in Absatzmarken ändern, Liste in Excel… -> Terminologieextraktion mit einfachen Mitteln

Ansonsten gibts im Bereich Termextraktion auch schon einiges für den Mac -> freies und kostenloses für Translator
Und Übersetzer finden professionelle Werkzeuge für Terminologieverwaltung, Translation Memory usw. in meiner kleinen Liste.

Gruss,
docXter