Zur Abwechslung mal ein kurzer Blog-Eintrag auf Deutsch, weil er sich auf einen deutschen Artikel bezieht, nämlich diesen hier:
http://www.spiegel.de/spiegel/0,1518,691364,00.html
Kurz gesagt: Google Translation ist super-duper toll und innovativ, weil die nämlich alles nur noch statistisch auf ihrem Korpus machen und nicht mehr mit Regeln, wie alle anderen.
Äh ja – wie alle anderen? Das ist mir nu wiederum neu, ich hätte ja behauptet, dass seit vor Babelfisch niemand mehr ein ernstzunehmendes Übersetzungsprogramm ohne statistischen Ansatz entwickelt. Sicher nicht rein statistisch – aber genau das ist ja das Problem von Google Translate. Es gibt nun mal in jeder Sprache irgendwelche unveränderlichen Regeln, und wenn man die zusätzlich zur Statistik verwendet, sind die Ergebnisse gar nicht mal so übel. Statistik komplett ohne Regeln ist aber weder innovativ noch sinnvoll.
Ich benutze in letzter Zeit recht häufig das Google Translator Toolkit (und füttere damit nebenbei natürlich die Datenspeicher von Google, aber das ist ja nicht schlimm). Es funktioniert für Norwegisch nach Englisch wunderbar – da gibt es offenbar genügend Daten. Allerdings lernt es eigentlich nicht – ganze Sätze werden zwar gespeichert bzw. aufgenommen, so dass sie bei einer weiteren Übersetzung des gleichen Satzes gleich vorübersetzt werden. Aber wie oft begegnet man denn bitte schön identischen Sätzen? Wichtig wäre es, dass einzelne Phrasen gefunden werden. Das passiert aber nicht…
Weiterer Nachteil: Wenn ich von Norwegisch nach Deutsch übersetze, ist das Ergebnis grauenvoll. Warum? Weil die Übersetzung nämlich über eine automatisch Übersetzung ins Englische läuft! Anstatt also einen Korpus Norwegisch-Deutsch aufzubauen, wird der Text erstmal durch die Übersetzung ins Englische verhackstückelt, womit natürlich bei der Übersetzung ins Deutsche nichts Brauchbares rauskommen kann. Und übrigens wird für die Übersetzung ins Englische nicht mal die Version verwendet, die ich kurz vorher selbst in Google Translate bearbeitet habe…
Kurz gesagt: Der Ansatz ist sicherlich verfolgenswert, aber nichts total Neues und Innovatives (auch nicht, weil Google drauf steht!), und ausgereift sind die Tools auch noch lange nicht.
Wer aber den Übersetzungsansatz “mal gucken, wie andere das sagen” sinnvoll findet, dem sei www.linguee.com ans Herz gelegt. Die Datenbank ist zwar sicher nicht so groß wie die von Google und leider gibt es auch nur das Sprachpaar Englisch-Deutsch, aber dafür kann man in die Datenbank reingucken. Genauer gesagt ist genau das der Sinn der Seite – einfach eine Phrase eingeben und gucken, wie sowas denn von anderen übersetzt wurde.
Und wenn man daraus dann mithilfe einiger Regeln einen ganzen Text zusammenbasteln würde, dann wäre man genau da, wo Google hin will. Aber ganz ohne Menschen geht es halt nicht…
Endlich merkt jemand außer uns, dass Google den Interlingua-Trick zum Übersetzen verwendet. Hier beschreiben wir an einem Beispiel wie der Google-Übersetzer arbeitet: http://www.linguatools.de/blog/?p=102