Translate.Wonk
Maschinelle Übersetzung, trainiert auf Ihrer Unternehmenssprache: Glossare, Translation-Memories und Website-Inhalte als Grundlage. Schneller und günstiger als klassische Übersetzung, qualitativ über generischen Modellen wie DeepL oder ChatGPT.
Generische Übersetzer kennen Ihre Marke nicht
DeepL, Google, ChatGPT: Text rein, Text raus. Klingt gut, liest sich flüssig. Bis es konkret wird:
„The farmer looks at his field." Google macht daraus „Der Bauer schaut auf das Schlachtfeld", weil „field" beides heißen kann. Im Agrarkontext eines unserer Kunden ein Totalschaden.
Oder: Im Corporate-Wording steht „Mitarbeitende", generische Übersetzer machen daraus mal „Angestellte", mal „Kollegen", über 25 Sprachen unbewacht.
Das passiert systematisch. Generische Modelle sind auf Milliarden Texten trainiert, aber nicht auf Ihren. Sie kennen weder Ihre Fachterminologie noch Ihre Produktnamen noch Ihren Styleguide.
Die Alternative ist meist genauso unschön: Klassische Übersetzungsdienstleister mit 0,15 €/Wort, 4 bis 6 Wochen pro Sprache, kaskadierend bei Mehrsprachigkeit.
Translate.Wonk: trainiert auf Ihre Markensprache
Wir nehmen, was Sie schon haben: Translation-Memories, Glossare, bestehende Website-Übersetzungen, CMS-Exporte. Daraus trainieren wir ein Modell, das Ihre Markensprache spricht. Keine generische DeepL-Variante, sondern ein eigenes Modell für Ihren Wortschatz, Ihre Tonalität, Ihre Produktnamen.
Was Translate.Wonk anders macht:
- Trainiert auf Ihren Daten: TMS, Glossare und bestehende Übersetzungen werden zur Trainingsbasis.
- Mehrere Modell-Stränge: Azure Custom Translator für Standardanwendungen, OpenAI/Claude/Open-Source-Feintuning für komplexe Domänen.
- Direkt in Ihren Systemen: API-Anbindung an CMS, PIM, Office; Webfrontend für ad-hoc-Übersetzungen.
- Hosting nach Wahl: Azure (Deutschland/Europa), Private Cloud oder On-Premise.
Konkrete Zahlen aus laufenden Projekten:
- 50 % schnellere Time-to-Market gegenüber klassischen Übersetzungsprozessen (Referenz: 4 bis 6 Wochen pro Sprache)
- 80 % geringere Kosten als klassische Übersetzung à 0,15 €/Wort
- 70 % der Sätze besser als DeepL im Blindtest auf Kundendomäne (BERT-Score-Auswertung, 2.500 Datensätze)
Für wen lohnt sich das?
Translate.Wonk passt, wenn:
- Sie Millionen Wörter übersetzen, neu oder als laufende Aktualisierung
- Sie in fünf oder mehr Sprachen veröffentlichen
- Sie Website-, CMS- oder Produktinhalte pflegen (oft ≥ 400 Seiten à ~500 Wörtern pro Sprache)
- Sie Länder-Rollouts in Monaten machen wollen, nicht in Halbjahren
- Sie Markensprache ernst meinen und Übersetzungen nicht mit „passt schon" durchwinken
So wird das Modell trainiert
| Phase | Inhalt |
|---|---|
| 01 Datenaustausch | Sprachenliste, Zugang zu Datenquellen (TMS, CMS, Glossare, Dokumente) |
| 02 Data Checkup | Qualität und erreichbare Sprachpaare prüfen |
| 03 Tester | Festlegen der internen Prüfer:innen aus Fachabteilungen |
| 04 Training | Extraktion, Bereinigung, Modelltraining |
| 05 Evaluation | Blindbewertung gegen DeepL, Referenzübersetzung und Ist-Zustand |
| 06 Inbetriebnahme | Webfrontend und API in Ihrer Systemlandschaft |
Der Prozess dauert in der Regel zwei bis vier Wochen.
Qualität wird gemessen, nicht behauptet
Nach dem Training bekommen Ihre Stakeholder eine eigene Evaluationsumgebung. Übersetzungen werden dort blind bewertet: gegen DeepL, gegen die bisherige Referenz, gegen den Ist-Zustand. Die Tester wissen nicht, welche Variante von wem stammt.
Methodisch kombinieren wir:
- Automatische Metriken (BERT-Score) für schnelle Vorab-Auswertung
- Human Evaluation durch Fachexpert:innen, auf Satzebene, nicht in Volltexten. Das ist akzeptabler und schneller bewertbar als ganze Texte.
Fällt die Bewertung noch nicht positiv aus, ist das transparent: meist liegt es an zu wenigen Trainingsdaten oder einem schwachen Grundmodell. Mit gezielter Datennachlieferung lässt sich das verbessern.
Technik und Integration
| Bereich | Formate / Schnittstellen |
|---|---|
| Web & CMS | .xml, .xliff, JSON, formatgetreu |
| Office | Word, Excel, PowerPoint mit erhaltener Formatierung |
| PDF & Druck | Fertig gesetzte PDFs in Zielsprachen, Layout bleibt |
| InDesign | IDML-Inhalte editierbar im gewohnten Workflow |
| Glossare & Stop-Words | Wortentsprechungen und Eigennamen gezielt steuern |
| API | Anbindung an CMS, Shops, PIM, DAM, Translation Studio |
| Webfrontend | Für ad-hoc-Übersetzungen ohne System-Integration |
| Hosting | Azure (DE/EU), Private Cloud, On-Premise |
Sicherheit: APIs und Rechenzentren in Europa bzw. Deutschland, Verschlüsselung nach Industriestandard. Kundendaten werden nicht für fremde Trainings außerhalb Ihres Kontexts verwendet.
Im Einsatz bei
MULTIVAC
Verpackungs- und Verarbeitungslösungen für Lebensmittel, Medizin- und Pharmaprodukte. 7.000 Mitarbeitende, 84 Standorte, aktiv in 160 Ländern.
„Mit wonk.ai haben wir einen Rollout geschafft, der sonst nicht live gegangen wäre. So konnten wir die Ziele unseres Management-Teams erfüllen."
Thomas Rau, Teamleiter Online Marketing
KWS SAAT SE
Börsennotiertes Pflanzenzüchtungs- und Biotechnologieunternehmen, viertgrößter Saatgutproduzent weltweit. Über 5.000 Mitarbeitende.
„Wir behalten die Hoheit über die KWS-Modelle in unserem eigenen Azure-Tenant und erfüllen so unsere Datenschutz- und Compliance-Anforderungen."
Nils Busse, Leiter Expert Hub IT Applications
FAQ
On-Premise? Ja. Standard ist Microsoft Azure in Deutschland. Private Cloud und On-Premise mit GPU-Hardware sind nach Anforderungsanalyse möglich.
Sprachen? In bisherigen Projekten bis zu 40 Sprachen abgedeckt, technisch sind über 100 Sprachpaare machbar. Wir prüfen Ihre Liste vor Projektstart.
Systeme? API-Anbindung an CMS, Shops, PIM, Office, DAM. Webfrontend für systemübergreifende Nutzung.
Welche Daten brauchen wir fürs Training? Satzpaare aus Websites, Publikationen, Translation-Memories, Glossaren und weiteren Formaten. Der Data Checkup zeigt, welche Mengen und Qualitäten verfügbar sind.
TMS noch nötig? Trainierte Modelle bündeln Übersetzungswissen und Proofreading-Feedback. Für viele Anwendungsfälle ersetzt das einen klassischen TMS-Ansatz.
Kosten im Betrieb? Abhängig von Sprachmodellen und jährlichem Wortvolumen. In der Praxis durchgehend deutlich unter den 0,15 €/Wort klassischer Übersetzungsdienstleister.
Wo geht's los?
Erstes Gespräch: Welche Sprachen, welche Datenmengen, welche Systeme. Daraus wird ein Data Checkup, und wenn die Grundlage passt, ein Trainingsprojekt von zwei bis vier Wochen.