Translate.Wonk Produkte

Generische Übersetzer kennen Ihre Marke nicht

DeepL, Google, ChatGPT: Text rein, Text raus. Klingt gut, liest sich flüssig. Bis es konkret wird:

„The farmer looks at his field." Google macht daraus „Der Bauer schaut auf das Schlachtfeld", weil „field" beides heißen kann. Im Agrarkontext eines unserer Kunden ein Totalschaden.

Oder: Im Corporate-Wording steht „Mitarbeitende", generische Übersetzer machen daraus mal „Angestellte", mal „Kollegen", über 25 Sprachen unbewacht.

Das passiert systematisch. Generische Modelle sind auf Milliarden Texten trainiert, aber nicht auf Ihren. Sie kennen weder Ihre Fachterminologie noch Ihre Produktnamen noch Ihren Styleguide.

Die Alternative ist meist genauso unschön: Klassische Übersetzungsdienstleister mit 0,15 €/Wort, 4 bis 6 Wochen pro Sprache, kaskadierend bei Mehrsprachigkeit.

Translate.Wonk: trainiert auf Ihre Markensprache

Wir nehmen, was Sie schon haben: Translation-Memories, Glossare, bestehende Website-Übersetzungen, CMS-Exporte. Daraus trainieren wir ein Modell, das Ihre Markensprache spricht. Keine generische DeepL-Variante, sondern ein eigenes Modell für Ihren Wortschatz, Ihre Tonalität, Ihre Produktnamen.

Was Translate.Wonk anders macht:

Trainiert auf Ihren Daten: TMS, Glossare und bestehende Übersetzungen werden zur Trainingsbasis.
Mehrere Modell-Stränge: Azure Custom Translator für Standardanwendungen, OpenAI/Claude/Open-Source-Feintuning für komplexe Domänen.
Direkt in Ihren Systemen: API-Anbindung an CMS, PIM, Office; Webfrontend für ad-hoc-Übersetzungen.
Hosting nach Wahl: Azure (Deutschland/Europa), Private Cloud oder On-Premise.

Konkrete Zahlen aus laufenden Projekten:

50 % schnellere Time-to-Market gegenüber klassischen Übersetzungsprozessen (Referenz: 4 bis 6 Wochen pro Sprache)
80 % geringere Kosten als klassische Übersetzung à 0,15 €/Wort
70 % der Sätze besser als DeepL im Blindtest auf Kundendomäne (BERT-Score-Auswertung, 2.500 Datensätze)

Für wen lohnt sich das?

Translate.Wonk passt, wenn:

Sie Millionen Wörter übersetzen, neu oder als laufende Aktualisierung
Sie in fünf oder mehr Sprachen veröffentlichen
Sie Website-, CMS- oder Produktinhalte pflegen (oft ≥ 400 Seiten à ~500 Wörtern pro Sprache)
Sie Länder-Rollouts in Monaten machen wollen, nicht in Halbjahren
Sie Markensprache ernst meinen und Übersetzungen nicht mit „passt schon" durchwinken

So wird das Modell trainiert

Phase	Inhalt
01 Datenaustausch	Sprachenliste, Zugang zu Datenquellen (TMS, CMS, Glossare, Dokumente)
02 Data Checkup	Qualität und erreichbare Sprachpaare prüfen
03 Tester	Festlegen der internen Prüfer:innen aus Fachabteilungen
04 Training	Extraktion, Bereinigung, Modelltraining
05 Evaluation	Blindbewertung gegen DeepL, Referenzübersetzung und Ist-Zustand
06 Inbetriebnahme	Webfrontend und API in Ihrer Systemlandschaft

Der Prozess dauert in der Regel zwei bis vier Wochen.

Qualität wird gemessen, nicht behauptet

Nach dem Training bekommen Ihre Stakeholder eine eigene Evaluationsumgebung. Übersetzungen werden dort blind bewertet: gegen DeepL, gegen die bisherige Referenz, gegen den Ist-Zustand. Die Tester wissen nicht, welche Variante von wem stammt.

Methodisch kombinieren wir:

Automatische Metriken (BERT-Score) für schnelle Vorab-Auswertung
Human Evaluation durch Fachexpert:innen, auf Satzebene, nicht in Volltexten. Das ist akzeptabler und schneller bewertbar als ganze Texte.

Fällt die Bewertung noch nicht positiv aus, ist das transparent: meist liegt es an zu wenigen Trainingsdaten oder einem schwachen Grundmodell. Mit gezielter Datennachlieferung lässt sich das verbessern.

Technik und Integration

Bereich	Formate / Schnittstellen
Web & CMS	`.xml`, `.xliff`, JSON, formatgetreu
Office	Word, Excel, PowerPoint mit erhaltener Formatierung
PDF & Druck	Fertig gesetzte PDFs in Zielsprachen, Layout bleibt
InDesign	IDML-Inhalte editierbar im gewohnten Workflow
Glossare & Stop-Words	Wortentsprechungen und Eigennamen gezielt steuern
API	Anbindung an CMS, Shops, PIM, DAM, Translation Studio
Webfrontend	Für ad-hoc-Übersetzungen ohne System-Integration
Hosting	Azure (DE/EU), Private Cloud, On-Premise

Sicherheit: APIs und Rechenzentren in Europa bzw. Deutschland, Verschlüsselung nach Industriestandard. Kundendaten werden nicht für fremde Trainings außerhalb Ihres Kontexts verwendet.

Im Einsatz bei

MULTIVAC

Verpackungs- und Verarbeitungslösungen für Lebensmittel, Medizin- und Pharmaprodukte. 7.000 Mitarbeitende, 84 Standorte, aktiv in 160 Ländern.

„Mit wonk.ai haben wir einen Rollout geschafft, der sonst nicht live gegangen wäre. So konnten wir die Ziele unseres Management-Teams erfüllen."

Thomas Rau, Teamleiter Online Marketing

KWS SAAT SE

Börsennotiertes Pflanzenzüchtungs- und Biotechnologieunternehmen, viertgrößter Saatgutproduzent weltweit. Über 5.000 Mitarbeitende.

„Wir behalten die Hoheit über die KWS-Modelle in unserem eigenen Azure-Tenant und erfüllen so unsere Datenschutz- und Compliance-Anforderungen."

Nils Busse, Leiter Expert Hub IT Applications

FAQ

On-Premise? Ja. Standard ist Microsoft Azure in Deutschland. Private Cloud und On-Premise mit GPU-Hardware sind nach Anforderungsanalyse möglich.

Sprachen? In bisherigen Projekten bis zu 40 Sprachen abgedeckt, technisch sind über 100 Sprachpaare machbar. Wir prüfen Ihre Liste vor Projektstart.

Systeme? API-Anbindung an CMS, Shops, PIM, Office, DAM. Webfrontend für systemübergreifende Nutzung.

Welche Daten brauchen wir fürs Training? Satzpaare aus Websites, Publikationen, Translation-Memories, Glossaren und weiteren Formaten. Der Data Checkup zeigt, welche Mengen und Qualitäten verfügbar sind.

TMS noch nötig? Trainierte Modelle bündeln Übersetzungswissen und Proofreading-Feedback. Für viele Anwendungsfälle ersetzt das einen klassischen TMS-Ansatz.

Kosten im Betrieb? Abhängig von Sprachmodellen und jährlichem Wortvolumen. In der Praxis durchgehend deutlich unter den 0,15 €/Wort klassischer Übersetzungsdienstleister.

Wo geht's los?

Erstes Gespräch: Welche Sprachen, welche Datenmengen, welche Systeme. Daraus wird ein Data Checkup, und wenn die Grundlage passt, ein Trainingsprojekt von zwei bis vier Wochen.