A Lean Localization Machine (XML Holland 2009)

Post on 24-Jun-2015

664 views 0 download

description

Presentation for XML Holland 2009 (available in Dutch only).

Transcript of A Lean Localization Machine (XML Holland 2009)

Lean Localization MachineMarc van Grootel (iCtrl)

XML User Group 12 November

“Publiceren in het tijdperk van Google, Apple en Amazon”

Lean Translation Machine

Het traditionele vertaalproces Welke uitdagingen zijn er beide de projecten van

vandaag en morgen? Is er een nieuwe visie nodig voor de vertaalprojecten

van morgen? Welke trends en vernieuwingen kunnen hierbij

uitkomst bieden? XML Internationalisatie en Localisatiestandaarden

Introductie 7+ jaren als localization engineer / engineering manager bij

Bowne Global Solutions / Lionbridge– Localisatieprojecten (oa. MS Office, MSN, Navision, MedTronic)– Integraties CMS met vertaalportaal (oa. Dupont, Robeco)– Kwaliteitsverbetering door automatisering van localisatieprocessen

3+ jaren als technisch consultant / ontwikkelaar / architect bij iCtrl

iCtrl is specialist in het creëren, vertalen, publiceren en beheren van productinformatie en procesbeschrijvingen

– Documentatiesystemen (oa. architectuur van NedTrain systeem)– Localisatieprojecten (oa. TomTom, Yamaha)– Documentatie migratie trajecten (oa. Vanderlande)– Implementatie Scrum (een Agile methodologie)

10+ jaren inzet van XML-technologieën Generaliserend specialist

Het traditionele vertaalproces1. XML bestandsanalyse (oa. validatie)

2. XML configuratie vertaaltool

3. Referentiemateriaal verzamelen en analyseren

4. Vertaling

5. Review (Editing, Proofing)

6. Review/approval door de klant

7. Linguistische en technische kwaliteitscontroles

8. Vertaalde XML bestanden leveren

De projecten van nu Veel meer XML, maar ook nog altijd veel MS Word en Framemaker.

– Slechte I18N vertaald zich in hogere kosten voor vertaling

Kleine volumes, veel kleine projecten, veel updates

– Hierdoor komen proces inefficiënties genadeloos aan het licht

Technische randvoorwaardende technische complexiteit van projecten is toegenomen.

– Grens tussen software / documentatie vervaagd

(bijvoorbeeld AJAX web-sites).

Verwachtingspatroon van de klant

– Klant wil meer inzicht in projecten

Hebben we een nieuwe visie nodig?

De traditionele aanpak van vertaalprojecten is niet langer meer houdbaar.

Traditionele aanpak zit echter nog ingebakken in veel tools en systemen.

Nieuwe informatie en communicatie technologie kan misschien oplossingen bieden.

Een visie die recente ontwikkelingen uit verschillende gebieden combineert kan ons hiervan losweken.

Zo’n visie kan richting geven aan de experimenten van vandaag en de oplossingen van morgen.

laat ik een poging wagen...

Het nieuwe vertaalplatform (i)

“binnen vijf jaar bestaan er vertaalsystemen die bestaan uit

een samenwerkingsplatform waarin alle betrokkenen

samenwerken om producten te vertalen, nadruk ligt hierbij

op communicatie tussen de teamleden. De werkwijze zal niet

afgedwongen worden door een rigide workflow en elke

vertaling (zin/paragraaf) kan individueel door het proces

‘stromen’.”

Het nieuwe vertaalplatform (ii)

“Het platform maakt gebruik van open standaarden en is

service-georiënteerd. Via het platform kunnen verschillende

services van derden naar behoefte gecombineerd worden.

Routinewerk is zoveel mogelijk geautomatiseerd zodat men

zich kan concentreren op het echte werk en

kwaliteitscontroles zijn in de processen ingebakken – in

plaats van door inspecties achteraf.”

Traditioneel team en workflow

Sequentiële workflow met veel handoff’s

Samenwerkingsplatform

Minder rigide workflow. Team verbonden door

moderne communicatietechnologie.

Het team werkt samen aan een project.

Werk ‘stroomt’ soepel door het systeem.

Trends en nieuwe ontwikkelingen

De vertaal gorilla’sZetten zwaar in op technologie, elk op hun eigen wijze.

... de ontwikkelingen gaan snel,en er zijn heel wat nieuwkomers die het goed doen.

SDL– Vertaaldiensten– Vertaalsystemen– Content Management – van vertaling naar content creatie

Lionbridge– Vertaaldiensten– Freeway platform, en nu Translation Workspace (GeoWorkz)– “U krijgt de tools en wij uw vertaalwerk”– Integraties met Content Management Systemen– Recentelijk ook gebruik als ‘pay-as-you-go’ platform voor andere vertalers

(PaaS)

Technologische vernieuwingen

Machinevertalingen Social Media / Social Networks Open Data / Data sharing (TAUS) Crowdsourcing Google Wave

Crowdsourcing Facebook (1 – 100 talen in 2 jaar), Twitter Is niet gratis: er is nog altijd PM, en supervisie nodig en

misschien zelfs vergoeding voor vertalers Is niet makkelijk, kun je genoeg vertalers aantrekken Bottom up model versus top down Levert interessante lessen en ervaringen op (de tijd zal

het leren) Een systeem dat geschikt is voor crowdsourcing past

perfect in de geschetste visie.

Google Wave?

Zeer interessant maar beetje gehyped. Misschien niet de volgende email Maar misschien wel specifieke toepassingen:

bijvoorbeeld review en proofreading

Ultimately a technology like Google Wave is probably best for specialized

situations where smaller-time collaboration is key, just as smaller groups in

the physical world often can get more done, faster, simultaneously than

larger ones.

Google Wave (ii)

Google Wave (iii)

XML Localization

Enabling technologies

XSLT 2.0 – XSL Transformations

XQuery / XML database– Mark Logic, Exist, Qizx en vele anderen– RDBMS met XML features

XProc – een XML pijplijn taal

Localisatie standaarden

Waarom zijn XML standaarden van belang?

Makkelijkere uitwisseling van gegevens

Makkelijkere conversies (XML als lingua franca)

Minder vatbaar voor lock-in door leveranciers en hun

producten

De localisatiestandaarden

ITS - Internationalization Tag Set– XML bestanden voorbereiden voor vertaling– Wat moet er vertaald worden

XLIFF – XML Localization Interchange Format– Het ‘vervoermiddel’ voor vertaalbestanden– Beter geschikt voor vertaling dan willekeurige XML– Vb. ITS regels bepalen de omzetting naar XLIFF

TMX – Translation Memory Exchange Format– De vertaaldatabase geschikt als referentiemateriaal om nieuwe

bestanden mee te vertalen TBX – Termbase Exchange Format GMX – Globalization Metrics

XML Internationalization best practices

I18N bepaalt voor een groot deel de kosten van vertaling.Een selectie: Vermijd vertaalbare attributen Vermijd menging van code en tekst Geef aan welke elementen wel/niet vertaald moeten worden Vermijd multilingual documents Specificeer de taal van de content Vermijd CDATA secties

Meer over dit onderwerp op de W3C web site

ITS: Internationalization Tag Set

W3C Recommendation 3 april 2007 Nog geen brede ondersteuning

TMX: Translation Memory eXchange Lisa – the Localization Industry Standards Assocation Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)

TMX: Translation Memory eXchange Lisa – the Localization Industry Standards Assocation Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)

Wat is XLIFF?

OASIS – 1.1 October 2003, 1.2 February 2008

Inmiddels brede ondersteuning

Interoperabiliteit echter nog lastig

Een XLIFF document bevat:

– Vertaalsegmenten met bron tekst en doel tekst

– Alternatieve vertalingen (bijv. fuzzy matches of vertalingen uit

eerdere fases)

– Administratieve metadata

– Proces metadata

– Vertaal instructies, opmerkingen

Een gestandaardiseerde manier om vertaalbare informatie als XML op te slaan.

XML Localization Interchange File Format

XML Localization Interchange File Format

XML Localization Interchange File Format

XML Localization Interchange File Format

Van XML naar XLIFF en terug

Bron XML wordt opgesplitst in onvertaalbare (Skelet) en vertaalbare informatie (XLIFF)

De vertaalde XLIFF wordt samengevoegd met het Skelet om de vertaalde XML te verkrijgen.

BronXMLBronXML

vertaaldexml

vertaaldexml

XLIFFXLIFFSkeletSkeletXLIFFXLIFF

XLIFFXLIFF

vertaaldexml

vertaaldexmlVertaalde

XMLVertaalde

XML

XLIFF als spil van het vertaalproces

Vertaalbestanden , Review spreadsheets, vertaalgeheugens worden uit XLIFF gegenereerd.

Vertalingen, correcties en andere informatie worden weer in de XLIFF opgeslagen.

XLIFFXLIFF

Vertaalgeheugens(TMX)

Vertaalgeheugens(TMX)

TagEditor(TTX)

TagEditor(TTX)

Excel(XLS)Excel(XLS)

een XML/XLIFF toepassingiCtrl

Project Managers,Language Engineering

Vertalers

Reviewers

Klant

Bron XMLBron XML

Vertaalde XMLVertaalde XMLVertaalde XMLVertaalde XML

Vertaalde XMLVertaalde XML

Vertalingen in XLS

Vertalingen in XLSVertalingen in

XLSVertalingen in

XLSVertalingen in XLS

Vertalingen in XLS

SkeletSkeletSkeletSkelet

XLIFFXLIFF

SkeletSkelet

SkeletSkeletSkeletSkeletVertaal-

geheugensVertaal-

geheugens

SkeletSkeletSkeletSkeletCorrectie

spreadsheetsCorrectie

spreadsheets

SkeletSkeletSkeletSkelet

Trados TTXTrados TTX

XML Database

Links

iCtrl Wiki over localization standards (in aanbouw) XML Internationalization best practices XML Localization Interchange format (XLIFF) Translation Memory eXchange (TMX) Internationalization Tag Set (ITS)