Case-study: thelanguageindustry.eu - #jd15nl

Post on 16-Jul-2015

265 views 0 download

Transcript of Case-study: thelanguageindustry.eu - #jd15nl

thelanguageindustry.eude grenzen van de meertaligheid binnen Joomla! afgetast

<menu> Wie is Dries?

Wie is Bart?

Een woordje over de taalsector & De Taalsector

Huwelijk tussen Joomla! en Drupal – de wondere wereld van CrossLang

Onder de motorkap van onze Joomla! installatie

Een paar tweaks waren nodig …

Toekomstvisie

</menu>

Wie is Dries?

Dries Debackere

Consultant (www.driesdebackere.com)

Begon een paar jaar geleden te spelen met het idee van een taalsector (language industry), in de zin van de sector voor iedereen die met taalwerk en taalgerelateerd werk zijn brood verdient > taalprofessionals.

Aanstoker

Wie is Bart?

• Afgestudeerd als Licentiaat Tolk.• Sinds 2002 werkzaam in de IT-sector.• Voorliefde voor alles wat met web en internet te maken

heeft.• Actief bezig met Jooma! sinds 2007 .• Maakt regelmatig een zijsprong richting Drupal &

Wordpress.• Niet alleen bezig met ontwikkeling maar ook met

systeembeheer.

En … vader van twee dochters die ik goed probeer op te voeden.

Een blik op de taalsectorPast, present & future

Een blik op de taalsector / De Taalsector

Wat is de taalsector? Wie is de taalsector?

Historiek De Taalsector:

1 artikel > 2 artikelen > knippen & plakken in Word > pdf-magazine

Van Word naar cms: taalsector.be / taalsector.nl op joomla 1.5 -> migratie naar joomla 2.5 (met betaalmuur)

1 taal > 24 talen = thelanguageindustry.eu

Volume: meer dan 3000 artikelen

Volume thelanguageindustry.eu: meer dan 3000 artikelen in x talen

De wondere wereld van CrossLang

een huwelijk tussen joomla! en Drupal

CrossLang Gateway

• Gent • innovatieve taaltechnologie• multi-translation-engine: verschillende vertaalengines (MT)

aanspreken binnen eenzelfde vertaalproject• toepassing ontwikkeld rond Drupal• biedt REST API

CrossLang Gateway

Waarom niet 1 MT-engine of Google Translate on the fly?

• Content is mix van1. original content, 2. human translation, 3. raw machine translation, 4. human assisted machine translation,5. machine assisted human translation

• postediteren moet bij ons• vertaalgeheugen moet bij ons• intellectueel eigendomsrecht moet bij auteur / post-editor blijven• thelanguageindustry.eu = neutraal > scala aan MT-engines laten zien

Onder de motorkapvan een v12 biturbo joomla! quattro

Een paar statistieken

Momenteel 150,000 records in de falang_content table

16 talen actief

106 gepostediteerde artikelen

54112 vertalingen

3391 artikelen

+/- 130 vertalingen kunnen per uur door het systeem gehaald worden in de vertaalflow.

Een paar tweaks …… voor een paar problemen

Any to Any translations

Momenteel geen voorziening in Falang om content in verschillende ‘brontalen’ in te voegen

Workaround via ‘taal-flagging’ in joomla!

Taggen anderstalige teksten als ‘toon enkel in Duits/Pools/…’

Vertaalflow doorlopen

Brontekst taggen als ‘toon in alle talen’

Vertalingen beschikbaar

Gebruik van ‘bugje’ in Falang dat een vertaling van de standaardtaal toelaat

Tuning

Aangepaste MySQL config : spelen met buffers en cache

joomla! file cache geeft problemen (door frequente updates)

tweaken van joomla! search om ook afgeschermde content in de search results te laten verschijnen (doorzoekbaarheid kan nog beter)

autologin – ip (Yireo-basis) aangepast voor CIDR-ranges

standaard sitevertalingen zijn niet altijd O.K., vertaling zit ook in bijzonder veel verschillende bestanden (component, modules, plugins, …)

Toekomstplannenover migraties, plugins & kopzorgen

2015 and beyond …

Migratie naar joomla 3.4.x

Uitbreiding aantal doeltalen & brontalen

Meer vertaalengines toevoegen (via CrossLang) (Moses!)

Mobile

Indexeren van aangepaste vertalingen en binden aan template (standaard languageoverride niet werkbaar bij deze grootteorde)