Forschung.

„Ich werde nun mit der Dekodierung beginnen.“

Die letzte Meile in der maschinellen Übersetzung.

Steigen Sie ein

Die letzte Meile
in der maschinellen Übersetzung.

Hier bei Language Weaver können wir auf eine lange und erfolgreiche Forschungs- und Entwicklungsgeschichte im NLP-Bereich (Natural Language Processing) zurückblicken. Unser vielseitiges multinationales Team leistet hochmoderne Forschungsarbeit, um die Wissenschaft voranzubringen. Die Ergebnisse fließen in unsere Tools und Technologien ein und helfen unseren Kunden, ihre Inhalte besser zu verstehen und neue Inhalte effektiver zu erstellen. 

Unser Team betreibt u. a. in den folgenden Bereichen Forschung und Entwicklung: 

  • Neuronale maschinelle Übersetzung 
  • MT-Qualitätsschätzung 
  • Mehrsprachige Zusammenfassung 
  • Eigennamenerkennung 
  • Sentimentanalyse 
  • Textgenerierung 
  • Vereinfachung und Paraphrasierung von Texten 
  • Beantwortung von Fragen 
  • Themen- und Stilanalyse 

Wir nehmen regelmäßig an Konferenzen teil und treten dort auch als Redner auf. Außerdem veröffentlichen wir unsere Arbeiten an bekannten Orten wie NAACL, (E)ACL, EMNLP und MT Summit. Nachfolgend finden Sie einige unserer ausgewählten Publikationen.

Die Arbeit bei Language Weaver

Das Beste an der Arbeit bei Language Weaver ist, dass es nie langweilig wird. Unser Team ist nie lange mit derselben Aufgabe beschäftigt oder forscht an demselben Thema – wir arbeiten ständig mit neuen Kunden an neuen Daten, interessanten Sprachen und in unterschiedlichen Bereichen und Anwendungsgebieten. 

Es gibt immer die Möglichkeit, Fähigkeiten zu verfeinern und zu erweitern, indem neue Techniken ausprobiert werden, um reale Probleme für Kunden zu lösen, die Jahr für Jahr Milliarden von Wörtern verarbeiten und übersetzen. Da unser Team sich aus Personen mit verschiedensten Hintergründen zusammensetzt, lernen wir auch viel voneinander. 

Mit Niederlassungen in Los Angeles, Cluj-Napoca, Dublin und an anderen Orten in Europa bilden unsere Wissenschaftler, Ingenieure und Linguisten ein dynamisches, energiegeladenes Team mit starker NLP-Erfahrung und der Bereitschaft, seinen Horizont zu erweitern. Wir sprechen dabei beinahe so viele Sprachen, wie unsere MT-Engines übersetzen können!

Über den Arbeitsalltag hinaus gibt es bei uns auch eine wöchentliche Lesegruppe, in der wir unsere eigene Forschung und andere bedeutende Fachartikel präsentieren. Außerdem veröffentlichen wir einen wöchentlichen Blog – Neural MT Weekly –, der von Tausenden gelesen wird.

Möchten Sie Teil unseres Teams werden? Kontaktieren Sie uns!

Publikationen 

Ausgewählte Publikationen:    

2021:    

Roemmele, M., Sidhpura, D., DeNeefe S. und Tsou, L. (2021). AnswerQuest: A System for Generating Question-Answer Items from Multi-Paragraph Documents. 16. Tagung des European Chapter of the Association for Computational Linguistics (EACL 2021), Demo-Track.    

2020:    

Saunders, D., Feely, W. und Byrne, B. (2020). Inference-only sub-character decomposition improves translation of unseen logographic characters, Proceedings of the 7th Workshop on Asian Translation.    

2019:    

Feely, W., Hasler, E. und de Gispert, A. (2019). Controlling Japanese Honorifics in English-to-Japanese Neural Machine Translation. Tagungsbericht zum 6. Workshop on Asian Translation.    

Saunders, D., Stahlberg, F., de Gispert, A. und Byrne, B. (2019). Domain Adaptive Inference for Neural Machine Translation. Tagungsbericht zum 57. Annual Meeting of the Association for Computational Linguistics (ACL).    

Roemmele, M. (2019). Identifying Sensible Lexical Relations in Generated Stories. Workshop zum narrativen Verständnis bei der Jahrestagung des North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT) 2019    

2018:    

Iglesias, G., Tambellini, W., de Gispert, A., Hasler, E. und Byrne, B. (2018). Accelerating NMT Batched Beam Decoding with LMBR Posteriors for Deployment. Tagungsbericht zur Conference des North American Chapter of the Association for Computational Linguistics (NAACL-HLT) 2018.    

Hasler, E., de Gispert, A., Iglesias, G. und Byrne, B (2018). Neural Machine Translation Decoding with Terminology Constraints. Tagungsbericht zur Conference des North American Chapter of the Association for Computational Linguistics (NAACL-HLT) 2018    

Saunders, D., Stahlberg, F., de Gispert, A und Byrne, B. (2018). Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT. Tagungsbericht zur 56. Jahrestagung der Association for Computational Linguistics (ACL).    

Stahlberg, F., de Gispert, A. und Byrne, B. (2018). The University of Cambridge's Machine Translation Systems for WMT18. Tagungsbericht zur Conference of Machine Translation (WMT).    

2017:    

Hasler, E., de Gispert, A., Stahlberg, F., Waite, A. und Byrne, B. (2017). Source sentence simplification for statistical machine translation. Computer Speech & Language, Band 45, S. 221–235.    

Stahlberg, F., de Gispert, A., Hasler, E. und Byrne, B. (2017). Neural Machine Translation by Minimising the Bayes-risk with Respect to Syntactic Translation Lattices. Tagesbericht zur 15. Tagung des European Chapter of the Association for Computational Linguistics (EACL).    

Hasler, E., Stahlberg, F., Tomalin, M., de Gispert, A. und Byrne, B. (2017). A Comparison of Neural Models for Word Ordering. International Conference on Natural Language Generation (INLG).    

2015  

de Gispert, A., Iglesias, G., Byrne, B., (2015) Fast and Accurate Preordering for SMT using Neural Networks, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

Dreyer, M. und Graehl, J. (2015). hyp: A Toolkit for Representing, Manipulating, and Optimizing Hypergraphs, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

Dreyer, M. und Dong, D. (2015). APRO: All-Pairs Ranking Optimization for MT Tuning, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

2014    

May, J., Benjira, Y., Echihabi, A., (2014). An Arabizi-English Social Media Statistical Machine Translation System, Association for Machine Translation in the Americas    

Jehl, L., de Gispert, A., Hopkins, M., Byrne, B., (2014). Source-side preordering for translation using logistic regression and depth-first branch-And-bound search, European Chapter of the Association for Computational Linguistics, (S. 239–248).    

2013    

Hopkins, M. und May, J. (2013). Models of Translation Competitions. Tagungsbericht der ACL, 2013.  

Munteanu, D. S. und Marcu, D. (2013). Exploiting Comparable Corpora. In Building and Using Comparable Corpora, Springer Publications.    

2012  

Soricut, R., Bach, N. und Wang, Z. (2012). The SDL Language Weaver Systems in the WMT12 Quality Estimation Shared Task, Tagunsbericht zum 7. Workshop on Statistical Machine Translation (WMT 2012), Juni 2012, Montreal, Quebec, Kanada.   

Dreyer, M. und Marcu, D. (2012). HyTER: Meaning-Equivalent Semantics for Translation Evaluation, Tagungsbericht zur Tagung des North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2012, Montreal, Kanada.    

2011    

Hopkins, M. und May, J. (2011). Tuning as Ranking. Tagungsbericht der EMNLP, 2011.    

Hopkins, M., Langmead, G. und Vo, T. (2011). Extraction Programs: A Unified Approach to Translation Rule Extraction. Tagungsbericht der WMT, 2011.    

2010    

Soricut, R. und Echihabi, A. (2010). TrustRank: Inducing Trust in Automatic Translations via Ranking, Association for Computational Linguistics Conference, (S. 612–621).    

Hopkins, M. und Langmead, G. (2010). SCFG Decoding Without Binarization. Tagungsbericht der EMNLP, 2010.    

Wang, W., May, J., Knight, K. und Marcu, D. (2010). Re-Structuring, Re-Labeling, and Re-Aligning for Syntax-based Machine Translation, Computational Linguistics. (36.2).    

2009    

Hopkins, M. und Langmead, G. (2009). Cube Pruning as Heuristic Search. Tagungsbericht der EMNLP, 2009.    

Yamada, K. und Muslea, I. (2009). Re-ranking for large-scale statistical machine translation, Learning Machine Translation, (S. 151–169)    

2007   

Wang, W., Knight,K. und Marcu, D. (2007). Binarizing Syntax Trees to Improve Syntax-Based Machine Translation Accuracy. Tagungsbericht der EMNLP-07, S. 746–754, Prag.    

2006    

Marcu, D., Wang, W., Echihabi, A. und Knight, K. (2006). SPMT: Statistical Machine Translation with Syntactified Target Language Phrases, Empirical Methods in Natural Language Conference, (S. 44–52).    

Huang, B. und Knight, K. (2006). Relabeling Syntax Trees to Improve Syntax-Based Machine Translation Quality. Tagungsbericht der NAACL-HLT, 2006.

Neural MT Weekly abonnieren

Loading...