리서치.

"이제 디코딩을 진행하겠습니다."

기계번역의 마지막 단계

등록하기

기계번역의
마지막 단계

랭귀지 위버는 자연어 처리 분야에 길고 잘 알려진 리서치 및 개발 역사를 가지고 있습니다. 다면적인 다국적 팀에서는 단기적으로는 과학을 발전시키는 목표로, 장기적으로는 고객이 본인의 콘텐츠를 더 잘 이해하고 새로운 콘텐츠를 더 효율적으로 만들 수 있도록 하는 RWS 툴 및 기술에 이 작업을 도입하려는 목표를 가지고 최첨단 리서치를 수행합니다. 

당사 팀에서는 다음과 같은 분야에 대한 연구 개발을 더욱 적극적으로 수행하고 있습니다. 

  • 인공신경망 기계번역 
  • MT 품질 추정 
  • 다국어 요약 
  • 개체명 인식(NER) 
  • 감성 분석 
  • 텍스트 생성 
  • 텍스트 단순화 및 다른 말로 표현 
  • 질문 답변 
  • 주제 및 스타일 분석 

정기적으로 컨퍼런스에 참석하여 발표하고, NAACL, (E)ACL, EMNLP, MT Summit 등 잘 알려진 곳에서 작업물을 출판합니다. 아래에서 몇 가지 출판물을 볼 수 있습니다.

랭귀지 위버에서의 삶

랭귀지 위버에서 근무할 때 가장 큰 장점은 절대 지루하지 않다는 것입니다. 언제나 새로운 데이터, 흥미로운 언어, 다양한 도메인 및 애플리케이션을 가진 새로운 고객과 함께 일하기 때문에 같은 작업을 반복하거나 지속적으로 동일한 주제에 대해 연구하느라 시간을 보내지 않습니다. 

매년 수십억 개의 단어를 처리하고 번역하는 고객의 실제 문제를 해결하는 새로운 기술을 시도하면서 전문 기술을 연마하고 확장할 기회가 언제나 주어집니다. 다양한 배경을 가지고 있기 때문에 서로에게서 배우기도 합니다. 

로스앤젤레스, 클루지나포카, 더블린 및 유럽 내 기타 지역에 근간을 두고 있는 과학자, 엔지니어, 번역가로 구성된 당사 팀은 NLP에 강력한 기반을 둔 역동적인 팀을 구성하며 지평을 넓히고 있습니다. 팀에서는 당사 MT 엔진이 번역할 수 있는 언어의 개수만큼 다양한 언어로 주로 대화를 하곤 합니다.

일상 업무 외에도 각 분야에 대한 각자의 연구 및 기타 선도적인 문서를 발표하는 주간 독서 그룹도 가지고 있습니다. 무엇보다도 매주 1,000명의 독자가 읽는 주간 블로그, "The Neural MT Weekly"를 게시하고 있습니다.

일하고 근무하고 싶으시다면, RWS에 문의하세요.

출판물 

선택한 출판물:    

2021:    

Roemmele, M., Sidhpura, D., DeNeefe S., Tsou, L.(2021). AnswerQuest: A System for Generating Question-Answer Items from Multi-Paragraph Documents. 전산언어학 협회의 유럽 챕터 제16회 컨퍼런스(EACL, 2021), 데모 트랙    

2020:    

Saunders, D., Feely, W., Byrne, B.(2020). Inference-only sub-character decomposition improves translation of unseen logographic characters, 제7회 아시아 번역 워크숍에서 진행    

2019:    

Feely, W., Hasler, E., de Gispert, A.(2019). Controlling Japanese Honorifics in English-to-Japanese Neural Machine Translation. 제6회 아시아 번역 워크숍에서 진행    

Saunders, D., Stahlberg, F., de Gispert, A., Byrne, B.(2019). Domain Adaptive Inference for Neural Machine Translation. 제57회 전산언어학협회(ACL) 연간 회의에서 진행    

Roemmele, M.(2019). Identifying Sensible Lexical Relations in Generated Stories. 2019 전산언어학협회 연간 컨퍼런스 북미 챕터에서 진행된 내러티브 이해 워크숍: Human Language Technologies(NAACL 2019)    

2018:    

Iglesias, G., Tambellini, W., de Gispert, A., Hasler, E., Byrne, B.(2018). Accelerating NMT Batched Beam Decoding with LMBR Posteriors for Deployment. 2018 전산언어학협회 컨퍼런스 북미 챕터에서 진행(NAACL-HLT)    

Hasler, E., de Gispert, A., Iglesias, G., Byrne, B(2018). Neural Machine Translation Decoding with Terminology Constraints. 2018 전산언어학협회 컨퍼런스 북미 챕터에서 진행(NAACL-HLT)    

Saunders, D., Stahlberg, F., de Gispert, A., Byrne, B.(2018). Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT. 제56회 전산언어학협회(ACL) 연간 회의에서 진행    

Stahlberg, F., de Gispert, A., Byrne, B.(2018). The University of Cambridge's Machine Translation Systems for WMT18. 기계번역 컨퍼런스(WMT)에서 진행    

2017:    

Hasler, E., de Gispert, A., Stahlberg, F., Waite, A., Byrne, B.(2017). Source sentence simplification for statistical machine translation. Computer Speech & Language 45권, 221~235페이지    

Stahlberg, F., de Gispert, A., Hasler, E., Byrne, B.(2017). Neural Machine Translation by Minimising the Bayes-risk with Respect to Syntactic Translation Lattices. 제15회 전산언어학협회 컨퍼런스 유럽 챕터(EACL)에서 진행    

Hasler, E., Stahlberg, F., Tomalin, M. de Gispert, A., Byrne, B.(2017). A Comparison of Neural Models for Word Ordering. 자연어 세대에 대한 국제 컨퍼런스(INLG)    

2015  

Gispert, A., Iglesias, G., Byrne, W.,(2015) Fast and Accurate Preordering for SMT using Neural Networks, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

Dreyer, M., & Graehl, J.(2015) hyp: A Toolkit for Representing, Manipulating, and Optimizing Hypergraphs, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

Dreyer, M., & Dong, D.,(2015) APRO: All-Pairs Ranking Optimization for MT Tuning, North American Chapter of the Association for Computational Linguistics: Human Language Technologies    

2014    

May, J., Benjira, Y., Echihabi, A.,(2014) An Arabizi-English Social Media Statistical Machine Translation System, Association for Machine Translation in the Americas    

Jehl, L., Gispert, A., Hopkins, M., Byrne, M.,(2014) Source-side preordering for translation using logistic regression and depth-first branch-And-bound search, European Chapter of the Association for Computational Linguistics(239~248페이지)    

2013    

Hopkins, M., & May, J.(2013) Models of Translation Competitions. 2013 ACL에서 진행  

Munteanu, D. S., & Marcu, D.(2013) Exploiting Comparable Corpora. In Building and Using Comparable Corpora, Springer Publications.    

2012  

Soricut, R., Bach, N., & Wang, Z.(2012) WMT12 품질 추정 공유 작업에서의 SDL 랭귀지 위버 시스템, 2012년 6월 캐나다 퀘벡 몬트리올에서 열린 제7회 통계적 기계번역 워크숍(WMT 2012)에서 진행   

Dreyer, M. & Marcu, D.(2012) HyTER: Meaning-Equivalent Semantics for Translation Evaluation, 2012 전산언어학협회 컨퍼런스 북미 챕터에서 진행: Human Language Technologies, Montreal, Canada.    

2011    

Hopkins, M., & May, J.(2011) Tuning as Ranking. 2011 EMNLP에서 진행    

Hopkins, M., Langmead, G., & Vo, T.(2011) Extraction Programs: A Unified Approach to Translation Rule Extraction. 2011 WMT에서 진행    

2010    

Soricut, R., & Echihabi, A.(2010) TrustRank: Inducing Trust in Automatic Translations via Ranking, Association for Computational Linguistics Conference, 전산언어학협회 컨퍼런스(612~621페이지)    

Hopkins, M., & Langmead, G.(2010) SCFG Decoding Without Binarization. 2010 EMNLP에서 진행    

Wang, W., May, J., Knight, K., & Marcu, D.(2010) Re-Structuring, Re-Labeling, and Re-Aligning for Syntax-based Machine Translation, 전산 언어학. (36.2)    

2009    

Hopkins, M., & Langmead, G.(2009) Cube Pruning as Heuristic Search. 2009 EMNLP에서 진행    

Yamada, K., & Muslea, I.(2009). Re-ranking for large-scale statistical machine translation, Learning Machine Translation(151~169페이지)    

2007   

Wang, W., Knight,K., & Marcu, D.(2007) Binarizing Syntax Trees to Improve Syntax-Based Machine Translation Accuracy. 프라하 EMNLP-07에서 진행(746~754페이지)    

2006    

Marcu, D., Wang, W., Echihabi, A., & Knight, K.(2006) SPMT: Statistical Machine Translation with Syntactified Target Language Phrases", Empirical Methods in Natural Language Conference, 자연어 컨퍼런스의 경험적 방법론(44~52페이지)    

Huang, B., & Knight, K.(2006). Relabeling Syntax Trees to Improve Syntax-Based Machine Translation Quality. 2006년 HLT-NAACL에서 진행

The Neural MT Weekly 구독

Loading...