Carregant...
Carregant...

Vés al contingut (premeu Retorn)

Dealing with input noise in statistical machine translation

Autor
Formiga, L.; Fonollosa, José A. R.
Tipus d'activitat
Presentació treball a congrés
Nom de l'edició
24th International Conference on Computational Linguistics
Any de l'edició
2012
Data de presentació
2012-12-13
Llibre d'actes
Proceedings of COLING 2012: Technical Papers : 8-15 December 2012, Mumbai, India
Pàgina inicial
319
Pàgina final
328
Projecte finançador
BUCEADOR
Feedback Analysis for User adaptive Statistical Translation
Repositori
http://hdl.handle.net/2117/18279 Obrir en finestra nova
URL
http://aclweb.org/anthology-new/C/C12/C12-2032.pdf Obrir en finestra nova
Resum
Misspelled words have a direct impact on the final quality obtained by Statistical Machine Translation (SMT) systems as the input becomes noisy and unpredictable. This paper presents some improvement strategies for translating real-life noisy input. The proposed strategies are based on a preprocessing step consisting in a character-based translator (MT) from noisy into cleaned text. The use of a character-level translator allows us to provide various spelling alternatives in a lattice format to ...
Citació
Formiga, L.; Fonollosa, José A. R. Dealing with input noise in statistical machine translation. A: International Conference on Computational Linguistics. "Proceedings of COLING 2012: Technical Papers : 8-15 December 2012, Mumbai, India". Mumbai: 2012, p. 319-328.
Grup de recerca
IDEAI-UPC - Intelligent Data Science and Artificial Intelligence Research Center
TALP - Centre de Tecnologies i Aplicacions del Llenguatge i la Parla
VEU - Grup de Tractament de la Parla

Participants

Arxius