Uno de los principales inconvenientes a los que se enfrentan tanto las agencias de traducción como los traductores a la hora de traducir es el formato de texto en el que los clientes envían los textos originales a traducir.
Existen muchos clientes que envían sus textos a traducir en formatos editables como Word, Excel, PowerPoint y otros archivos de texto con la extensión ”.txt”. Estos archivos son muy fáciles de traducir a nivel de formato y maquetación ya que podemos crear una copia del archivo original y trabajar con la traducción sobre la copia. A veces existen imágenes dentro de estos archivos de texto editable como tablas, ilustraciones, fotos que contienen texto y debemos traducirlas. Lo único que tendremos que hacer es convertir estas imágenes en editables y ya podremos traducir. La conversión se puede realizar mediante una programa OCR o a través las herramientas asistidas por ordenador.
Otros clientes nos envían la documentación a traducir en formatos de imagen como JPG, GIF, PDF, Photoshop, BMP o directamente escaneados en PDF. Es aquí cuando nos encontramos con el verdadero problema. En caso de querer enviar la traducción con el mismo formato, es importante que trabajemos con herramientas asistidas por ordenador ya que éstas pueden convertir a texto casi todo los formatos de imagen y devolver la traducción en el mismo formato que nos entregó el cliente.
En el caso de documentación escaneada en formato de imagen de texto tanto oficial de organismos como manuscrita, necesitaremos un programa OCR que digitalice todo el texto para que podamos traducir. En estos casos es importante que revisemos la documentación antes de traducir en caso de que no se haya digitalizado todo. A veces hay marcas de texto escondidas que surgen como consecuencia de la digitalización. Para ello es muy importante que revisemos de forma detenida todos los archivos que pasemos a través de un programa OCR.