Cada capítulo tiene asignada una persona a cargo de la traducción, que es responsable de que esta se lleve a cabo. La forma de organizarse queda a criterio de cada quien: se puede realizar de forma individual, buscar colaboradores o realizar una actividad abierta de traducción (por ejemplo, a través de RLadies o el grupo de Usarios de R (RUG) local.
1. Al traducir lo que buscamos es generar una versión de cómo diríamos en español lo que en el capítulo está escrito en inglés. En algunos casos eso puede implicar alterar el orden de los elementos de una oración o agregar palabras que no estaban en el original. Lo importante es que la traducción "suene" lo más natural posible en español, respetando el contenido que se quiso transmitir en el original.
2. La variedad dialectal del español que ocuparemos en la traducción es la de Latinoamérica (porque el posible público destinatario que la habla es más amplio). Trataremos de que sea una versión lo más neutra posible, por lo que:
- Evitaremos expresiones o usos locales/regionales, es decir, que no están extendidos en toda Latinoamérica.
- No utilizaremos el voseo (vos/vosotros). R4DS está dirigido a una segunda persona, así que para cautelar la neutralidad la traduciremos como tú (... you'll learn > ... aprenderás).
3. Género gramatical. A diferencia del inglés, el español tiene género gramatical (masculino, femenino y muy, pero muy pocos neutros). En general, como R4DS está dirigido a un tú y se habla de datos, variables y funciones, hay pocas situaciones en las que haya que tomar una decisión respecto de cómo manejar este tema; pero las hay. Por ejemplo, acá: “... for collaborating with other data scientists”. Como son pocos casos, la idea es ir resolviéndolos a medida que aparezcan (Slack, canal #dudas-traducción). En principio, una opción habitual es ajustar la redacción para evitar tener que asignar un género: para colaborar con otras personas que trabajan en Ciencia de Datos.
4. El español es una lengua menos repetitiva que el inglés. Como los verbos tienen marca de persona, género y número, tenemos la flexibilidad de poder omitir el sujeto, ya que por contexto se suele entender a qué nos estamos refiriendo.
Ejemplo:
The first argument is the name of the data frame. The second and subsequent arguments are the expressions that filter the data frame.
Traducción:
El primer argumento es el nombre del data frame. El segundo y los subsiguientes son las expresiones que filtran el data frame.
O incluso:
El primer argumento es el nombre del data frame. El segundo y los subsiguientes son las expresiones para filtrarlo.
En todos los casos, hay que tratar de pensar cómo suena más natural/normal en español y cómo queda más claro para quien lee.
5. Hay regularidades que no siempre se cumplen. Por ejemplo, en inglés las palabras con función adjetiva se anteponen a los sustantivos (missing values, help pages, etc.), mientras que en español suele ser al revés: ponemos los adjetivos después del sustantivo: valores faltantes, páginas de ayuda, etc. Sin embargo, hay casos en que en español la forma “no marcada”, es decir, la que nos suena más natural, es con el adjetivo al principio:
Ejemplo:
...this small example helps to understand... > ...este pequeño ejemplo ayuda a entender...
En general, ante dudas de este tipo, pensar en qué es lo que suena más natural/normal en español.
6. El español tiene más modos y tiempos verbales que el inglés Al traducir, por lo tanto, se debe priorizar la forma verbal que sea mejor para expresar el sentido del fragmento en español, no la que parezca ser literal del inglés.
Ejemplo: That implies that you have the "best" model (according to some criteria); it doesn't imply that you have a good model and it certainly doesn't imply that the model is "true" > Esto implica que tienes el "mejor" modelo (de acuerdo a ciertos criterios); no implica que tengas un buen modelo y, ciertamente, no implica que el modelo sea "verdadero".
7. Las expresiones idiomáticas no son traducibles de manera literal. En caso de que las hubiere (lo iremos descubriendo en el camino), hay que proponer una traducción que permita entender el sentido de ella.
Ejemplo:
it’s raining cats and dogs > está lloviendo a cántaros
8. Inconsistencias en el texto original. El texto original mezcla las primeras personas del singular y del plural. En la traducción siempre usaremos la primera persona del plural. Además, existen algunas inconsistencias en el uso de tiempos verbales en el original dentro de un mismo párrafo. La idea es arreglar la inconsistencia en la traducción.
9. Toma distancia para revisar. Cuando trabajamos mucho rato en un texto cuesta identificar errores de tipeo. Como sugerencia, una vez que termines la traducción del capítulo deja pasar algunas horas (o un día) antes de hacer la última lectura y enviarla. Eso hace más fácil que salten a la vista este tipo de detalles y permite que quienes hagan la revisión se concentren en la calidad de la traducción más que en correcciones ortotipográficas.
Hay términos técnicos que será necesario traducir y otros que no. El criterio suele estar en si existe una versión en español extendida (o entendible), o si se suele utilizar la versión original en inglés. En el caso de los últimos, hay que determinar qué género gramatical asignarle y si ofreceremos una traducción explicativa la primera vez que los utilicemos. A medida que avancemos con la traducción, la idea es ir discutiendo este punto en el canal #dudas-traducción. A partir de lo que se acuerde, iremos completando las siguientes listas de términos.
Pese a que hay términos que traduciremos al español, es importante que quien traduzca evalúe si corresponde mencionar de todos modos el término en inglés la primera vez. Por ejemplo, si bien string es un término que tiene una traducción (cadena de caracteres) la primera vez que se menciona sería útil ofrecer también la versión en inglés, porque así resulta más claro por qué el paquete se llama stringr. Por ejemplo: "Este capítulo te introducirá en la manipulación de cadenas de caracteres (strings) en R.". En el caso de términos cuya traducción en español no está tan extendida, es necesario evaluar si corresponde agregar una pequeña explicación (por ejemplo, mapping > "...mapear, es decir, indicar qué variables se asignarán a cada eje...".
término en inglés | traducción a utilizar |
---|---|
aesthetics | estéticas |
assignment operator | operador de asignación |
atomic vectors | vectores atómicos |
back slash (\) | barra invertida |
backtick (`) | acento grave |
base R | R base |
by default | por defecto |
click | hacer clic |
console | consola |
debugging | depurar |
dataset | conjunto de datos / set de datos |
facet | separar facetas |
input | input (la palabra existe como anglicismo en español, no se traduce) |
intercept | intercepto (u ordenada al origen) |
key | clave |
legend | leyenda |
list-columns | columnas-lista |
log-transformation | transformación logarítmica |
mapping | mapear |
match | coincidencia |
missing values | valores faltantes |
modelling | modelado |
named list | lista nombrada |
partial matching | coincidencia parcial |
parse | segmentar o analizar (depende del contexto) |
placeholder | marcador de posición |
query | consulta |
raw data | datos sin procesar |
regular expression | expresión regular |
test set | set/datos de validación |
training set | set/datos de entrenamiento |
tidy data | datos ordenados |
... | ... |
Estos términos irán en cursiva. De ser pertinente, se debe ofrecer una posible traducción al español, ya que en algunos casos permite entender mejor el concepto que está detrás (por ejemplo, que pipe es tubo / ducto / tubería). En caso de que sean nombres de paquetes o palabras nuevas en inglés (cuyo uso en este contexto no se encontraría en un diccionario), ofreceremos una indicación sobre cómo se pronuncian la primera vez que aparezcan. Por ejemplo: "... el uso de un pipe (/paip/)...".
no traducir |
---|
Big Data |
un dashboard |
un data frame |
un notebook |
un output |
un pipe |
un script |
un spline |
un tibble |
el tidyverse |
... |
Las Carpentries tienen algunas convenciones que podemos ir revisando y ver si se adecuan al propósito de la traducción que estamos realizando.
1. Nombres de funciones. Se debe ofrecer una traducción la primera vez que aparecen.
Original:
- Pick observations by their values (
filter()
).- Reorder the rows (
arrange()
).
Traducción:
- Escoger observaciones según sus valores (
filter()
— del inglés filtrar).- Reordenar las filas (
arrange()
— del inglés organizar).
2. Datos. Este proyecto tiene asociado el desarrollo de un paquete con la traducción de los datos utilizados a lo largo del libro. Por lo tanto, es necesario instalarlo para el proceso de traducción.
remotes::install_github("cienciadedatos/datos")
Puedes revisar el detalle de los datos traducidos en: https://github.com/cienciadedatos/datos.
Importante: No hay que olvidar agregar library(datos)
en la sección de cada capítulo en que se cargan los paquetes que se utilizarán. En el caso de Lahman
y nycflights13
, es necesario recordar que deben estar previamente instalados para que bateadores
y vuelos
puedan traducirse. Si en el capítulo se carga el set de datos con el formato ggplot2::diamonds
, hay que modificar el código porque la llamada datos:nombredataset
no está implementada aún (y no sabemos todavía si será posible).
3. Los objetos/variables creados a partir de los datos se traducen, al igual que los títulos, etiquetas y nombres de ejes en los gráficos.
Por ejemplo:
original
not_cancelled <- flights %>%
filter(!is.na(dep_delay), !is.na(arr_delay))
traducción variable + datos
no_cancelados <- vuelos %>%
filter(!is.na(atraso_salida), !is.na(atraso_llegada))
- Los nombres de los paquetes van en negrita.
- Los términos en inglés van en cursiva.
- La propuesta de pronunciación de un término en inglés va entre barras: /tibl/.
- Ni los demostrativos ni el adverbio "solo" se tildan.
- Días y meses se escriben con minúscula en español.
- Los títulos llevan mayúscula solo en la palabra inicial (salvo que incluyan un nombre propio).
- Para consultar la forma convencional de una abreviatura en español, revisar este enlace. Hasta el momento ha aparecido por ejemplo > p. ej..
Recuerda que cualquier duda que te surja puedes plantearla en el canal #dudas-traducción del Slack del proyecto. Todas las consultas son bienvenidas y útiles, ya que permiten ir acordando de manera conjunta los lineamientos a seguir. Las resoluciones que se tomen en ese canal se irán reflejando en este documento, por lo que es importante revisarlo con regularidad.