Grupo de Investigación UCM (ref. 971672) sobre Psicología del Testimonio.
Facultad de Psicología, Universidad Complutense de Madrid (España).
Investigador principal: Antonio L. Manzanero.



La voz, prueba contra el crimen machista

La Justicia acude cada vez más a los forenses de la voz de la Policía y la Guardia Civil para resolver casos de violencia sexista, pero menos para los delitos de terrorismo o narcotráfico

José Manuel Abad Liñán 
Madrid 
6 NOV 2015           
 

En lo que va de año, los tribunales han recurrido 284 veces a los laboratorios de voz del Cuerpo Nacional de Policía y de la Guardia Civil para que estudien grabaciones de sonido que se quieren usar como prueba en un juicio. Estos centros forenses están especializados en el análisis de la voz y en la identificación de personas a partir de la comparación entre varios registros sonoros; es uno de los requerimientos más habituales de la Justicia.
El Área de Acústica del Servicio de Criminalística de la Guardia Civil ha recibido este año 49 peticiones de los jueces, frente a las 235 de su análogo en la Policía, el Laboratorio de Acústica Forense. En todo 2014, la Policía recibió 264 solicitudes, frente a 70 de la Guardia Civil.
El facultativo jefe de Acústica Forense de la Policía, Carlos Delgado, destaca el aumento de las peticiones relacionadas con la violencia machista. "El porqué del uso creciente del teléfono para lanzar amenazas es una cuestión difícil de valorar, pero creemos que está relacionado con el hecho de la contundencia de la voz frente a la escritura. La amenaza verbal es también más intimidatoria", explica el experto.
La Guardia Civil corrobora este aumento. El portavoz de su Área de Acústica, el capitán Francisco Javier González, lo atribuye además al hecho de que "cada vez más personas graban sus conversaciones y amenazas con sus teléfonos" para aportar las grabaciones como pruebas en los juicios. El uso de smartphones explicaría también el descenso "muy significativo", según la Policía, de las peticiones judiciales relacionadas con el narcotráfico. Para el facultativo jefe del instituto armado, los servicios de mensajería como WhatsApp han tomado el relevo como medio de comunicación favorito entre los traficantes.


ÁNGEL PLASCENCIA / PAULA CASADO (EL PAÍS VÍDEO)
La Guardia Civil no aprecia un descenso llamativo en el estudio forense de este tipo de delitos, pero sí en los de terrorismo, parejo al cese de los atentados de ETA. En 2006, el laboratorio de la Benemérita fue crucial en la identificación del etarra Igor Portu, uno de los autores del atentado de la terminal 4 del Aeropuerto Madrid-Barajas a partir de la grabación del aviso de bomba. El coronel Juan José Lucena dirigió el Área de Acústica desde su creación, en 1991, hasta 2008. "Desde el punto de vista de la pericia en España, se puede hablar de un antes y después de aquella llamada que anunciaba la colocación de una furgoneta-bomba", explica Lucena, que recibe a EL PAÍS en uno de los despachos del que fue su laboratorio hasta hace siete años. Tras las pinturas de vetustos militares, dejando atrás un expositor con armas antiguas, se accede a uno de los primeros lugares que adoptaron IdentiVox, un software desarrollado íntegramente en España capaz de comparar la grabación de una voz con miles otras en cuestión de minutos: "El atentado de la T4 reflejó la madurez de los sistemas automáticos, que nosotros veníamos usando desde el año 97. Hasta entonces se trabajaba normalmente solo con lingüistas, pero nuestro laboratorio apostó por ese software".
"Aquella llamada dubitada [así llaman los forenses las muestras de voz de cuyo autor desconocen] era óptima en calidad, pero el problema era obtener la grabación del sospechoso para compararla", describe el coronel. "Una patrulla rural de la Guardia Civil había detenido a dos individuos en Guipúzcoa en los primeros días de enero. La cercanía en el tiempo con el atentado hizo sospechar que estaban relacionados con él", añade. La ley ampara a un sospechoso a no declarar y a negarse a que le tomen una muestra de su voz. Obtener una muestra con la calidad suficiente para que al juez no le cupieran dudas de que se trataba de la misma persona. "La sentencia lo resaltó: la prueba de voz fue relevante no solo para identificar a uno de los autores, sino también para calificar el delito como terrorista", dice Lucena.

Una filóloga de uniforme

A la hora de tomar una muestra de voz de un acusado, los guardias civiles y policías se enfrentan a todo tipo de estratagemas, desde las más obvias [negarse a hacerlo, lo que también puede resultar indicativo para el juez] a las más retorcidas simulaciones y enmascaramientos del acento o la forma de hablar. "En algunos casos es más fácil desenmascararlos que en otros. Por ejemplo, suele ser más sencillo descubrirlos en el caso del falsete [la imitación de la voz aguda] que con la imitación en un tono grave", señala Juana Gil, directora del Máster en Fonética y Fonología de la UIMP y el CSIC, quien, además de formar a futuros forenses de la voz, investiga en este ámbito y realiza peritajes. Para el experto de la Policía Carlos Delgado, lo más difícil de imitar o disimular es la articulación de los sonidos.
Conoce bien todas las tretas de los acusados María (nombre figurado). Es una de las pocas filólogas con uniforme. Tras cursar estudios de fonética con Juana Gil, se interesó en la acústica forense y entró a formar parte de la Comisaría de Policía Científica. Trabaja en la última planta de un edificio moderno y aséptico en la parte posterior de una pequeña ciudad policial, la Dirección General de la Policía, en el barrio madrileño de Hortaleza.
Un caso típico del trabajo habitual de esta agente comienza con la petición del juez: "Nos pide que identifiquemos a un acusado que simula la voz y nosotros lo clasificamos por una serie de características, como el sexo y el origen geográfico, y también tenemos en cuenta el formato en el que está la grabación". Su objetivo es buscar lo que es peculiar del habla concreta de una persona, qué lo distingue de otras que compartan, por ejemplo, características socioeconómicas o el mismo origen geográfico. "Lo más característico", comenta su jefe, Carlos Delgado, "es cómo articulamos los sonidos, cómo pronunciamos una s o una r". En la conversación surgen dos ejemplos de rasgos típicos y distintivos de dos personas que continuamente oímos hablar: la s que pronuncia Rajoy y las puberfonías (gallos) que a veces se le escapan al rey Felipe VI.
Una vez tienen una pista de la característica específica, la corroboran haciéndole pronunciar al sospechoso unas frases que contienen una gran variedad de fonemas, a la caza de vocales y consonantes características. "Les tomamos muestras de voz directas, pero también a través del teléfono", explica la agente. "Incluso se hace una intervención, un pinchazo telefónico, en el propio juzgado".
En todo ese proceso, el sospechoso ha podido estar fingiendo, por eso al final se sostiene una conversación, más espontánea, de unos cinco minutos: "Ahí es donde se detectan rasgos en los sujetos no colaborativos; se les escapan ceceos, cuando habían estado fingiendo sesear, o muletillas características", apunta Delgado, habituado a toparse con todo tipo de imitadores. "De los imitadores profesionales, creo que Carlos Latre es de los mejores, porque no se limita a caricaturizar la voz o a usar las mismas muletillas, sino que va más allá". Juana Gil ve una oportunidad interesante para la investigación: "Nos gustaría hacer estudios de suplantación de personalidad de haber recursos económicos para contratar personal". El factor humano es lo más costoso: los aparatos que en los años ochenta podían costar hasta seis millones de pesetas se han visto superados por programas relativamente baratos.
Las muestras de voz se introducen, siempre con una preselección a cargo de los técnicos, en el software de reconocimiento para que compare la voz con las de decenas o cientos de personas que compartan esas características. "Buscamos siempre lo distintivo. En la voz ocurre como en el reconocimiento de caras. A una persona siempre le resultará más fácil encontrar diferencias entre dos personas de su misma raza que entre dos de otra raza", ejemplifica el experto policial. Por eso, para que encuentre lo peculiar del sospechoso, aquello que no es atribuible a su acento o a su pertenencia a un grupo, procuran alimentar a la máquina con la mayor cantidad de voces de sujetos similares.
Esas bibliotecas de voces se pueden comprar o montar para casos específicos. La Guardia Civil cuenta con un corpus con 5.000 grabaciones de sospechosos. A pesar de ese volumen, "sigue siendo muy pequeño y lo ideal sería tener decenas de miles", apunta con modestia el coronel Lucena. En el día a día, él y su colega Carlos Delgado se han encontrado con casos muy difíciles. "Por ejemplo", señala Delgado, "nos llega la grabación de un pakistaní que habla urdu. Para abordar ese caso, el sistema informático te recomienda que uses una población de varones que hablen urdu a través del móvil y con el mismo formato de sonido. Pero el mundo real es distinto, no siempre partimos de presupuestos ideales, y buscamos lo mejor disponible. Para que estemos seguros de que los candidatos van a ser idóneos medimos si el sistema va a tener capacidad discriminativa, si va a saber distinguir con finura dos voces de una persona del mismo grupo, e incluso les solemos hacer trampas incluyendo impostores que nosotros sabemos que lo son para ver si el sistema los detecta".

Pocos efectivos, miles de datos

El Área de Acústica de la Guardia Civil cuenta con nueve efectivos destinados a la acústica forense, que son 10 en el caso del laboratorio de la Policía. En ambos casos, la prudencia es la divisa de los forenses acústicos. La calidad media de las muestras que reciben suele ser muy deficiente. "En casi la mitad de los casos es imposible hacer pericias con garantías", aclara Carlos Delgado, y deben rechazar la petición de los juzgados. Cuando se acepta realizarlas, los resultados nunca se expresan como "un sí o un no", sino en grados de certidumbre, "pero tampoco hay un cien por cien de certeza en el caso de las pruebas de ADN". "Durante mucho tiempo los fonetistas forenses, cuando emitían sus dictámenes, hacían lo que a los jueces les gusta que hagan, que es decir: sí, es la misma persona, no, no se la misma persona", explica didácticamente Juana Gil. "Desde hace ya unos años, cada vez se extiende más la precaución, la prudencia. Ahora lo que se le pide al fonetista es que emita juicios sobre la identidad de las personas, sino sobre las pruebas".
Los forenses que trabajan con material genético cuentan con miles de millones de datos para apoyar sus conclusiones sobre la probabilidad de que dos muestras correspondan o no a una misma persona. Los forenses acústicos, en cambio, disponen solo de miles o decenas de miles de datos para sustentar sus apreciaciones. Aun así, son "valores muy altos", en opinión del catedrático de la Universidad Autónoma de Madrid Joaquín González, uno de los pioneros en el software de análisis de la voz Batvox, que hoy día emplean la Guardia Civil y la Policía.
A pesar del avance que suponen los sistemas automáticos, que cotejan en cuestión de minutos una voz con miles de grabaciones, el factor humano sigue siendo imprescindible. Los laboratorios de acústica incorporan a ingenieros, físicos, fonetistas, lingüistas y logopedas. "Usamos un método combinado, no ignoramos nada que ayude a aclarar un caso", indica el experto de la Policía.
"Hay dos enfoques de la acústica forense, el automático y el humano, el lingüista, pero no tienen por qué ser antagónicos", explica la profesora Gil. "De hecho, lo ideal es que se combinen los dos, porque hay aspectos que el programa de análisis recoge muy bien y otros que no recoge a día de hoy. Por ejemplo, todo lo relacionado con la cualidad de voz". Son rasgos como los de una voz con ronquera o de fumador, el modo de hablarle a un niño pequeño, hablar con un gran escape de aire, como alguien que está cansado... "Y es importante porque la cualidad de voz es muy distintiva [de una persona particular] cuando es muy notoria".
Carlos Delgado, que forma parte del Laboratorio de Acústica desde su creación en 1987, alaba una posibilidad que le permite el sistema automático: "Trabajar con lenguas distintas al castellano". Con la perspectiva de ese tiempo, el coronel Lucena valora cómo ha mejorado la acústica forense gracias, entre otros aspectos, a la mejora del ancho de banda: "cada vez podemos extraer más información de un archivo comprimido".

Así escucha un forense

La cualidad de la voz es precisamente uno de los aspectos que más utilizan los forenses para realizar un análisis. Reconocen usarlo el 94%, pero es la frecuencia fundamental (el tono de la voz, si es grave o aguda) la reina de las variables: la usan todos. Otro rasgo característico es el tempo (lo usa el 93% de los expertos), la velocidad con la que articulamos sonidos o con la que construimos frases hablando. Los datos corresponden a la asociación que reúne a los expertos en fonética y acústica forense, IAFPA. Los expertos en fonética en España, según Juana Gil, rondan los doscientos.
Son tantos los aspectos a los que tienen que atender, que a veces hay que emplear estrategias para aislar a uno de ellos. Algo así como escuchar en una sinfonía el sonido individual de un triángulo o del fagot. Carlos Delgado destaca uno de estos trucos: escuchar la voz en reverso. "Así ya no nos fijamos en lo que la persona está diciendo, nos quedamos únicamente con el timbre. Es algo útil en casos muy concretos".

"Nunca se conseguirá 'un ADN' del habla"

"La lección número uno del habla es que nada de lo que compares de un mismo individuo va a ser igual, ese es nuestro punto de partida", señala Carlos Delgado, facultativo jefe de la Policía. Una huella digital no cambia a lo largo de la vida de una persona. Tampoco el ADN. Siempre es el mismo, esté cansada o descansada, bebida o sobria, esté sufriendo cambios hormonales o no. Sin embargo, todos estos aspectos, y otros cientos, influyen en la voz humana y le confieren variantes inabarcables. La labor de los forenses es acotarlas, comparando una voz con otras miles y buscando aquello que es distintivo de una persona en particular, como el timbre. "Una misma nota, con la misma duración, suena distinta en un violín que en otro instrumento", ejemplifica Joaquín González, pionero del software de análisis de la voz que utiliza la policía, la Guardia Civil y el FBI.
Además, también a diferencia de otras referencias biométricas, "la voz se puede imitar y disimular, y encima es diferente si se escucha directamente a si se hace a través de una grabación", señala Delgado. Más del 90% de las pruebas que analizan los forenses son interceptaciones de conversaciones por teléfono, a menudo en condiciones muy precarias.

_________________________________________

¿Qué puede saber la ciencia de una persona solo por su voz?

La ciencia forense no solo recurre al cotejo para identificar a una persona. "A veces nos piden realizar el pasaporte vocal de una persona, por ejemplo, para identificar el autor de una llamada del que no se tiene ningún dato", explica el mismo especialista. En estos casos, solo trabajan a instancia de las unidades de la Policía o la Guardia Civil que dirigen una investigación en curso. "Depende de los casos, pero por las características físicas de la voz podemos llegar a saber el nivel socioeducativo, la profesión o el origen geográfico de una persona, incluso rasgos físicos como si tiene una mandíbula prominente, los incisivos superiores separados o el cuello muy corto. Si ya nos vamos al análisis del discurso, hemos llegado a inferir su grado de integración en una banda terrorista", explica el facultativo jefe de Acústica de la Policía, Carlos Delgado.