Hace poco tuve la oportunidad de sentarme con dos de las máximas responsables de la política de privacidad de Google: Nicole Wong, vicepresidenta, y Alma Whitten, ingeniera de seguridad y privacidad. Aunque haya a quien le pueda parecer que las citas de «los buenos», «los malos» y «no actuar mal» se pasan un poco de listas, Wong y Whitten hicieron una defensa contundente de la veracidad de los eslóganes. A su juicio, Google en realidad está dando la batalla correcta en lo relativo a la privacidad en la red.
El anonimato y sus enemigos
Google registra una cantidad asombrosa de datos, incluídos los archivos de las búsquedas realizadas en su producto estrella. Conserva esa información indefinidamente, de manera que no es una idea particularmente inteligente realizar una búsqueda con una combinación de argumentos que contenga, por ejemplo, el nombre de nuestra esposa, la dirección postal y «matarratas para los cereales que desayuna» (aunque quienes realizan búsquedas hacen ese tipo de cosas de todos modos ).
Pero la empresa «anonimiza» al final estos datos. El último octeto de la dirección IP se borra al cabo de nueve meses, lo que significa que las posibilidades de averiguar cuál es la dirección IP en cuestión quedan reducidas a 254 (las direcciones .0 y .255 están reservadas). Al cabo de 18 meses, Google elimina la identidad de la información de la cookie(1) individual almacenada en esos archivos.
No es una práctica especialmente restrictiva; las autoridades europeas de protección de datos han solicitado que la IP sea anónima a los seis meses , y otros motores de búsqueda rivales, como Bing, hacen exactamente eso (y Bing elimina la dirección IP completa, no sólo el último octeto). Yahoo borra los datos de identidades a los 90 días .
Pero Whitten, que estuvo implicada en la toma de decisiones de Google sobre estos asuntos, dijo que la empresa ha hecho todo lo posible por reducir al mínimo el periodo de almacenamiento de datos conservando, al mismo tiempo, la posibilidad de extraer el máximo valor de ellos… y que ese «valor» no lo tiene sólo para Google, sino también para los usuarios.
«Con abundancia de datos se pueden hacer maravillas», afirmó. Cuando los grupos de trabajo de Google empezaron a analizar el tema del almacenamiento de datos remontándose algunos años atrás, trataron de ver si podían ponerlo en marcha «sin tener ningún dato». No lo lograron; Google perdía la capacidad de hacer demasiadas cosas valiosas.
La información de las búsquedas se aprovecha, utilizando la terminología de Google, para «aprender de los buenos», y se hace observando cómo los usuarios corrigen sus propios errores de ortografía, cómo escriben en su lengua materna y qué sitios visitan tras realizar las búsquedas. Esa información ha desempeñado un papel esencial en la afamada aproximación algorítmica de Google a problemas como la revisión ortográfica, la traducción del lenguaje de máquina y la mejora del motor principal de búsqueda. Sin los algoritmos, el traductor de Google no sería capaz de sostener lenguas de menor uso como el catalán o el galés.
Los datos también se utilizan para averiguar cómo «los malos» programan alteraciones en los vínculos de Internet (link farm) y producen otras perturbaciones en la red; todo en aras de que Google pueda aplicar contramedidas.
Finalmente, Google optó por borrar la identidad de las direcciones IP transcurridos nueve meses, aun cuando Whitten señaló que, en este aspecto, «creemos que hemos perdido capacidad de hacer algunas cosas».
¿Es que a los usuarios de la red no les importa que les sigan el rastro?
En lugar de recortar el periodo de almacenamiento de datos, Google se centra más bien en 1) la transparencia y 2) mantener los datos a buen recaudo. La empresa cree que cuando los usuarios saben lo que Google guarda y por qué lo hace (y teniendo, como tienen, posibilidad de excluirse) suelen consentir de buena gana que Google se dedique a lo suyo.
Wong apunta a la publicidad basada en la conducta de navegación por Internet, en la que Google se embarcó el pasado año. Este tipo de publicidad descansa sobre una vasta red de publicidad tendida a través de muchos sitios de Internet, y los anuncios archivan una cookie individual del visitante. Google puede recopilar esa información en su trastienda y compilar una lista de categorías de interés asociadas con la cookie de un usuario concreto; como casi ningún usuario borra nunca sus cookies, funciona adecuadamente como mecanismo general de localización de segmentos publicitarios.
Cuando Google presentó el sistema en marzo de 2009, la vicepresidenta Susan Wojcicki dijo lo que los anunciantes suelen decir siempre en estas ocasiones : que es bueno para los consumidores.
«Creemos que ver publicidad sobre cosas que a uno le interesan es algo realmente valioso», escribió. «Por ejemplo: si te encantan los viajes de aventura y, por tanto, visitas portales de viajes de aventura, Google podrá mostrarte más anuncios de actividades semejantes, como viajes que incluyan senderismo en la Patagonia o safaris en África. Del mismo modo que con los mecanismos publicitarios basados en los intereses se puede inferir si tenemos interés en los viajes de aventura a partir de las páginas web que visitamos, también se puede escoger nuestras categorías predilectas o indicar de qué categorías no queremos ver anuncios».
Lo que permite escoger las categorías favoritas (y excluirse por completo de la publicidad basada en la conducta de navegación) es el administrador Ads Preferences [Preferencias de anuncios] de Google. Este sitio se utiliza muy poco; a pesar de los centenares de millones de personas que emplean servicios de Google o a quienes ésta distribuye publicidad, me dicen que sólo «unas cuantas decenas de miles» visitan semanalmente el sitio web de Ads Preferences. Podríamos suponer que esas «cuantas decenas de miles» son quienes comprenden en realidad lo que es la publicidad basada en conductas de navegación, saben como funciona y la detestan con vehemencia.
La gente de Google insiste en que no es eso lo que sucede de hecho cuando las personas visitan la página de Ads Preferences. Comparado con el número de personas que deciden excluirse por completo, el de quienes se limitan a configurar sus categorías es cuatro veces superior, y el de quienes no hace nada en absoluto es diez veces superior.
Este dato podría significar varias cosas (por ejemplo, tal vez que la mayoría de los usuarios está simplemente confundido ante las opciones y, sencillamente, no hace nada), pero Google lo interpreta como un refrendo a su decisión de llevar a cabo la tarea con transparencia y a su voluntad de entregar el control a los usuarios. Ciertamente, hay otras empresas que podrían seguir el ejemplo del manual de trabajo de Google. El administrador Ads Preferences facilita excluirse con un simple clic, pero sólo se aplica a un navegador; Google también ha creado un complemento del navegador capaz de recordar las preferencias cuando se cambia a otro y después de haber eliminado las cookies.
Con todo, dadas las dosis de odio dirigido contra DoubleClick,(2) propiedad de Google, vertidas con motivo de nuestro reciente comentario sobre el bloqueo de publicidad , parece que a Google le queda todavía un buen trecho para convencer a los gerifaltes del universo digital de que su política de permitir a los usuarios excluirse como blanco de la publicidad basada en la conducta de navegación no es realmente «mala».
Al tiempo que los servicios de Google acumulan cada vez más información sobre los usuarios, la estrategia de la empresa para tranquilizarlos se basa en la transparencia, el control por parte del usuario y la privacidad de la información. Whitten subraya orgullosa que la información de Google no se filtra, y Wong apunta la contundencia con la que la empresa se defendió en el año 2005 contra una petición generalizada de información por parte del Departamento de Justicia de Estados Unidos.
«No nos aferramos a esto con frivolidad», declaró Whitten. «Es fundamental ofrecer algo valioso a nuestros usuarios».
______________________________
Notas: (1) Una cookie (literalmente, «galleta») es un fragmento de información que se almacena en el disco duro del visitante de una página web a través de su navegador, a petición del servidor de la página. Esta información puede ser luego recuperada por el servidor en posteriores visitas. En ocasiones también se le llama «huella». (N. del T.)
(2) Empresa de publicidad con sede en Nueva York que desarrolla y ofrece servicios de publicidad en Internet. (N. del T.)
Fuente: http://arstechnica.com/tech_