El tesoro (sin explotar) de Facebook

La invención de Mark Zuckerberg alberga los datos del mundo entero. Pero tiene un problema: no sabe cómo sacarles jugo.
Tom Simonite / Bloomberg

Si Facebook fuera un país, sus 900 millones de miembros lo convertirían en el tercer país más grande del mundo. Superaría por mucho los alcances de cualquier régimen que escudriña en la vida de sus ciudadanos. Las conversaciones privadas, las fotos de familia, los registros de viajes, cumpleaños y muertes, todo se carga en su servidor y allí queda registrado. Facebook ha reunido la mayor base de datos logrados alguna vez sobre el comportamiento social humano.

Sin embargo, no ha hecho demasiado con todo lo que sabe de nosotros. Ahora que cotiza en las bolsas del mundo, la presión para el desarrollo de nuevas fuentes de ingreso posiblemente la obligue a hacer más. Los datos atesorados se avecinan como una sombra gigantesca sobre lo que hoy es un modesto negocio de publicidad en línea, inquietando a los usuarios preocupados por su privacidad y a rivales como Google. Todos tienen la sensación de que esta fuente de recursos sin precedente redituará en algo grande, pero nadie sabe bien en qué.

Al frente de los esfuerzos de Facebook para comprender lo que puede aprenderse a partir de todos nuestros datos está Cameron Marlow, un joven alto de 35 años que hasta hace poco se sentaba a unos metros de Mark Zuckerberg.

El grupo que dirige Marlow ha escapado a la atención pública que persigue a los fundadores de Facebook. Conocido internamente como el Data Science Team (Equipo de Ciencia de Datos), es una especie de Laboratorios Bell de la era de las redes sociales.

El Data Science Team tiene 12 investigadores, pero se espera que duplique su cantidad al cierre de 2012. Aplica las matemáticas, habilidades de programación y la ciencia de las redes sociales para extraer nuestros datos, que esperan hagan crecer en grande el negocio de Facebook y a la ciencia de la redes sociales.

Si bien otros analistas de la empresa se concentran en la información relacionada con las actividades específicas en línea, el equipo de Marlow puede nadar en todo el océano de datos personales que conserva Facebook. De todas las personas en la organización, estos investigadores tienen la oportunidad de descubrir qué se puede aprender realmente cuando se reúne tanta información personal en un sólo lugar.

Facebook tiene toda esta información porque ha encontrado maneras ingeniosas de recabar datos a medida que la gente socializa. Los usuarios completan perfiles con su edad, género y dirección de correo electrónico. Algunos añaden su estado civil y hasta su número de celular.

Hace unos meses se rediseñó la página de perfil en forma de una línea de tiempo que invita a los usuarios a agregar información histórica, como los lugares en los que han vivido y trabajado. Los mensajes y las fotos compartidas son a menudo rotulados con una ubicación precisa, y en los últimos dos años Facebook ha empezado a dar seguimiento a la actividad en otros sitios de internet a través del botón "Me gusta". Aparece en aplicaciones y en sitios web externos a Facebook y permite a las personas indicar con un clic que están interesados en una marca, producto o en una pieza de contenido digital.

Facebook también puede reunir automáticamente datos sobre la vida de sus usuarios en línea más allá de sus límites: en ciertas aplicaciones o sitios web, cuando los usuarios escuchan una canción o leen una noticia, la información pasa directamente a Facebook, aun si no se elige la opción "Me gusta". En sus primeros cinco meses de uso, Facebook catalogó más de 5,000 millones de instancias de personas escuchando canciones en línea. Con todo eso se obtiene un registro increíblemente amplio de la vida e interacción de esas personas.

"Es la primera vez que el mundo ve semejante cantidad y calidad de datos sobre la comunicación humana", dice Marlow con una mirada seria antes de esbozar una sonrisa por todo lo que puede hacer con los datos. Está seguro de que la exploración de este recurso revolucionará el entendimiento científico en torno al comportamiento humano. Su trabajo podría ayudar a Facebook a inventar modos totalmente nuevos de hacer dinero.

Información es poder

Cameron Marlow evita el estilo de programador universitario de Mark Zuckerberg y de muchos otros en Facebook, combinando una camisa de vestir con sus jeans en lugar de los jeans con playera o sudadera que usa la mayoría. Parece más un joven profesor universitario que un estudiante. Ésa hubiera sido su profesión si al inicio de su desarrollo profesional no se hubiera dado cuenta de que los datos más jugosos sobre las interacciones humanas saldrían de las empresas de sitios web.

En 2001, mientras hacía su doctorado en el Media Lab del MIT, creó el sitio Blogdex, que listaba automáticamente la información más "contagiosa" que se difundía a través de los blogs. Si bien se trataba sólo de un proyecto de investigación, pronto se hizo tan popular que los servidores de Marlow colapsaron. La información desde los blogs estaba explotando en la conciencia popular y era tan numerosa que los usuarios se sentían abrumados con tanta información.

Por eso prefiguró sitios de recuperación de noticias, como Digg y Reddit. Pero no sólo para seguir lo que era popular en línea: Blogdex fue pensado como un instrumento científico para sacar a la luz las redes sociales. Marlow se integró a Facebook en 2007.

Su equipo trabaja con los directores de distintas áreas de Facebook para encontrar los patrones que podría aprovechar la empresa. Por ejemplo, estudian cómo se divulga una función entre los usuarios de la red y han ayudado a identificar usuarios que se podrían conocer entre sí, pero que no son amigos. Sin embargo, el grupo es una mosca blanca dentro de una compañía en que los ingenieros de software son estrellas de rock que viven de acuerdo al mantra: "Muévete rápido y rompe cosas".

Muchos miembros del equipo tienen formación académica en sociología o en psicología social, mientras que otros iniciaron sus carreras en la ciencia de la informática y comenzaron a usarla para estudiar el comportamiento humano. Son libres de usar parte de su tiempo, así como los datos que recopilan de Facebook, para probar los patrones y motivaciones básicas del comportamiento humano y publicar sus resultados en revistas académicas.

Podría ser raro que una empresa con apenas ocho años de vida, sin un modelo que hasta el momento perfile un negocio probado, se moleste en apoyar a un equipo con semejantes aptitudes, pero Marlow presume que esto tiene sentido.

"Los mayores desafíos que tiene Facebook son los mismos que tiene la ciencia de las redes sociales", sostiene. Estos retos incluyen entender por qué algunas ideas o modas divulgadas por pocos individuos se vuelven universales y otras no. O hasta qué punto las acciones de una persona son producto de comunicaciones pasadas con amigos.

Un ejemplo de cómo Facebook puede servir para examinar la sociedad en su conjunto: considere un estudio reciente que retoma la idea de que una persona está a sólo seis grados de separación de otra.

El mejor estudio sobre el tema data de 1967 e involucró a cientos de personas que intentaban enviar una postal a una persona en particular de Boston. La versión de Facebook, realizada en colaboración con investigadores de la Universidad de Milán, incluyó a toda la red social a mayo de 2011, que en ese momento sumaba más de 10% de la población mundial.

El análisis de los 69,000 millones de conexiones de amigos entre esos 721 millones de personas demostró que el mundo es más pequeño de lo que pensamos y que generalmente son suficientes cuatro amigos intermediarios para presentar una persona a un extraño aleatorio.

Tal resultado podría no extenderse a todas las personas, pero hay buenas razones para pensar que éste y otros hallazgos del Data Science Team son verdaderos más allá de Facebook.

El año pasado, el proyecto Internet & American Life del Centro de Investigación Pew descubrió que 93% de los amigos de Facebook se ha encontrado personalmente. Uno de los investigadores del equipo de Marlow desarrolló un modo de calcular la "felicidad interna bruta" de un país a partir de su actividad en Facebook, registrando la aparición de palabras y frases que señalan emociones positivas o negativas. La felicidad interna bruta crece durante las vacaciones y decae cuando mueren figuras populares.

Adam Kramer, creador del índice, dice que intentaba demostrar que los datos podían brindar modos económicos y exactos para dar seguimiento a tendencias sociales. Métodos que podrían ser útiles para economistas y otros investigadores.

Ayuda en línea

Marlow habla entonces como un empleado de una empresa que prospera en gran medida satisfaciendo las demandas de los anunciantes que quieren controlar el flujo de información entre sus usuarios. "Los anunciantes y las marcas también forman parte de esta red. Por lo tanto, es parte central del modelo de negocio ofrecerles algún tipo de información sobre cómo comparte la gente el contenido que ellos están produciendo", explica.

Sin embargo asegura que su equipo quiere descubrir las reglas de la vida social en línea para entender qué sucede dentro de Facebook, no para desarrollar modos para manipularla. "Nuestra meta no es cambiar el patrón de comunicación de la sociedad -dice-.Nuestra meta es entenderlo para poder adaptar nuestra plataforma y así ofrecer a las personas la experiencia que quieren".

En abril, influido por las conversaciones durante la cena con su novia estudiante de medicina (y ahora su esposa), Zuckerberg decidió que debería usar la influencia de las redes sociales dentro de Facebook para incrementar el registro de donantes de órganos. Los usuarios tuvieron la oportunidad de hacer clic en una casilla de sus páginas de línea de tiempo para señalar que eran donantes registrados, lo cual a la vez desencadenaba una notificación a sus amigos. La nueva función empezó a tener un efecto de cascada de presión social y el registro de donantes de órganos aumentó en 44 estados de EU.

Esto es sólo el comienzo. Al saber más sobre cómo los cambios pequeños en Facebook pueden alterar la conducta de los usuarios fuera del sitio, a la postre la empresa podría permitir que otros aprovechen a Facebook de la misma manera. "Si la Asociación Americana de Cardiología quisiera fomentar hábitos alimenticios saludables, por ejemplo, podría recurrir al cuaderno de jugadas (playbook) de ingeniería social de Facebook", complementa Marlow.

Datos jugosos

Al igual que otras empresas de redes sociales en la web, como por ejemplo Twitter, Facebook nunca ha logrado la reputación de innovador tecnológico que tienen otros pioneros de internet, como Google. Si Silicon Valley fuera una escuela secundaria, el buscador sería el genio de las matemáticas tranquilo que no se destaca a nivel social, pero que inventa algo indispensable. Facebook sería el alumno molesto que inicia un club con dinamismo social, al cual los alumnos sienten que tienen que integrarse, les guste o no.

En realidad, Facebook emplea hordas de talentosos ingenieros en software (muchos robados a Google) para construir y mantener su club. La tecnología creada para respaldar los esfuerzos del Data Science Team es particularmente innovadora. La escala a la que Facebook opera la ha llevado a inventar hardware y software que son la envidia de otras empresas tecnológicas que intentan adaptarse al mundo de los "grandes datos".

En una especie de traspaso del mando tecnológico, Facebook construyó sus sistemas de almacenamiento expandiendo el poder de su software de fuente abierta llamado Hadoop, que estuvo inspirado en el trabajo de Google y que fue ideado en Yahoo. Hadoop puede dominar tareas de computación aparentemente imposibles, como trabajar con todos los datos que los usuarios confían a Facebook esparciéndolos en varias máquinas dentro del centro de datos. Pero Hadoop no se creó pensando en la ciencia de datos, y para usarla para este fin es necesaria una programación especializada, inflexible.

Los ingenieros de Facebook resolvieron este problema con la invención de Hive, un software de fuente abierta que ahora es independiente de Facebook y es empleado por muchas otras empresas. Hive actúa como un servicio de traducción, haciendo posible explicar vastos bancos de datos Hadoop usando un código relativamente simple.

Gran parte de los datos de Facebook reside en un Framework Hadoop de más de 100 petabatios (un millón de gigabytes), dice Sameet Agarwal, director de Ingeniería de Facebook, quien trabaja en infraestructura de datos. Y la cantidad crece exponencialmente.

Todo esto le ha dado a Facebook un nivel único de excelencia y experiencia, dice Jeff Hammerbacher, el antecesor de Marlow, quien salió de Facebook en 2008 para fundar Cloudera, que desarrolla sistemas basados en Hadoop.

Muchas empresas importantes han pagado grandes sumas de dinero a empresas de software -como Oracle- para realizar el análisis y almacenamiento de datos. Pero ahora las grandes empresas intentan entender cómo maneja Facebook su enorme cantidad de información en sistemas de fuente abierta. "Hace poco pasé todo un día en Fidelity ayudándolos a entender cómo se concibió en Facebook la función de científico de datos y he tenido la misma plática en muchas otras empresas", dice Hammerbacher.

Como los ejecutivos de todas las industrias intentan explotar las oportunidades de "datos grandes", el interés por la tecnología de datos de Facebook sugiere que su negocio de publicidad posiblemente sea sólo una rama de algo mucho más valioso.

¿Negocio? ¿dónde?

Facebook necesita nuevas fuentes de ingreso para cumplir con las expectativas de los inversionistas. Aun después de su decepcionante oferta pública inicial (OPI) tiene una relación precio/ganancia extremadamente alta que no puede justificarse con el aluvión de avisos económicos que en este momento muestra el sitio.

El nuevo campus de Facebook en Menlo Park, California, anteriormente ocupado por Sun Microsystems, evidencia esta presión. Los 3,500 empleados de la empresa se mueven en un espacio que podría albergar a 6,600. Un lote baldío aguarda que alguien invente algún uso de datos para ser ocupado.

Un uso potencial sería simplemente vender conocimiento extraído a partir de la información. d. j. Patil, científico de datos asociado con la firma de capital de riesgo Greylock Partners y ex líder del equipo de ciencia de datos de LinkedIn, cree que Facebook podría inspirarse en Gil Elbaz, inventor del negocio de anuncios de Google, AdSense, que proporciona más de un cuarto de los ingresos de Google.

Gil Elbaz se ha alejado del negocio de los anuncios y ahora dirige un emprendimiento de rápido crecimiento, Factual, que cobra a las empresas por que tengan acceso a grandes cantidades de datos cuidadosamente seleccionados que abarcan desde la ubicación de restaurantes y hoteles hasta los índices de masa corporal de los famosos.

Factual filtra la información y hace que el resultado esté disponible en internet como un banco de conocimiento que puede ser aprovechado por un software, no por humanos. Los clientes lo usan para cubrir los baches de sus datos propios y para elaborar aplicaciones o servicios más inteligentes. Por ejemplo, Facebook usa Factual para obtener información sobre la ubicación de negocios.

Patil señala que Facebook podría convertirse en una fuente de datos per se, vendiendo el acceso a la información reunida a partir de las acciones de sus usuarios. Este tipo de información, dice, podría servir de base para casi cualquier tipo de negocio.

Inicia el día bien informado
Recibe todas las mañanas las noticias más importantes para empezar tu día.

Suponiendo que Facebook pueda dar este paso sin perturbar a sus usuarios y a los entes reguladores, podría ser lucrativo. Una tienda en línea que quisiera concentrar sus promociones en distintos grupos podría, por ejemplo, pagarle a Facebook para usarlo como una gran fuente de conocimiento sobre qué marcas son más populares en qué lugares o cómo cambia la popularidad de ciertos productos a lo largo del tiempo.

De vuelta en Facebook, Cameron Marlow no es el que decide qué cobra la empresa. Pase lo que pase, presume, su objetivo principal es colaborar con el bienestar de las personas que proporcionan sus datos a Facebook, usándolos para hacer que el servicio sea más inteligente. "Es difícil predecir hacia dónde iremos porque estamos en los primeros pasos de esta ciencia. Es enorme la cantidad de cosas potenciales que podemos averiguar a partir de los datos de Facebook".

EL PODER DE FACEBOOK
Facebook podría ser algo más que un club de amigos y conocidos. Y Cameron Marlow ha descubierto algunas cosas para ese fin.
Días antes del Día del Amor y la Amistad, en el blog del Data Science Team se hizo un listado de las canciones más populares entre las personas que recientemente habían publicado en Facebook y que habían iniciado o concluido una relación. El conocimiento que surgió de ello podría ayudar a definir qué tipo de anuncios podrían pegar en los usuarios. Se dedujo que las personas que recién han terminado una relación podrían estar interesadas en un álbum de baladas o que quizá ninguna empresa debería asociar su marca con la avalancha de emociones que surge ante la muerte de un amigo.
El Data Science Team halló que los amigos cercanos influyen mucho en la información que se comparte, pero en general su impacto queda disminuido por la influencia colectiva de numerosos contactos más distantes, a lo que los sociólogos denominan los “lazos débiles”. De esta
forma concluyó que la colección diversa de lazos débiles es lo que determina poderosamente a qué información está expuesto un usuario. Pero el estudio revela también el poder que tiene Facebook. “Si las noticias de Facebook son lo que todos ven, entonces controla cómo se da a conocer la información a la sociedad”, concluye Marlow.
Ahora ve
En las calles de Tokio puedes jugar Mario Kart, pero en la vida real
No te pierdas
×