jueves, 9 de diciembre de 2010

Cómo se investigan los sentimientos en Internet


Las computadoras pueden ser buenas procesando números, pero ¿pueden procesar emociones?

El surgimiento de los blogs y de las redes sociales ha impulsado un mercado en alza en relación con la opinión personal: críticas, calificaciones, recomendaciones y otras formas de expresión en línea. Para los científicos dedicados a la informática, esta creciente montaña de datos, que aumenta rápidamente, abre una ventana tentadora hacia la conciencia colectiva de los usuarios de Internet.

Un campo emergente, conocido como análisis de emociones, está tomando forma en torno a una de las fronteras sin explorar del mundo de la computación: la traducción de los caprichos de la emoción humana a datos concretos.

Esto es más que sólo un ejercicio de programación interesante. Para muchas empresas, la opinión en línea se ha convertido en una especie de moneda virtual que puede otorgar éxito o fracaso a un producto en el mercado.

Sin embargo, muchas empresas se esfuerzan por encontrar un sentido al diluvio de quejas y cumplidos que ahora rondan sus productos en línea. A medida que las herramientas de análisis de emociones comiencen a tomar forma, no sólo podrían ayudar a las empresas a mejorar sus ganancias, sino que finalmente también las ayudarían a transformar la experiencia de búsqueda de información en línea.

Diversas nuevas compañías de análisis de emociones se encuentran tratando de aprovechar el creciente interés de las empresas por lo que se dice en línea.

"Los medios sociales solían ser lindos proyectos para los consultores de 25 años", dijo Margaret Francis , vicepresidente de productos en Scout Labs , una firma ubicada en San Francisco. Ahora, agregó, los altos ejecutivos "los reconocen como una muy rica fuente de inteligencia de mercado".

Scout Labs, que se encuentra respaldada por Minor Ventures , la firma de capital de riesgo iniciada por el fundador de CNet , Halsey Minor, presentó recientemente un servicio de suscripción que permite a los clientes monitorizar blogs, artículos de noticias, foros en línea y sitios de redes sociales en busca de tendencias en las opiniones sobre productos, servicios o temas de actualidad.

A principios de mayo, el mercado de entradas, StubHub , utilizó la herramienta de monitorización de Scout Labs para identificar un aumento repentino en las emociones negativas en los blogs después de que un partido entre los equipos Yankees y Red Sox fuera demorado por lluvia.

Los encargados del estadio informaron por error a cientos de fanáticos que el partido había sido cancelado y StubHub denegó la solicitud de devolución del dinero de las entradas por parte de los fanáticos alegando que el partido se había jugado. Pero después de detectar que se gestaban problemas en línea, la compañía ofreció descuentos y créditos a los fanáticos afectados. La firma se encuentra ahora evaluando nuevamente su política sobre el mal tiempo.

"Esta es una advertencia para nosotros", dijo John Whelan, director de servicio al cliente de StubHub.

Jodange , con sede en Yonkers, ofrece un servicio orientado a los editores en línea, el cual permite incorporar los datos de opinión procedentes de más de 450.000 fuentes, incluyendo fuentes de noticias tradicionales, blogs y también Twitter.

Basado en una investigación llevada cabo por Claire Cardie, ex profesora de Informática de laUniversidad de Cornell , y Jan Wiebe, de la Universidad de Pittsburgh , el servicio utiliza un sofisticado algoritmo que no sólo evalúa las emociones acerca de temas específicos, sino que también identifica a los titulares de opinión más influyentes.

Jodange, cuyos primeros inversores incluyen a la Fundación Nacional de Ciencia, trabaja actualmente en un nuevo algoritmo que podría utilizar los datos de opinión para predecir eventos futuros, como pronosticar el impacto de las editoriales de prensa sobre el precio de las acciones de una empresa.



En un caso similar, The Financial Times recientemente presentó Newssift , un programa experimental que realiza un seguimiento de temas de negocios en las noticias, junto con un motor de búsqueda especializado que permite a los usuarios organizar sus consultas por tema, entidad, lugar y persona.

Al utilizar Newssift, una búsqueda de Wal-Mart revela que la emoción reciente sobre la compañía es positiva en una proporción de un poco más de dos a uno. Pero cuando esa búsqueda se refina con el término sugerido "fuerza laboral y sindicatos", sin embargo, la proporción de emociones positivas respecto de las negativas se aproxima al uno a uno.

Estas herramientas podrían ayudar a las empresas a identificar el efecto de cuestiones específicas sobre las percepciones de los clientes, ayudándoles a responder con las apropiadas estrategias de comercialización y relaciones públicas.

Para los navegantes de la Red ocasionales, más simples encarnaciones de análisis de emociones surgen bajo la forma de herramientas livianas como Tweetfeel , Twendz y Twitrratr . Estos sitios permiten a los usuarios "tomar el pulso" a los usuarios de Twitter sobre temas particulares.

Una búsqueda rápida en Tweetfeel, por ejemplo, revela que al 77% de los usuarios de Twitter les gustó la película Julie & Julia. Pero la misma búsqueda en Twitrratr revela algunas fallas. El sitio asignó una puntuación negativa a un tweet que decía: "¡Julie y Julia fue realmente un placer!". Y ese mismo mensaje terminaba con "todos nos sentimos muy hambrientos después"; el sistema tomó la palabra "hambrientos" como indicador de emociones negativas.

Mientras que los algoritmos más avanzados utilizados por los Scout Labs, Jodange y Newssift emplean análisis avanzados para evitar estas fallas, ninguno de estos servicios funciona perfectamente. "Nuestro algoritmo es exacto entre un 70 y un 80 por ciento", dijo Francis, quien añadió que sus usuarios pueden reclasificar los resultados inexactos, por lo que el sistema aprende de sus errores.

La traducción de la parte "evasiva" del lenguaje humano a valores binarios siempre será una ciencia imperfecta, sin embargo. "Las emociones son muy diferentes de los hechos convencionales", dijo Seth Grimes, el fundador de la consultora suburbana de Maryland, Alta Plana , quien apunta a los muchos factores culturales y matices lingüísticos que hacen difícil convertir un texto escrito a una simple emoción en pro o contra. "?Pecaminoso?" es algo bueno cuando se aplica a una torta de chocolate", señaló.

Los algoritmos más sencillos funcionan mediante el escaneo de palabras clave para categorizar una declaración como positiva o negativa, sobre la base de un simple análisis binario ("amor" es bueno, "odio" es malo). Pero ese enfoque no logra captar las sutilezas que hacen que el lenguaje humano tenga vida: la ironía, el sarcasmo, la jerga y otras expresiones idiomáticas. El análisis confiable de emociones requiere el análisis gramatical de muchos tonos grises lingüísticos.

"Estamos tratando con una emoción que puede expresarse de formas muy sutiles", afirmó Bo Pang, investigador de Yahoo! , quien co-escribió "Opinion Mining and Sentiment Analysis" (Extracción de Opiniones y Análisis de Emociones), uno de los primeros libros académicos sobre el análisis de emociones.

Para llegar a la verdadera intención de una declaración, Pang desarrolló un software que examina varios filtros diferentes, incluyendo la polaridad (¿la declaración es positiva o negativa?), la intensidad (¿cuál es el grado de emoción que se expresa?) y la subjetividad (¿cuán parcial o imparcial es la fuente?).

Por ejemplo, la preponderancia de los adjetivos con frecuencia señala un alto grado de subjetividad, mientras que declaraciones repletas de sustantivos y verbos tienden hacia un punto de vista más neutral.

A medida que los algoritmos de análisis de emociones se vuelvan más sofisticados, deberían comenzar a dar resultados más precisos, los cuales finalmente podrían indicar el camino hacia más sofisticados mecanismos de filtrado. Podrían convertirse en una parte del uso cotidiano de Internet.

"Veo al análisis de emociones convirtiéndose en una característica estándar de los motores de búsqueda", expresó Grimes, quien sugiere que este tipo de algoritmos podría comenzar a influir en la búsqueda en la Red relacionada con los propósitos generales y en las más especializadas en áreas como el comercio electrónico, las reservas de viaje y las críticas de cine.

Pang prevé un motor de búsqueda que afina los resultados para los usuarios, basado en las emociones. Por ejemplo, podría influir en el orden de los resultados de la búsqueda de ciertos tipos de consultas como "mejor hotel en San Antonio".

A medida que los motores de búsqueda comiencen a incorporar más y más datos de opinión en sus resultados, la distinción entre hechos y opiniones podría llegar a dejar de distinguirse hasta el punto donde, como expresó David Byrne en una ocasión , "todos los hechos vienen con puntos de vista".

Fuente: Por Alex Wright

The New York Times

© NYT Traducción de Ángela Atadía de Borghetti

6 comentarios:

Mariana Soffer dijo...

Muy interesante el articulo, ademas habla de las cosas que hicieron las personas mas relevantes y respetadas en esta area. Aca tenes un link si queres a un articulo que escribi hace ya como un anio y medio, pero habla del mismo tema y no analiza con demasiada profundidad los temas de los que habla.
http://singyourownlullaby.blogspot.com/2009/08/opinion-mining-and-sentiment-analysis.html

La nena dijo...

Si es muy interesante el articulo, y el estudio que se esta haciendo, necesario para poder hacer analisis del mercado, ya que nos olvidamos de las emociones y son las que pueden llevar al triunfo algo, o que desaparezca, ademas del trabajo.

Anónimo dijo...

Esta será una excelente página web, podría estar interesado en hacer una entrevista sobre cómo se creó? Si me lo e-mail!

Sebastián Camiser dijo...
Este comentario ha sido eliminado por el autor.
Sebastián Camiser dijo...

Muchas Gracias Mariana y María por sus comentarios! Evidentemente la investigación abre nuevas fronteras, perfeccina métodos y complejiza el análisis!
Saludos,
Sebastián
sebi10@gmail.com

Anónimo dijo...

Realmente blog informativo aquí mi amigo. Sólo quería hacer un comentario y decir que mantener el trabajo de calidad. He marcado tu ahora y voy a volver a leer más en el futuro de mi amigo! También bien elegidos los colores sobre el tema que va bien con el blog en mi modesta opinión:)