[*Opino}– Netflix y los los algoritmos usados en internet

26-01-2017

Carlos M. Padrón

Que me perdonen los autores del artículo que copio abajo.

Pero los ejemplos que acerca de Netflix citan no se compadecen con mi experiencia al respecto.

Y precisamente por eso me ha llamado la atención este articulo, ya que las tales recomendaciones que Netflix me hace basadas en el algoritmo que usa han resultado, las más de las veces, totalmente descabelladas. Sólo puedo decir que funcionan, y no siempre, cuando se limitan a sugerirme series o películas que tratan de temas similares a la que he visto. Por ejemplo, cencia-ficción, miedo, investigaciones policiacas, etc. Pero a veces sugieren algo que nada tiene que ver con lo que yo haya visto antes.

Supuse que lo relativo a puntaje variaría por regiones o países, pues estaría basado en las preferencias de clientes que, por vivir en determinado país, podrían tener, en su mayoría, gustos afines. Pero resulta que no, pues, como tengo acceso a Netflix de América Latina y al de USA, he notado que las puntuaciones son iguales, y hay películas o series que, si buen son un hit en USA no tienen por qué serlo en América Latina.

Por ejemplo, Netflix tiene una sección de películas extranjeras, europeas en su mayoría, cuya puntuación en USA es muy baja pero que son muy buenas.

~~~

25 ENE 2017 

Christopher Brinton / Mung Chiang

Así funcionan los algoritmos que ordenan la información en internet

Cuando buscamos información en Google, cuando comparamos diferentes objetos en Amazon o cuando nos tomamos un descanso para ver una película o una serie, usamos lo que podríamos llamar los tres principios básicos de la época de Internet: puntuar, clasificar y recomendar.

Al igual que los tres principios básicos tradicionales de la educación —leer, escribir y contar—, ninguna educación moderna es completa sin entender cómo los algoritmos de los sitios web combinan, procesan y sintetizan la información antes de presentárnosla.

Como analizamos en nuestro nuevo libro, “The Power of Networks: Six Principles that Connect Our Lives” [El poder de las redes: seis principios que conectan nuestras vidas], las tres tareas, puntuar, clasificar y recomendar, son interdependientes, aunque al principio puede que eso no resulte evidente. Antes de poder clasificar una serie de objetos, necesitamos algún tipo de medida para ordenarlos, que es una puntuación de la calidad de cada objeto según algún criterio.

Cuando disponemos de listas con una clasificación, podemos cambiar de opinión y hacer recomendaciones sobre objetos concretos a la gente que pueda estar interesada en adquirirlos. Esta interrelación pone de manifiesto la importancia de la manera en que la calidad y el atractivo de un objeto se cuantifican en primer lugar con una puntuación.

Puntuar

Lo que los consumidores y los usuarios de Internet llaman a menudo “puntuar”, las empresas tecnológicas lo pueden llamar scoring [ponerle nota]. Esto es fundamental, por ejemplo, en la manera en que el motor de búsqueda de Google sitúa los enlaces de alta calidad en los primeros resultados de sus búsquedas, en las que normalmente la información más relevante aparece en la primera página de las respuestas.

La primera de estas notas es una “nota sobre la relevancia”, una combinación de múltiples factores que miden lo relacionados que están la página y su contenido con la búsqueda. Por ejemplo, tiene en cuenta si el lugar que ocupan las palabras clave de la búsqueda en la página de resultados es un lugar más o menos destacado.

La segunda es una “nota sobre la importancia”, que refleja la manera en que la red de páginas web está conectada entre sí mediante hipervínculos para determinar la importancia de cada página.

La combinación de estas dos notas, junto a otra información, otorga una puntuación a cada página, y así se determina lo útil que podría resultarle al usuario final. Las puntuaciones más elevadas aparecerán entre los primeros resultados de la búsqueda. Éstas son las páginas que Google recomienda implícitamente al usuario que visite.

Clasificar

Los tres principios básicos también existen en el comercio minorista en Internet. Amazon y otros sitios de comercio electrónico permiten que los clientes escriban comentarios sobre los productos que han adquirido. Las puntuaciones con estrellas que aparecen en estos comentarios normalmente se suman y se convierten en una sola cifra que representa la opinión generalizada de los clientes.

El principio en el que se basa esto se llama “la sabiduría de las masas”, según el cual se presupone que la combinación de muchas opiniones independientes reflejará más la realidad que cualquier evaluación individual.

El principio fundamental de la sabiduría de las masas es que los comentarios reflejan de forma precisa las experiencias de los clientes, y no están sesgados o influidos por, digamos, el hecho de que el fabricante añada una serie de evaluaciones positivas a sus propios productos.

Amazon dispone de mecanismos para eliminar este tipo de comentarios, por ejemplo, exigiendo que la compra se haya hecho desde una determinada cuenta antes de poder escribir un comentario. Luego, Amazon calcula la media de las puntuaciones con estrellas de los comentarios que quedan.

Calcular la media de las puntuaciones es bastante sencillo, pero es más complicado saber cómo clasificar de forma eficaz los productos en función de esas puntuaciones. Por ejemplo, ¿es mejor un producto que tiene 4 estrellas según 200 comentarios, que uno que tiene 4,5 estrellas pero con sólo 20 comentarios? Hay que tener en cuenta en la nota de la clasificación tanto la puntuación media como el tamaño de la muestra.

Existen todavía más factores que hay que tener en cuenta, como la reputación del que hace el comentario (se puede confiar más en las puntuaciones basadas en comentarios de personas con mejor reputación) y la disparidad de las puntuaciones (a la hora de ordenar los productos, se puede rebajar la categoría de los que tienen unas puntuaciones que varían mucho). Amazon también puede presentar productos a diferentes usuarios en un orden distinto según su historial de navegación y los registros de compras anteriores en el sitio web.

Recomendar

El ejemplo perfecto de un sistema de recomendación es el método de Netflix para determinar qué películas le gustarán a un usuario. Los algoritmos predicen qué nota le pondría cada usuario concreto a diferentes películas que todavía no ha visto, analizando su historial anterior de puntuaciones y comparándolas con las de unos usuarios parecidos. Las películas con más probabilidades de gustarle a un usuario concreto son las que finalmente se le ofrecerán.

La calidad de estas recomendaciones depende mucho de la precisión del algoritmo y de su uso del aprendizaje automático, de la extracción de datos y de los propios datos. Cuántas más puntuaciones tengamos de cada usuario y de cada película, mejores serán las predicciones.

Un mecanismo sencillo para predecir las puntuaciones podría asignar un parámetro a cada usuario que determine lo poco severo o lo duro que suele ser en sus comentarios. Otro parámetro podría asignarse a cada película para determinar la aceptación de esa película con respecto a otras.

Algunos modelos más complejos identifican las similitudes entre los usuarios y las películas. Por tanto, si a las personas a las que les gusta el tipo de películas que a ti te gustan han dado una puntuación elevada a una película que no has visto, el sistema podría suponer que a ti también te gustarán.

Esto puede implicar que existan algunos aspectos ocultos en las preferencias de los usuarios y en las características de las películas. También puede hacer que haya que medir cómo han cambiado a lo largo del tiempo las puntuaciones de una película dada. Si una película que antes era desconocida se convierte en un clásico de culto, podría empezar a aparecer más en las listas de recomendaciones de la gente.

Un aspecto fundamental cuando se usan varios modelos es que hay que combinarlos y ajustarlos bien: el algoritmo que ganó el Premio Netflix en el concurso para predecir las puntuaciones de películas en 2009, por ejemplo, fue una mezcla de cientos de algoritmos individuales.

Esta combinación de algoritmos de puntuación, clasificación y recomendación ha transformado nuestras actividades diarias en Internet, mucho más allá de las compras, las búsquedas y el entretenimiento. Su interconexión nos permite saber de una forma más clara, y a veces inesperada, lo que queremos y cómo conseguirlo.

Fuente

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *