Artículos por Manuel Garrido

Como hacer un mapa muy bonito de España en ggplot2

Por Manuel Garrido

(Este post apareció originalmente en mi blog).

Hace unas semanas leí un artículo en el cual Timo Grossenbacher mostraba como consiguió hacer, en mi opinión, uno de los mapas más bonitos que he visto nunca. Timo empleó la que es, en mi opinión, una de las librerias más expresivas y bellas que hay para hacer gráficos, ggplot2. La versión original de ggplot2 es para R, pero existe una versión de python no exhaustiva gracias a la buena gente de Yhat.

Asi que por supuesto, tenía que replicarlo.

Antes que nada, aquí está el mapa.

Mapilla

El código empleado para hacer el mapa lo podeis descargar en github. He compartido varias versiones del mapa para que se pueda observar como los diferentes cambios en las escalas afectan a la visualización.

Código.

Para empezar, importamos las librerías necesarias:


setwd("/DIRECTORIO_DE_TRABAJO/")

if (!require(rgdal …

Como mejorar tu script fácilmente

Por Manuel Garrido

Esta entrada apareció originalmente en inglés en mi blog.

Nos ha pasado a todos. Ese momento en el que descubres que sabes suficiente sobre un lenguage de programacion que quieres ponerlo en práctica y construir "algo", lo que sea.

Una de las mejores cosas de la comunidad de Python es no sólo su habilidad para construir cosas increíbles, sino también para compartirlas con todo el mundo, mejorando la comunidad en el proceso.

Sin embargo, llevo un tiempo fijándome en un patrón que se repite en algunos de estos proyectos. Seguro que has visto alguno así. Hablo de esos proyectos con 2 ó 3 componentes, donde el README tiene una pequeña descripción del proyecto, quizás un par de lineas explicando como ejecutar el proyecto, y frases del tipo, "Seguramente añadiré X o Y si tengo tiempo".

El caso es que muchos …

Breve introducción a los Sistemas de Recomendación

Por Manuel Garrido

En este pequeño tutorial, vamos a hablar sobre Sistemas de Recomendación.

Es posible que no sepas que son, sin embargo interactúas constantemente con ellos en Internet.

amazon

Cada vez que Amazon te sugiere productos relacionados...

netflix

O cuando Netflix o Youtube te recomiendan contenido que te puede interesar...

La finalidad de un sistema de recommendación es predecir la valoración que un usuario va a hacer de un ítem que todavía no ha evaluado.

Esta valoración se genera al analizar una de dos cosas, o las características de cada item, o las valoraciones de cada usuario a cada item, y se usa para recomendar contenido personalizado a los usuarios.

Hay dos tipos principales de sistemas de recomendación:

  • Filtrado de Contenido. Las recomendaciones están basadas en las características de cada item.
  • Filtrado Colaborativo. Las recomendaciones están basadas en las valoraciones existentes de los usuarios …

Como hacer Análisis de Sentimiento en español

Por Manuel Garrido

Este post es una continuación de un articulo previo donde explico como obtener y dibujar en un mapa un mapa de calor de miles de tweets enviados desde mi ciudad

Puedes encontrar el código que he usado en github.

Tambien he subido el archivo de tweets obtenido en el articulo anterior para que puedas seguir este tutorial sin tener que descargarte los tweets.

En este post, me enfocaré en como hacer análisis de sentimiento (Sentiment Analysis) en español.

Hacer Sentiment Analysis en inglés es muy fácil. Hay múltiples paquetes que vienen con modelos preparados para calcular el sentimiento o polaridad de un nuevo texto (ejemplos incluyen TextBlob o word2vec).

Sin embargo, no tengo constancia de un modelo preparado en español, así que en este post vamos a hacer nuestro propio modelo predictivo :).

Para eso, lo primero que necesitamos es un …

Dibujando 100k tweets de mi ciudad

[Esta entrada apareció originalmente en inglés en mi blog].

Hace tiempo que he querido jugar con la API de Twitter. El pasado verano se me ocurrió que podría ser interesante dibujar un mapa de mi ciudad (Murcia, España, bella ciudad con comida increible) mostrando un heatmap de tweets.

La idea es que dibujando esos tweets podría encontrar patrones interesantes de mi ciudad. Por ejemplo:

  • ¿Desde qué áreas la gente tuitea más?
  • ¿Qué horas del día son las más activas?
  • ¿Cuales son los lugares más felices/tristes?
  • ¿Hay alguna comunidad tuitera local extranjera?

Con esas ideas en la cabeza empecé la investigación. Primero, necesitaba una librería para interactuar con la API de Twitter. Después de probar la extensa cantidad de wrappers disponibles me decidí por Tweepy. Posee una interfaz simple y agradable de usar y está bien mantenida.

(INCISO, todo el …