Scraping con Python y Apps móviles

El Scraping es una ténica que nos permite extraer información de sitios web, recorriendo el contenido y simulando la navegación de un usuario. Se puede realizar en diversos lenguajes, sin embargo Python tiene librerías (ej. scrapy) que facilitan su realización con poco código y de forma clara.

Los boots de los buscadores web, utilizan esta técnica para indexar el contenido de las páginas web en sus bases de datos. Utilizando el fichero Robots.txt o el .htaccess puedes bloquear el acceso a estos boots o crawlers y evitar el scrapping.

En ciertas circunstancias el uso de Scraping puede resultar ilegal, sobre todo cuando el contenido que se va a extraer esta protegido bajo alguna licencia que prohiba su copia y reproducción.

El Scraping en desarrollo de aplicaciones móviles, es utilizado para crear contenido basándose en otras páginas.

Por ejemplo:

  1. Una aplicación que compare precios de productos de diversos supermercados, con scraping puedes escanear las páginas de los supermercados, extraer los precios y luego crear comparativas.
  2. Aplicación que geolocalice hoteles cercanos a tí. Para disponer de esta información, lo primero es crear una base de datos de hoteles y sus direcciones, ¿como lo conseguimos,? pues haciendo scraping en una web de hoteles.

Si quieres aprender a hacer scraping, basta sólo con entrar a Youtube y buscar "Scraping Python", tendrás a la mano completos tutoriales de como hacerlo. Aquí os dejo un video.

Categorias: Python
Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012. Si continúa navegando consideramos que acepta el uso de cookies.
ACEPTO | Más información