Cómo extraer todo su jugo (hasta la última gota) al web scraping
Nacho Mascort y Esteve Castell, de Grupo Planeta y Softonic, han participado en el evento SEOPlus 2018 explicando qué es el scrapping y para qué sirve
Nacho Mascort y Esteve Castell, empleados de Grupo Planeta y Softonic respectivamente, participaron en el evento SEOplus 2018 que tuvo lugar el pasado viernes en la Universidad de Alicante. En su ponencia “Scraping avanzado o cómo hacer que internet sea tu base de datos” Mascort y Castell han explicado qué es es el scrapping, para qué sirve y han enumerado una serie de casos prácticos para poder aplicar la teoría a la práctica correctamente.
El scraping es una técnica que, valiéndose del software, extrae información más allá del sitio web. Se trata de una técnica que aloja en sus entrañas todo tipo de usos. Aun así, el uso más común asociado al scraping es comprobar cambios en la web o en la de un competidor y crear webs dinámicas tomando como punto de referencia fuentes de datos.
Si aplicamos el scraping a nuestro sitio web, podremos verificar que todos los elementos están tal y como los hemos definido en nuestra documentación. Aplicado a sitios webs externos, el scraping es una fenomenal herramienta automatizando procesos para detectar cambios visuales, cambios en el HTML o cambios de contenido.
En su ponencia Mascort y Castell pusieron de relieve la relevancia del DOM (Document Object Model). El DOM es la representación estructural de una página web ydefine la jerarquía de cada elemento dentro de cada página.
En la red de redes hay múltiples herramientas de scraping, desde las más básicas a las más complejas. Una de esas herramientas es Scraper, un plugin de Google Chrome que extra fácilmente datos de una determinada página web en formato de tabla fácilmente exportable a Excel y otros programas.
A la hora de poner en práctica la técnica del scraping es muy importante, por otra parte, conocer desde qué dispositivos y con qué sistemas se está conectando el usuario.
De acuerdo con Mascort y Castell, una buena opción a la hora de lanzarse a la piscina del scraping (que bien utilizado pone dinero contante y sonante sobre la mesa) es Pyton, puesto que utiliza un lenguaje muy sencillo de entender y de fácil aproximación para los que dan sus primeros pasos en el universo de la programación.
No te pierdas nada de MarketingDirecto.com y únete a nuestro Telegram t.me/MarketingDirecto
from Marketing Directo https://ift.tt/2LxMBjf
via
Comentarios
Publicar un comentario