-
j.b.s
-
a posté un article :
Modifier les éléments
Je ne reviens ni sur la constitution de l'arbre par le parser lxml, ni sur la navigation dans l'arbre ni sur la recherche. J'explique ici comment modifier l'arbre à partir d'un exemple. Pour la réalisation de mon mot...Mercredi 6 Juillet 2016 à 09:51
-
a posté un article :
Chercher dans l'arbre
Reprenons notre exemple habituel : le site de bougies parfumées Scandles Scandles est un site marchand Wordpress qui utilise l'extension commerce Woocommerce. Supposons que nous voulions extraire de la page produit, le prix et ...Mardi 5 Juillet 2016 à 20:51
-
a posté un article :
Navigation dans l'arbre
BeautifulSoup permet de naviguer au sein de l'arbre créé lors de l'analyse syntaxique d'un document X(HTML). Après la création de l'objet BS4 : from bs4 import BeautifulSoup import requests u="https://...Mardi 5 Juillet 2016 à 15:48
-
a posté un article :
BeautifulSoup
BeautifulSoup (BS4) est une bibliothèque (package) pour parser du HTML/XML. BS4 est écrit en Python. BS4 utilise par défaut le parser lxml mais vous pouvez en spécifier un autre (par exemple html5lib) D...Lundi 4 Juillet 2016 à 13:02
-
a posté un article :
Scraping du Web
Mon 1er post est une brève présentation de ce que sera la teneur générale de ce blog. Il s'agit avant tout de scraping du Web, c'est à dire de la collecte automatisée de données en prov...Vendredi 1er Juillet 2016 à 14:55
-