Scrapage Web Excel VBA
VBA Web Scraping est une technique d'accès aux pages Web et de téléchargement des données de ce site Web vers nos fichiers informatiques. Le scraping Web est possible en accédant à des applications externes comme Internet Explorer. Nous pouvons le faire de deux manières, à savoir la liaison anticipée et la liaison tardive.
Web Scraping avec VBA signifie que lorsque nous utilisons VBA pour récupérer les données des autres sources sur le Web, cela peut nécessiter des connexions pour les sources de données, mais d'abord, pour ce faire, nous devons activer les références de la section outils dans l'éditeur VBA pour la bibliothèque Microsoft HTML afin d'accéder au Web à partir de VBA.
Peu d'entre nous savent qu'avec Excel, nous pouvons accéder aux pages Web et obtenir les données de ces pages Web. Oui, vous avez bien entendu. nous pouvons parcourir des pages Web, accéder à des applications de navigation et bien d'autres. Dans cet article, nous allons vous montrer comment écrire un code VBA Excel pour le scraping Web en détail.
Habituellement, nous ouvrons les pages Web, copions les données et les collons dans nos fichiers comme Excel, Word ou d'autres fichiers. Mais dans cet article, nous allons vous montrer comment accéder à des sites Web d'Excel et faire de nombreux autres types de choses.

Comment supprimer les données du site Web en utilisant VBA?
Lorsque nous voulons accéder à d'autres applications à partir d'Excel, nous pouvons le faire de différentes manières, par exemple, «Early Binding» et «Late Binding». Au stade du débutant, il est toujours prudent d'utiliser la technique «Early Binding».
Pour accéder au site Web, nous avons besoin d'applications de navigation, par exemple « Internet Explorer ». Puisqu'il s'agit d'un objet externe, nous devons d'abord définir la référence.
Suivez les étapes ci-dessous pour supprimer le Web.
Étape 1: définissez la variable VBA et attribuez le type de données « Internet Explorer ».
Code:
Sub Web_Scraping () Dim Internet_Explorer As Internet End Sub

Comme vous pouvez le voir ci-dessus, lorsque nous essayons de définir la référence à Internet Explorer, nous ne voyons pas «Internet Explorer», car «Internet Explorer» est un objet externe, nous devons donc définir la référence.
Étape 2: Pour définir la référence, accédez à " Outils " et choisissez " Références ".

Dans la fenêtre ci-dessous, faites défiler vers le bas et choisissez « Microsoft Internet Controls ».

Étape 3: Cochez la case «Microsoft Internet Controls» et cliquez sur OK. Nous devrions maintenant voir ce nom d'objet dans la liste IntelliSense.
Code:
Sub Web_Scraping () Dim Internet_Explorer As inter End Sub

Étape 4: choisissez «InternetExplorer».
Code:
Sub Web_Scraping () Dim Internet_Explorer As InternetExplorer End Sub

Étape 5: Ensuite, nous devons définir la référence pour activer Internet Explorer. Puisqu'il s'agit d'une variable objet, nous devons utiliser le mot-clé « Set » pour définir les références.
Code:
Sub Web_Scraping () Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer End Sub

Étape 6: Maintenant, en utilisant la variable « Internet_Explorer », nous pouvons utiliser les propriétés et les méthodes d'Internet Explorer.
Entrez le nom de la variable et mettez un point pour voir la liste IntelliSense.
Code:
Sub Web_Scraping () Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer. End Sub

Étape 7: Maintenant, pour afficher l'application Internet Explorer, nous devons choisir la propriété " Visible " et définir le statut sur " True ".
Code:
Sub Web_Scraping () Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer.Visible = True End Sub

Maintenant, exécutez le code et vous devriez voir un Internet Explorer s'ouvrir sur votre ordinateur.

Étape 8: Étant donné qu'aucune adresse Web n'a été mentionnée, nous ne pouvons voir qu'une page vierge. Pour donner l'adresse Web à Internet Explorer, nous avons besoin de la méthode « Navigation ».
Code:
Sub Web_Scraping () Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer.Visible = True Internet_Explorer.Navigate (End Sub

Step 9: As you can see above “Navigation” method asking which URL to be navigated in internet explorer. Now I need to open the website “Wallstreetnmojo,” and I can give the URL address as follows. “https://www.wallstreetmojo.com/”
Code:
Sub Web_Scraping() Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer.Visible = True Internet_Explorer.Navigate ("https://www.wallstreetmojo.com") End Sub

Now run the code, we should see the mentioned web address page in internet explorer.

Here we have a problem that once the web page is opened, our code needs to wait until the page web page fully opened.
Step 10: We need to use the “Do While” loop in VBA to actually wait for our code to go any further until the mentioned page is fully loaded.
So, add below the “Do While” loop to force the macro to wait until the mentioned web page comes to the “Ready State Complete” mode.
Code:
Sub Web_Scraping() Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer.Visible = True Internet_Explorer.Navigate ("https://www.wallstreetmojo.com") Do While Internet_Explorer.ReadyState READYSTATE_COMPLETE: Loop End Sub

Step 11: Now, let’s try to get information about the website in a single line. To get the information about the mentioned web address information, we need to use the “Location Name” property.
Code:
Sub Web_Scraping() Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer.Visible = True Internet_Explorer.Navigate ("https://www.wallstreetmojo.com") Do While Internet_Explorer.ReadyState READYSTATE_COMPLETE: Loop MsgBox Internet_Explorer.LocationName End Sub

Run the code, and in the message box, we would get the information about the website.

Step 12: Now, at the bottom, we can also print website addresses as well.
Code:
Sub Web_Scraping () Dim Internet_Explorer As InternetExplorer Set Internet_Explorer = New InternetExplorer Internet_Explorer.Visible = True Internet_Explorer.Navigate ("https://www.wallstreetmojo.com") Faites pendant que Internet_Explorer.ReadyState READYSTATE_COMPLETEL'explorateur_InternetNewineNomBox & Internet_Explorer.LocationURL End Sub

Maintenant, cela indiquera la description du site Web et affichera également l'adresse du site Web.

Choses à retenir ici
- Le scraping Web est possible en accédant à des applications externes comme Internet Explorer.
- Nous pouvons le faire de deux manières, à savoir, liaison anticipée et liaison tardive. Avec la liaison anticipée, nous pouvons voir la liste IntelliSense, mais avec la liaison tardive, nous ne pouvons pas du tout voir la liste IntelliSense.