Navigateur headless
Un navigateur headless (anglais : headless browser, littéralement « navigateur sans tête »), est un navigateur web sans interface graphique.
Les navigateurs sans tête permettent d'automatiser les contrôles d'une page web dans un environnement similaire à certains navigateurs populaires sur le marché en ligne de commande. Ils sont particulièrement utiles pour les tests de pages web car ils interprètent correctement l'HTML, les feuilles de styles et l’exécution du JavaScript avec de l'AJAX ; fonctions qui ne sont pas toujours disponibles lors des tests[1],[2]. En 2009, Google a commencé à utiliser des navigateurs sans tête pour aider son moteur de recherche à effectuer l'indexation des sites utilisant de l'AJAX[3].
Cas d'utilisation des navigateurs sans tête
modifierLes navigateurs sans tête peuvent être utilisés pour[4],[5]:
- Automatiser des tests sur des applications web.
- Effectuer des captures d'écrans sur des pages web.
- Lancer des tests automatisés pour des bibliothèques JavaScript.
- Faire du Web scraping pour récupérer des données.
- Automatiser des interactions avec un site web.
Cas d'utilisation malveillant
modifierLes navigateurs sans tête peuvent également être utilisés pour :
Liste de navigateurs sans tête
modifierVoici une liste de navigateurs proposant des fonctions headless :
- PhantomJS
- un navigateur sans tête utilisant le moteur de rendu WebKit pour le rendu de ses pages et JavaScriptCore pour l'exécution du javascript. PhantomJS était initialement développé par Ariya Hidayate en 2010[9],[10],[11],[12],[13].
- TrifleJS
- Une version du navigateur Internet Explorer scriptable utilisant le moteur de rendu Trident et le moteur JavaScript V8. TrifleJS utilise la même API que PhantomJS et fonctionne en utilisant l'objet WebBrowser du framework .NET WebBrowser pour contrôler la version d'IE installée sur la machine[5],[16].
- Splash
- un navigateur sans tête avec une API HTTP, du scripting en Lua et un IDE IPython(Jupyter). Splash est écrit en Python et utilise le moteur de rendu WebKit.
Navigateur sans tête émulé
modifierCes navigateurs émulent l'environnement d'un navigateur. Alors qu'ils sont en mesure de soutenir des fonctions de navigation communes (parsing HTML, support des cookies, XHR, javascript…), ils ne peuvent pas effectuer de rendu et ont un support limité des événements DOM. Ils s'exécutent généralement plus rapidement qu'un navigateur classique, mais sont incapables d'interpréter correctement de nombreux sites[17],[18],[19].
- Zombie.js. un environnement de navigation destiné à Node.js[20],[21].
- ENVJS. un environnement de navigation écrit en JavaScript pour le moteur Rhino[22].
Navigateurs scriptables
modifierVoici une liste de navigateurs qui nécessitent encore une interface utilisateur mais ayant des API et qui sont destinés à être utilisés de manière similaire aux navigateurs sans tête.
- SlimerJS : un navigateur scriptable utilisant le moteur de rendu de Mozilla Gecko (moteur de rendu). SlimerJS utilise le même langage que PhantomJS[23].
Voir aussi
modifier- Web scraping
- Web testing
- Selenium
- Automatisation de test
Références
modifier- "What is a headless browser?". arhg.net.
- "Quick Start". phantomjs.org.
- "Official Google Webmaster Central Blog: A proposal for making AJAX crawlable".
- (en) « PhantomJS - Scriptable Headless Browser », sur phantomjs.org (consulté le ).
- « triflejs.org »
- « Headless Browser Botnet Used in 150 hour DDoS attack », sur Business 2 Community (consulté le ).
- (en) « Headless Web Traffic Threatens Internet Economy », sur E-Commerce Times, (consulté le ).
- (en) « Headless browsers: legitimate software that enables attack | ITProPortal.com » (consulté le )
- "PhantomJS - PhantomJS". phantomjs.org.
- "FAQ". phantomjs.org.
- "Google Groups". google.com.
- "Commits · ariya/phantomjs · GitHub".
- "ariya/phantomjs".
- Mike Bowler.
- "Platform (Vaadin 7.3.4 API)". vaadin.com. 6 November 2014.
- (en) « Home », GitHub
- "assaf/zombie".
- (en) « Envjs.com - Ce site web est à vendre ! - Ressources et information concernant envjs Resources and Information. », sur envjs.com (consulté le ).
- "JavaScriptMVC - EnvJS". javascriptmvc.com.
- (en) « Zombie », labnotes.org
- "Zombie". labnotes.org.
- (en) « Envjs.com - Ce site web est à vendre ! - Ressources et information concernant envjs Resources and Information. », sur envjs.com (consulté le ).
- Laurent Jouanneau.
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Headless browser » (voir la liste des auteurs).