Wring : Un puissant outil pour extraire des données du Web
J'ai découvert, grâce à Korben, un outil en ligne de commande très puissant pour extraire des contenus de pages Web .
Cet outil est développé en Javascript et se prénomme Wring. Il s'installe de la manière suivante si vous avez déjà NodeJS d'installé sur votre PC :
$ npm install --global wring
Son usage est très simple, pour extraire les numéros gagnants du dernier tirage de l'Euromillions sans aller sur le site Web de la FDJ, il vous suffira de taper la commande suivante :
// Retourne les 5 numC)ros du tirage
wring text "https://www.fdj.fr/jeux/jeux-de-tirage/euromillions/resultats" ".euro_num"
En enrobant un peu, voici un petit script qui extraira la date du tirage et l'ensemble des numéros sortis, étoiles comprises :
#!/bin/bash
URL="https://www.fdj.fr/jeux/jeux-de-tirage/euromillions/resultats"
wring text $URL .dateTirage
echo "-----------------"
wring text $URL .euro_num
echo "-----------------"
wring text $URL .euro_num_c
Pour générer un fichier CSV contenant l'ensemble des résultats de l'Euromillions par date, il vous suffira d'inscrire le script suivant dans un Cron :
#!/bin/bash
URL="https://www.fdj.fr/jeux/jeux-de-tirage/euromillions/resultats"
DATE=`wring text $URL .dateTirage`
NUMS=`wring text $URL .euro_num|tr '\n' ';'`
STARS=`wring text $URL .euro_num_c|tr '\n' ';'`
echo "$DATE;$NUMS;$STARS" > resultats.csv
Vous pouvez trouver de nombreux autres usages plus utiles à Wring notamment via les options eval / html et shot fournies par cet outil.
L'essayer, c'est l'adopter !