wring-screenshot.png

J'ai découvert, grâce à Korben, un outil en ligne de commande très puissant pour extraire des contenus de pages Web .

Cet outil est développé en Javascript et se prénomme Wring. Il s'installe de la manière suivante si vous avez déjà NodeJS d'installé sur votre PC :

$ npm install --global wring

Son usage est très simple, pour extraire les numéros gagnants du dernier tirage de l'Euromillions sans aller sur le site Web de la FDJ, il vous suffira de taper la commande suivante :

// Retourne les  5 numéros du tirage
wring text "https://www.fdj.fr/jeux/jeux-de-tirage/euromillions/resultats" ".euro_num"

En enrobant un peu, voici un petit script qui extraira la date du tirage et l'ensemble des numéros sortis, étoiles comprises :

#!/bin/bash

URL="https://www.fdj.fr/jeux/jeux-de-tirage/euromillions/resultats"
wring text $URL .dateTirage
echo "-----------------"
wring text $URL .euro_num
echo "-----------------"
wring text $URL .euro_num_c

Pour générer un fichier CSV contenant l'ensemble des résultats de l'Euromillions par date, il vous suffira d'inscrire le script suivant dans un Cron :

#!/bin/bash

URL="https://www.fdj.fr/jeux/jeux-de-tirage/euromillions/resultats"
DATE=`wring text $URL .dateTirage`
NUMS=`wring text $URL .euro_num|tr '\n' ';'`
STARS=`wring text $URL .euro_num_c|tr '\n' ';'`

echo "$DATE;$NUMS;$STARS" > resultats.csv

Vous pouvez trouver de nombreux autres usages plus utiles à Wring notamment via les options eval / html et shot fournies par cet outil.

L'essayer, c'est l'adopter !

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.