Voici un petit bout de code qui permet d’extraire les liens d’une page HTML en PHP. L’algorithme s’appuie sur un regex dans lequel on indique les empreintes qui délimitent le liens. Reste à boucler sur chacun des liens dans un foreach.
Voici un petit bout de code qui permet d’extraire les liens d’une page HTML en PHP. L’algorithme s’appuie sur un regex dans lequel on indique les empreintes qui délimitent le liens. Reste à boucler sur chacun des liens dans un foreach.
$buffer=file_get_contents('map_page.html');
$regex[0]='/ if (preg_match_all($regex[0], $buffer, $out, PREG_PATTERN_ORDER))
{
foreach($out[1] as $lien)
{
if (!in_array($lien, $tabURL)) {
if ((!strstr($lien,'javascript')) && (!stristr($lien,'thomann_')) && (!stristr($lien,'basket')))
{
$tabURL[]=$lien;
echo '
'.$lien;
}
}
}
}