Code PHP pour extraire tous les liens d’une page HTML

0
1401

Voici un petit bout de code qui permet d’extraire les liens d’une page HTML en PHP. L’algorithme s’appuie sur un regex dans lequel on indique les empreintes qui délimitent le liens. Reste à boucler sur chacun des liens dans un foreach.

$buffer=file_get_contents('map_page.html');
$regex[0]='/ if (preg_match_all($regex[0], $buffer, $out, PREG_PATTERN_ORDER))
{
foreach($out[1] as $lien)
{
if (!in_array($lien, $tabURL)) {
if ((!strstr($lien,'javascript')) && (!stristr($lien,'thomann_')) && (!stristr($lien,'basket')))
{
$tabURL[]=$lien;
echo '
'.$lien;
}
}
}
}
Extraction en PHP des liens d'une page HTML

LAISSER UNE REPONSE