Autor Tema: Extraer los "LINK" [enlaces] de un sitio web  (Leído 1263 veces)

0 Usuarios y 1 Visitante están viendo este tema.

Desconectado xombra

  • Moderador Global
  • Usuario Dedicado
  • *****
  • Mensajes: 169
  • Puntuación: 3
  • Sexo: Masculino
    • Ver Perfil
    • http://www.xombra.com
Extraer los "LINK" [enlaces] de un sitio web
« : 18 de marzo de 2008, 04:23:25 pm »
Este sencillo script nos permite extraer de un sitio web los enlaces que contiene. Su uso??? lo dejo a tu imaginación.

Código: [Seleccionar]
<?php // This script will extract all the hyperlinks from a given web page
// Thanks!
// (C) 2007 - Anthony Eden | www.WAY2WEB.net
// 
function hyperlinkextract($s1,$s2,$s){
  
$myarray=array();    $s1=strtolower($s1);
  
$s2=strtolower($s2); $l1=strlen($s1);
  
$l2=strlen($s2);     $scheck=strtolower($s);
  do{ 
$pos1 strpos($scheck,$s1);
  if(
$pos1!==false){
    
$pos2 strpos(substr($scheck,$pos1+$l1),$s2);
    if(
$pos2!==false){ $myarray[]=substr($s,$pos1+$l1,$pos2);
      
$s=substr($s,$pos1+$l1+$pos2+$l2);
      
$scheck=strtolower($s); } }
  } while ((
$pos1!==false)and($pos2!==false)); return $myarray
}

$enlace = &#39;http://www.xombra.com/&#39;;
$content file_get_contents($enlace);
$myarray hyperlinkextract("href=\"","\"",$content);

// Process all the links
foreach($myarray as $key => $val) {
echo 
"<br />".$val."\n"; }
?>

 8)
« Última Modificación: 18 de marzo de 2008, 05:43:11 pm por xombra »
---------------------------------------------
Sitio web: http://www.xombra.com
Coordinador Safecreative Venezuela - http://www.safecreative.org
Coordinador Regional AWVEN - http://www.awven.com
Twitter: @xombra
Identi.ca: xombra
GNU/Linux User: #414452
-------------------------------------

Desconectado ashrey

  • Fanático
  • ****
  • Mensajes: 431
  • Puntuación: 7
  • Sexo: Masculino
  • Wombat Team
    • Ver Perfil
    • Blog de ABerroteran
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #1 : 18 de marzo de 2008, 05:02:50 pm »
Buen codigo. Voy a usarlo en un buscador que tengo en mi servidor local.

Desconectado Xplorernet

  • Novato
  • *
  • Mensajes: 9
  • Puntuación: 0
  • Sexo: Masculino
    • Ver Perfil
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #2 : 18 de marzo de 2008, 08:27:18 pm »
Exelente para complementar un modulo o algo similar a un Bot ;D

Desconectado danielperaza

  • Novato
  • *
  • Mensajes: 4
  • Puntuación: 0
    • Ver Perfil
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #3 : 01 de septiembre de 2009, 12:14:30 pm »
Aunque mas lento, tal vez utilizar Expresiones Regulares simplificaria el trabajo y podria ser mas efectivo para captar datos 100% validos.

Desconectado datobinario

  • Novato
  • *
  • Mensajes: 10
  • Puntuación: 0
  • Sexo: Masculino
    • Ver Perfil
    • @datobinario
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #4 : 10 de abril de 2010, 09:54:58 am »
Saludos, una preguntica, ¿cuales son los valores que requiere la función?
$s1,$s2,$s
Quien no pregunta, simplemente tiene miedo de aprender...

Desconectado xombra

  • Moderador Global
  • Usuario Dedicado
  • *****
  • Mensajes: 169
  • Puntuación: 3
  • Sexo: Masculino
    • Ver Perfil
    • http://www.xombra.com
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #5 : 23 de mayo de 2010, 11:03:44 pm »

Citar
Saludos, una preguntica, ¿cuales son los valores que requiere la función?
$s1,$s2,$s

Allí estan en el mismo código

Código: [Seleccionar]

$enlace = 'http://www.xombra.com/';
$content = file_get_contents($enlace);

$myarray = hyperlinkextract("href=\"","\"",$content);


---------------------------------------------
Sitio web: http://www.xombra.com
Coordinador Safecreative Venezuela - http://www.safecreative.org
Coordinador Regional AWVEN - http://www.awven.com
Twitter: @xombra
Identi.ca: xombra
GNU/Linux User: #414452
-------------------------------------

Desconectado Telfe

  • Novato
  • *
  • Mensajes: 4
  • Puntuación: 0
    • Ver Perfil
Re:Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #6 : 21 de enero de 2011, 08:16:02 am »
Gracias por el codigo, muy bueno.
Saludos

PHP de Venezuela

Re:Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #6 : 21 de enero de 2011, 08:16:02 am »

 

PHP de Venezuela on Facebook