Lendo um HTML com php utilizando a biblioteca cURL

É um artigo simples onde explico como pegar o conteudo HTML de uma url qualquer e salvar em uma variavel com php.

Eu utilizei o modelo para gerar um pdf mas existem outras milhares de utilizacoes.


<?php

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, “http://www.gilix.com.br/”);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch,CURLOPT_USERAGENT,$_SERVER[‘HTTP_USER_AGENT’]);

$pagina =  curl_exec($ch);

?>

<textarea cols=”130″ rows=”60″><?php echo $pagina; ?></textarea>

Explicacoes:

CURLOPT_RETURNTRANSFER: TRUE para retornar a transferencia como uma string do valor de retorno de curl_exec () em vez de diretamente para a saída.

CURLOPT_HEADER: TRUE para incluir o cabeçalho na saída.

CURLOPT_USERAGENT: Envia o cabeçalho do seu browser para o site assim simulando que voce esta acessando a pagina do seu browser.

Abaixo um exemplo de uso do cURL para puxar os resultados de loteria da página da Folha de São Paulo.

<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,"http://www1.folha.uol.com.br/folha/loterias/loteria_federal.shtml");
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
$result=curl_exec ($ch);
curl_close ($ch);
$core = split('<!--LOTERIA_FEDERAL-->', $result);
$main = split('<!--/LOTERIA_FEDERAL-->', $core[1]);
echo $main[0];
?>

 

Fontes:

http://hk2.php.net/curl_setopt
http://md.php.net/curl_init