Como recuperar o conteúdo da página usando cURL apesar dos erros de “Página movida”?

Primeira página > Programação > Como recuperar o conteúdo da página usando cURL apesar dos erros de “Página movida”?

Como recuperar o conteúdo da página usando cURL apesar dos erros de “Página movida”?

Publicado em 2024-11-09

Navegar:515

$How to Retrieve Page Content Using cURL Despite \$

Recuperando o conteúdo da página usando cURL

Nesse contexto, você procura extrair o conteúdo de uma página de resultados de pesquisa do Google usando cURL. Apesar da tentativa de definir agentes de usuário e várias opções, a recuperação bem-sucedida do conteúdo da página escapou de você. Redirecionamentos ou erros de "página movida" continuam a atrapalhar seus esforços.

Acredita-se que o problema pode resultar da codificação de caracteres especiais na string de consulta. Para mitigar isso, são necessárias alterações em seu código PHP.

Esta é a abordagem:

function get_web_page($url)
{
    $user_agent = 'Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20100101 Firefox/8.0';

    $options = array(
        CURLOPT_CUSTOMREQUEST => "GET",
        CURLOPT_POST           => false,
        CURLOPT_USERAGENT      => $user_agent,
        CURLOPT_COOKIEFILE     => "cookie.txt",
        CURLOPT_COOKIEJAR      => "cookie.txt",
        CURLOPT_RETURNTRANSFER => true,
        CURLOPT_HEADER         => false,
        CURLOPT_FOLLOWLOCATION => true,
        CURLOPT_ENCODING       => "",
        CURLOPT_AUTOREFERER    => true,
        CURLOPT_CONNECTTIMEOUT => 120,
        CURLOPT_TIMEOUT        => 120,
        CURLOPT_MAXREDIRS      => 10
    );

    $ch = curl_init($url);
    curl_setopt_array($ch, $options);
    $content = curl_exec($ch);
    $err = curl_errno($ch);
    $errmsg = curl_error($ch);
    $header = curl_getinfo($ch);
    curl_close($ch);

    $header['errno']   = $err;
    $header['errmsg']  = $errmsg;
    $header['content'] = $content;
    return $header;
}

Uso:

$result = get_web_page($url);

if ($result['errno'] != 0) {
    // Handle errors: bad URL, timeout, redirect loop
}

if ($result['http_code'] != 200) {
    // Handle errors: no page, no permissions, no service
}

$page = $result['content'];

Com este código, agora você pode recuperar o conteúdo exato da página conforme exibido em seu navegador. Ao levar em conta os caracteres especiais na string de consulta, você pode superar os obstáculos enfrentados anteriormente.

Declaração de lançamento Este artigo foi reimpresso em: 1729596678 Se houver alguma violação, entre em contato com [email protected] para excluí-lo

Tutorial mais recente Mais>

Como posso executar várias instruções SQL em uma única consulta usando node-mysql?
suporte de consulta multi-statements em node-mysql em node.js, a pergunta surge ao executar múltiplas declarações SQL em uma única dúvida usan...

Programação Postado em 2025-05-20
Como implementar eventos personalizados usando o padrão de observador em Java?
criando eventos personalizados em java eventos personalizados são indispensáveis em muitos cenários de programação, permitindo que os componen...

Programação Postado em 2025-05-20
Como posso gerar com eficiência as lesmas amigáveis ao URL a partir de strings unicode no PHP?
criando uma função para geração de lesmas eficientes criando lesmas, representações simplificadas de strings unicode usadas nos URLs, podem se...

Programação Postado em 2025-05-20
Python Metaclass Working Princípio e Criação e Personalização de Classe
O que são metaclasses em python? metaclasses são responsáveis por criar objetos de classe em python. Assim como as aulas criam instâncias, as ...

Programação Postado em 2025-05-20
Por que as imagens ainda têm fronteiras no Chrome? `Border: Nenhum;` Solução inválida
removendo a borda da imagem em Chrome Uma questão frequente encontrada ao trabalhar com imagens em Chrome e IE9 é a aparência de uma borda fin...

Programação Postado em 2025-05-20
Variedade
Os métodos são FNs que podem ser chamados em objetos Matrizes são objetos, portanto, eles também têm métodos no JS. Flice (Begin): Extra...

Programação Postado em 2025-05-20
Por que o Microsoft Visual C ++ falha ao implementar corretamente a instanciação do modelo bifásico?
O mistério do modelo de duas fases "quebrado" bifásia instanciação no Microsoft Visual C Declaração de Problema: STRAGLES Os usuár...

Programação Postado em 2025-05-20
Como remover os manipuladores anônimos de eventos JavaScript de maneira limpa?
removendo os ouvintes anônimos do evento adicionando ouvintes de eventos anônimos a elementos fornece flexibilidade e simplicidade, mas quando é...

Programação Postado em 2025-05-20
Por que as expressões lambda exigem variáveis "final" ou "final válida" em Java?
expressões lambda requerem "final" ou "efetivamente" variáveis a mensagem de erro "BEATILE Utilizada na expressão l...

Programação Postado em 2025-05-20
Qual é a diferença entre funções aninhadas e fechamentos em Python
funções aninhadas vs. fechamentos em python enquanto as funções aninhadas em python se assemelham superficialmente, e são fundamentalmente dis...

Programação Postado em 2025-05-20
Como modificar efetivamente o atributo CSS do pseudo-elemento ": depois" usando jQuery?
Entendendo as limitações dos pseudo-elementos no jQuery: acessar o ": depois" seletor no desenvolvimento da web, pseudo-elementos co...

Programação Postado em 2025-05-20
O erro do compilador "usr/bin/ld: não pode encontrar -l" solução
Erro encontrado: "usr/bin/ld: não é possível encontrar -l " ao tentar compilar um programa, você pode encontrar a seguinte mensagem ...

Programação Postado em 2025-05-20
Python Leia o arquivo CSV UnicodedecodeError Ultimate Solution
unicode decodificar erro no arquivo csv lendo Ao tentar ler um arquivo csodo (& sinod) usando o módulo CSV embutido, você pode encontrar um er...

Programação Postado em 2025-05-20
Tags de formatação HTML
Elementos de formatação HTML **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to form...

Programação Postado em 2025-05-20
Por que Java não pode criar matrizes genéricas?
ERRO DE CRIAÇÃO DE MATOR DE ARRAY GENERÍCOLA Pergunta: quando se atende a criar um array de uma matriz genérica usando uma expressão como:...

Programação Postado em 2025-05-20

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo