Em Python, BeautifulSoup fornece métodos poderosos para analisar documentos HTML. Quando se depara com um cenário como este, onde você precisa recuperar dados específicos de uma tabela, o BeautifulSoup é útil.
Para extrair a tabela de itens de linha direcionados, utilize sopa.find(), especificando os atributos apropriados dentro do parênteses. Nesse caso, você precisará de:
table = soup.find("table", {"class": "lineItemsTable"})
Em seguida, você pode iterar cada linha da tabela usando table.findAll("tr"). Dentro de cada linha, você pode acessar as células da tabela (td) usando row.findAll("td").
Aqui está um trecho de código aprimorado:
data = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
Este código produzirá uma lista de listas, com cada sublista representando uma linha na tabela. Ele capturará com eficiência os dados necessários do site.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3