"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Como o BeautifulSoup pode ser usado para extrair dados de uma tabela HTML em Python?

Como o BeautifulSoup pode ser usado para extrair dados de uma tabela HTML em Python?

Publicado em 2024-11-07
Navegar:278

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup Parsing Table

Em Python, BeautifulSoup fornece métodos poderosos para analisar documentos HTML. Quando se depara com um cenário como este, onde você precisa recuperar dados específicos de uma tabela, o BeautifulSoup é útil.

Para extrair a tabela de itens de linha direcionados, utilize sopa.find(), especificando os atributos apropriados dentro do parênteses. Nesse caso, você precisará de:

table = soup.find("table", {"class": "lineItemsTable"})

Em seguida, você pode iterar cada linha da tabela usando table.findAll("tr"). Dentro de cada linha, você pode acessar as células da tabela (td) usando row.findAll("td").

Aqui está um trecho de código aprimorado:

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

Este código produzirá uma lista de listas, com cada sublista representando uma linha na tabela. Ele capturará com eficiência os dados necessários do site.

Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3