「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > BeautifulSoup を使用してネストされた HTML 要素から「href」属性を抽出する方法

BeautifulSoup を使用してネストされた HTML 要素から「href」属性を抽出する方法

2024 年 11 月 14 日公開
ブラウズ:325

How to Extract \'href\' Attributes from Nested HTML Elements Using BeautifulSoup?

BeautifulSoup を使用して 'href' 属性を抽出する方法

HTML データを操作する場合、'href' 属性などの特定の情報を取得することが重要になる場合があります。 。この場合、2 つのタグがあり、1 つはネストされた要素を持ち、目標は、テキストの内容を無視して、'a' タグから 'href' 属性を抽出することです。

BeautifulSoup を使用してこれを達成するには、次のようにします。 「find_all」メソッドを使用できます。この方法を使用すると、属性などのさまざまな基準に基づいてタグを検索できます。コードは次のとおりです:

from bs4 import BeautifulSoup

html = '''next
later'''

soup = BeautifulSoup(html)

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])

このコードは、'href' 属性を持つすべての 'a' タグを反復処理し、次の 'href' 属性の値を出力します。それぞれのタグ。出力は次のようになります:

Found the URL: some_url
Found the URL: another_url

または、名前に関係なく、「href」属性を持つすべてのタグを取得したい場合は、次のように使用できます:

href_tags = soup.find_all(href=True)

このメソッドは、HTML ドキュメント内の「href」属性を持つすべてのタグのリストを返します。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3