「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > RSS フィードから HTML 特殊文字を効果的に削除するにはどうすればよいですか?

RSS フィードから HTML 特殊文字を効果的に削除するにはどうすればよいですか?

2024 年 11 月 7 日に公開
ブラウズ:794

How to Effectively Remove HTML Special Characters from RSS Feeds?

RSS フィードから HTML 特殊文字を削除する

RSS フィード ファイルを作成する場合、PHP のstrip_tags 関数を使用して HTML タグを削除するのが一般的です。ただし、この関数は、 、&、© などの HTML 特殊コード文字の削除に失敗することがよくあります。

これらの文字を効果的に削除するには、次のオプションを検討してください:

オプション 1: html_entity_decode を使用する

html_entity_decode を使用すると、これらの文字をデコードして元の形式に戻すことができます。

$decodedContent = html_entity_decode($originalContent);

オプション 2: preg_replace を使用する

また、正規表現で preg_replace を使用して、文字を直接削除することもできます。

$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);

このパターンは、数値エンティティ ( ) として表される HTML 特殊文字と一致します。 ; 例) または名前付きエンティティ ( ).

代替パターン

置換の精度を向上させるには、次の修正されたパターンの使用を検討してください。ジャッコ:

$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);

このパターンは、置換を 2 ~ 8 文字のエンティティに制限し、意図しない置換のリスクを軽減します。

リリースステートメント この記事は次の場所に転載されています: 1729255996 権利侵害がある場合は、[email protected] に連絡して削除してください。
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3