RSS フィードから HTML 特殊文字を削除する
RSS フィード ファイルを作成する場合、PHP のstrip_tags 関数を使用して HTML タグを削除するのが一般的です。ただし、この関数は、 、&、© などの HTML 特殊コード文字の削除に失敗することがよくあります。
これらの文字を効果的に削除するには、次のオプションを検討してください:
オプション 1: html_entity_decode を使用する
html_entity_decode を使用すると、これらの文字をデコードして元の形式に戻すことができます。
$decodedContent = html_entity_decode($originalContent);
オプション 2: preg_replace を使用する
また、正規表現で preg_replace を使用して、文字を直接削除することもできます。
$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);
このパターンは、数値エンティティ ( ) として表される HTML 特殊文字と一致します。 ; 例) または名前付きエンティティ ( ).
代替パターン
置換の精度を向上させるには、次の修正されたパターンの使用を検討してください。ジャッコ:
$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);
このパターンは、置換を 2 ~ 8 文字のエンティティに制限し、意図しない置換のリスクを軽減します。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3