"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > RSS 피드에서 HTML 특수 문자를 효과적으로 제거하는 방법은 무엇입니까?

RSS 피드에서 HTML 특수 문자를 효과적으로 제거하는 방법은 무엇입니까?

2024-11-07에 게시됨
검색:310

How to Effectively Remove HTML Special Characters from RSS Feeds?

RSS 피드에서 HTML 특수 문자 제거

RSS 피드 파일을 생성할 때 PHP의 Strip_tags 기능을 사용하여 HTML 태그를 제거하는 것이 일반적입니다. 그러나 이 함수는  , & 및 &copy와 같은 HTML 특수 코드 문자를 제거하지 못하는 경우가 많습니다.

이러한 문자를 효과적으로 제거하려면 다음 옵션을 고려하십시오.

옵션 1: html_entity_decode 사용

html_entity_decode를 사용하여 이러한 문자를 원래 형식으로 다시 디코딩할 수 있습니다.

$decodedContent = html_entity_decode($originalContent);

옵션 2: preg_replace 사용

또는 정규식과 함께 preg_replace를 사용하여 문자를 직접 제거할 수 있습니다.

$cleanContent = preg_replace("/&#?[a-z0-9] ;/i","",$originalContent);

이 패턴은 숫자 엔터티( )로 표시되는 HTML 특수 문자와 일치합니다. ; 예) 또는 명명된 엔터티( ).

대체 패턴

대체의 정확성을 높이려면 다음에서 제안한 대로 수정된 패턴을 사용하는 것이 좋습니다. 자코:

$cleanContent = preg_replace("/&#?[a-z0-9]{2,8};/i","",$originalContent);

이 패턴은 엔터티 교체를 2~8자로 제한하여 의도하지 않은 교체 위험을 줄입니다.

릴리스 선언문 이 글은 1729255996에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3