「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > JavaScript Regex を使用して HTML から複数行のテキストを抽出する方法

JavaScript Regex を使用して HTML から複数行のテキストを抽出する方法

2024 年 11 月 8 日に公開
ブラウズ:187

How to Extract Multi-Line Text from HTML with JavaScript Regex?

JavaScript Regex を使用した HTML からの複数行テキストの抽出

JavaScript で正規表現を使用して HTML から文字列を取得しようとする場合、修飾子の互換性を考慮します。あなたのシナリオでは、複数行フラグ (/m) に関する問題が発生しています。

Dotall 修飾子と JavaScript

この問題は、JavaScript が本質的に、「dotall」修飾子としても知られる /.../s 修飾子をサポートしています。この修飾子は、ドット (.) 文字を強制的に改行と一致させますが、通常は一致しません。

回避策の作成: 文字クラス

JavaScript の /s 修飾子では、文字クラス () とその否定 (\S) を併用できます。このアプローチは、改行を含むあらゆる文字に効果的に一致します。

更新された正規表現構文

これを念頭に置いて、正規表現を次のように変更する必要があります:

/<div>

ES6 サポート

ES2018 の時点で、JavaScript は「/s」 (dotAll) フラグをサポートしていることに注意してください。これは、より新しい環境では、「/m」フラグの代わりに「/s」フラグを使用して元の正規表現構文を使用できることを意味します:

/<div>
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3