leitende Java html parsers: Stärken und Schwächen
In den Java -Ökosystemen wählen Sie den richtigen Html Parser für verschiedene Webautomations -Taschen. Zu verschiedenen empfohlenen Parser gehören JTIDY, Nekohtml, JSOUP und TagSoup. Jedes bietet einzigartige Funktionen und Nachteile.
allgemeine Merkmale
Die meisten Java HTML -Parser implementieren die W3C -Dom -API, sodass Sie auf das Dom -Baum zugreifen können. Sie unterscheiden Kopfloser Webbrowser-ähnlicher API. Es ermöglicht Aktionen wie Formulare, JavaScript-Ausführung und Webseiten-Tests.
JSOUP: verfügt über eine benutzerdefinierte API, die die HTML-Manipulation und -A-Abrufen von Daten mit jQuery-like-CSS-Selektoren vereinfacht. Seine Stärke liegt in seiner Benutzerfreundlichkeit und effizientem Dombaum -Traversal. XPath:
string sement1 = (xpath.compile ("//*[@id = 'Frage'] //*[enthält (@class, 'post-text') // p [1]"). XPathConstants.node) .getFirstchild (). Zeichenfolge Absatz 1 = Frage. project:
For standard DOM traversal: JTidy, NekoHTML, TagSoupFor unit testing HTML: HtmlUnit
For convenient HTML data extraction: Jsoup
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3