介尘部落

文学|音乐|休闲娱乐|计算机技术|地球科学|社会学——知识成就命运


HtmlAgilityPack中使用xpath获取属性值

HtmlAgilityPack介绍

HtmlAgilityPack是一个专门用来解析Html的库,它可以使用xml的方式来解析html。

有人说了,html本身不就是xml?是的,html就是xml,但是html很宽松,没有关闭的节点也可以用,还有一些其他的内容比如js夹杂在里面。如果直接使用xml解析库的话9成会报错的。

而HtmlAgilityPack会去处理这些问题,把Html转成一个接近标准的xml来供我们使用。

基本用法

主要就是doc.LoadHtml(html);这里有个重载是doc.Load(),里面可以直接放url,也可以放Stream

我们这里使用LoadHtml直接加载html内容主要是因为我们的html拿的时候可能还需要别的东西,需要另行获取。

最后的var root = doc.DocumentNode;这个root就是<html>节点,整个html的根目录。

阅读全文
公众号-介尘阅读时光
赞赏支持
,发布于 2022-11-16 09:15

0 Responses to “HtmlAgilityPack中使用xpath获取属性值”

Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(required)

(required)

×