HtmlAgilityPack介绍
HtmlAgilityPack是一个专门用来解析Html的库,它可以使用xml的方式来解析html。
有人说了,html本身不就是xml?是的,html就是xml,但是html很宽松,没有关闭的节点也可以用,还有一些其他的内容比如js夹杂在里面。如果直接使用xml解析库的话9成会报错的。
而HtmlAgilityPack会去处理这些问题,把Html转成一个接近标准的xml来供我们使用。
基本用法
主要就是doc.LoadHtml(html);
这里有个重载是doc.Load()
,里面可以直接放url,也可以放Stream
。
我们这里使用LoadHtml
直接加载html内容主要是因为我们的html拿的时候可能还需要别的东西,需要另行获取。
最后的var root = doc.DocumentNode;
这个root就是<html>
节点,整个html的根目录。
阅读全文

公众号近期文章
赞赏支持
0 Responses to “HtmlAgilityPack中使用xpath获取属性值”