1、心得:解析网页时,使用过HtmlAgilityPack这个类库,里面用到了XPath来查找结点。在使用过程中,因为html文本的标签十分多,大部分元素是没有id属性的,这时,我们可以使用XPath获取指定的元素,而使用XPath获取想要的html元素不是很方便。这时有个小技巧,可以找到最近的有id属性的元素来帮助获取指定元素,使用HtmlAgilityPack的方法先获取最近的有id的元素,并把断点设置在该方法上,运行并查看其XPath路径,这是只要再加上刚才的元素的XPath路径就可以了。
2、使用:
/html[1]/div[2]/span[3] 表示:html元素下的第二个div标签下的第三个span元素。