|
XPath提取 XPath是一门在HTML/XML文档中查找信息的语言。 XPath使用路径表达式在XML文档中进行导航,可以通过FireFoxfirebug或者Chrome开发者工具快速获取。 XPath节点属性 innerHTML获取位于对象起始和结束标签内的HTML(HTML代码,不包含开始/结束代码) innerText获取位于对象起始和结束标签内的文本(文本字段,不包含开始/结束代码) outerHTML获取对象及其内容的HTML形式(HTML代码,包含开始/结束代码) Href获取超链接 以网址http://faq.locoy.com/q-681.html为例,我们来设置标题和内容的XPath表达式,节点属性我们默认innerHTML就可以。 方法/步骤 1、首先,用谷歌浏览器打开网页,然后打开Chrome开发者工具,快捷键为“F12”,反复按下F12可以切换状态(打开或关闭)。当然,你也可以在原网页,直接右击“审查元素”。 2、获取标题的XPath,操作: 得出代码为//*[@id="mainContent"]/div[2]/h2 3、获取内容的XPath,操作: 得出代码为//*[@id="cmsContent"] 然后放入即可。 |
正在阅读:火车采集器XPath提取教程火车采集器XPath提取教程
2019-04-08 14:59
出处:其他
责任编辑:lixianmei


火车采集器2010SP2
西门子(SIEMENS)274升大容量家用三门冰箱 混冷无霜 零度保鲜 独立三循环 玻璃面板 支持国家补贴 KG28US221C
5399元
苏泊尔电饭煲家用3-4-5-8个人4升电饭锅多功能一体家用蓝钻圆厚釜可做锅巴饭煲仔饭智能煮粥锅预约蒸米饭 不粘厚釜 4L 5-6人可用
329元
绿联65W氮化镓充电器套装兼容45W苹果16pd多口Type-C快充头三星华为手机MacbookPro联想笔记本电脑配线
99元
KZ Castor双子座有线耳机入耳式双单元HM曲线发烧HiFi耳返耳麦
88元
格兰仕(Galanz)【国家补贴】电烤箱 家用 40L大容量 上下独立控温 多层烤位 机械操控 烘培炉灯多功能 K42 经典黑 40L 黑色
260.9元
漫步者(EDIFIER)M25 一体式电脑音响 家用桌面台式机笔记本音箱 蓝牙5.3 黑色 520情人节礼物
109元

