当前位置: 首页 > news >正文

python爬虫中json和xml字符串的xPath和jsonpath过滤语法区别对比

参考博客

两种语法结构作用

为了处理从网络请求返回的网页源码中得到自己想要的数据

首先了解两种库处理的对象语法

jsonpath处理的是json语法格式的字符串

**json(JavaScript Object Notation)**字符串的语法参考
**类似于下面的格式,以键值的形式,其中值可以是字符串,数值或中括号包括的数组形式。**但最小的元素表示还是以键值的i形式。
在这里插入图片描述

xpath处理的是xml字符串

xml(Extensible Markup Language)可扩展标记语言,这种语言注重是对数据传输而不是显示
实例语法参考,
在这里插入图片描述

xml文件和html文件的不同

主要还是标签和功能的不同,从标签定义看,HTML中的标签是定义好的,而xml是可以自己定义不同的标签;从功能重点上看,html为了更好的显示,让用户看;而xml为了更好的数据检索传递。

两种分析模块的语法

jsonpath模块

代码参考

{"store":{"book":[{"category":"reference","author":"Nigel Rees","title":"Sayings of the Century","price":8.95},{"category":"fiction","author":"J. R. R. Tolkien","title":"The Lord of the Rings","isbn":"0-395-19395-8","price":22.99}],"bicycle":{"color":"red","price":19.95}}
}

在这里插入图片描述
实例输出分析筛选规则

在这里插入图片描述
jsonpath最终返回的都是json字符串键值对中的键对应的值,并使用列表包括,最终返回的数据类型是列表

xpath语法

在这里插入图片描述
实例代码参考

在这里插入图片描述

两种语法的对比

参考文档

在这里插入图片描述


http://www.mrgr.cn/news/33395.html

相关文章:

  • 深入浅出Docker
  • Spring_AMQP
  • Linux:进程(四)
  • 内核是如何发送数据包
  • 文档布局内容检测系统源码分享
  • 连续数组问题
  • STL之list
  • c语言-数据类型
  • C++:数组与字符串
  • Git从了解到操作
  • 【homebrew安装】踩坑爬坑教程
  • Renesas R7FA8D1BH (Cortex®-M85) 生成4路PWM
  • 【ArcGIS微课1000例】0123:数据库中要素类批量转为shapefile
  • 数据结构之堆(优先级队列)
  • 2024/9/22周报
  • 【面经】查找中常见的树数据结构
  • 8. Data Member的绑定
  • 国产游戏技术能否引领全球【终稿】
  • CompletableFuture如何优雅处理异步任务超时!妙就完了
  • 国人卖家可折叠无线充电器发起TRO专利维权,功能相同可能侵权