当前位置: 首页 > news >正文

Requests-数据解析bs4+xpath

原理:定位到对应标签,获取标签内的东西

解析三种方法:

    1:正则

58二手房。获取图片列表,二进制content。展开,每个图片是一个内容,正则从头取到尾,不同之处用 .*? 替换掉。

import requests
import re
import os
if __name__ == "__main__":# url='https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2898385373.jpg'# img_data=requests.get(url=url).content# with open("./pic.png","wb") as fp:#    fp.write(img_data)if not os.path.exists("./pictures"):os.makedirs("./pictures")url='https://www.58.com/ershoufang/'#2.进行UA伪装headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'}#

http://www.mrgr.cn/news/83022.html

相关文章:

  • 嵌入式系统 (2.嵌入式硬件系统基础)
  • Oracle Dataguard(主库为单节点)配置详解(5):使用 rman 复制技术(DUPLICATE)同步主库到备库
  • Tableau数据可视化与仪表盘搭建-数据连接
  • 行为分析:LSTM、3D CNN、SlowFast Networks。这三者的优缺点
  • Unity打包问题集(持续更新)
  • 嵌入式岗位面试八股文(篇三 操作系统(下))
  • 【0385】Postgres内核 OS 磁盘上创建 slot ( 3 - 1 )
  • STM32-笔记38-I2C-oled实验
  • STM32-DMA数据转运
  • R语言装环境Gcc报错以及scater包的安装
  • (七)人工智能进阶之人脸识别:从刷脸支付到智能安防的奥秘,小白都可以入手的MTCNN+Arcface网络
  • 用Python实现简单的任务自动化
  • SQL从入门到实战
  • 【WPF】使用BitmapImage给Image的Source赋值,并释放原占用资源,避免删除原文件时导致程序崩溃
  • Vue 组件开发:构建高效可复用的 UI 构建块
  • 数据库语句学习
  • 51c大模型~合集102
  • 121 买入股票的最佳时机
  • 【cuda学习日记】2.1 2D matrix操作
  • Apache Traffic存在SQL注入漏洞(CVE-2024-45387)
  • docker 常用命令实践DEMO
  • Power BI如何连接Azure Databricks数据源?
  • 新华三H3CNE网络工程师认证—常见操作指令总结
  • oracle位运算、左移右移、标签算法等
  • C++ 11,14,17 新特性
  • 入门嵌入式(四)——IICOLED