当前位置: 首页 > news >正文

影刀RPA实战:网页爬虫之我爱听评书

评书,作为中国传统文化的瑰宝之一,以其独特的魅力和深厚的文化底蕴,吸引了无数听众的喜爱。

评书,是一种艺术,也是一种传承。它将历史与故事,通过说书人的声音,生动地呈现在我们的眼前。每当听到那抑扬顿挫、富有节奏的叙述,我仿佛穿越了时空,回到了那个故事发生的时代。评书不仅仅是一种听觉的享受,更是一种心灵的触动。

1.实战目标

有人发私信说想下载评书给家里的老人听,我找了几个网站,开了下网页代码,还是比较简单。

这里以单田芳评书网作为案例操作,下载他老人家最优秀的代表作:白眉大侠。

你还别说,听评书写代码,比听歌有意思。大家可以试试!

实战演示:

下载后导入手机中,或通过影刀直接下载到手机中。

2.知识准备

  • 网页元素获取与操作
  • 循环相似元素与判断语句
  • 文件下载指令
  • 文件夹指令

3.实战代码

3.1 获取导航

获取网站导航,依次进入各个评书名家的评书集中。

首页是导航中的特殊情况,我们直接过滤

每次循环,我们进入一个评书目录页面

3.2 评书目录

获取评书书目的相似元素列表,依次循环

获取评书名称与章节链接地址。

我们使用评书名称创建文件夹。

章节链接地址当参数传递给章节子流程,用于打开网页

3.3 章节目录

获取评书的所有章节,循环 点击,进入详情页

3.3 详情页下载

获取本次评书是第几回,我们通过文本提取出数字,作为文件名称

使用关联元素获取评书的链接地址,用于下载

下载设置:

最终演示:

本次操作的案例是爬取网站所有评书,如果只想爬取某个评书作品,使用搜索功能就可完成。

4.最后

感谢大家,请大家多多支持!


http://www.mrgr.cn/news/56579.html

相关文章:

  • Web保存状态的手段(Session的使用)
  • 燕山大学23级经济管理学院 10.18 C语言作业
  • yocto编辑软件包-devtool的使用方法
  • 应对 .DevicData-X-XXXXXXXX 勒索病毒:防御与恢复策略
  • libaom-all-intra参数说明
  • LLM 量化新篇章:FlatQuant 的平坦之道
  • 数据结构 - 树,三探之代码实现
  • 如何看待AI技术的应用前景?
  • AI处理图片和视频的网址
  • 帝国CMS – AutoTitlePic 自动生成文章标题图片插件
  • ARL 灯塔 | ARL 灯塔 — 字典替换
  • 路径参数和post请求方式在请求资源时如何选择------各自的优势和使用场景比较
  • 基于深度学习的声纹识别
  • 进销存平板展示系统——未来之窗行业应用跨平台架构
  • 要让AI(任何一款绘图AI)把一个己有风格的图片画到一个实物商品上的窍门
  • 压缩感知方法——基础追踪(Basis Pursuit, BP)方法详解
  • 逐行讲解大模型生成解码超参数源码(temperature、top-k、top-p等)
  • 了解Scala的多态概述的定义,作用以及优点
  • 7.hyperf安装【Docker】
  • C语言(十六)函数综合(二)递归 --- 辩论赛经验谈
  • vite.config.js配置路径别名@
  • windows DLL技术-DLL概述
  • MOE混合专家模型总结(面试)
  • IIC通信与MAX30102采集血样数据+V4L2框架
  • 计算机毕业设计Python+Spark知识图谱课程推荐系统 课程用户画像系统 课程大数据 课程爬虫 课程大屏 mooc慕课推荐系统 大数据毕业设计
  • 基于 Hugo 的静态响应式网址导航主题