当前位置: 首页 > news >正文

WordCloud参数的用法:

-------------词云图集合-------------
用Wordcloud+PyQt5写个词云图生成器1.0
WordCloud去掉停用词(fit_words+generate)的2种用法

通过词频来绘制词云图(jieba+WordCloud)

Python教程95:去掉停用词+词频统计+jieba.tokenize示例用法

将进酒—李白process_text词频统计,及词频可视化分析

使用wordcloud模块,绘制一个自定义的词云图形状

使用WordCloud模块中repeat参数,做一个关键字重复的词云图

关于词云图显示异常,出现乱码的解决办法

盘点WordCloud模块,词云图的相关知识点

Python源码05:使用Pyecharts画词云图图

1.WordCloud参数的用法:

1.1.基本参数
font_path:字符串类型,指定字体文件的路径。由于默认字体可能不支持中文,因此需要指定一个支持中文的字体文件路径来正确显示中文。
width:整数类型,默认值为400。指定生成词云图的宽度(像素)。
height:整数类型,默认值为200。指定生成词云图的高度(像素)。
background_color:颜色值类型,默认值为"black"。指定词云图的背景颜色。
1.2.词云形状和布局
mask:ndarray类型或None,默认值为None。如果指定了一个ndarray作为遮罩,则词云图的形状将被该遮罩取代。遮罩图像中白色(#FFFFFF)的部分将不会绘制词云,其余部分将用于绘制。
scale:浮点数类型,默认值为1。指定计算和绘图之间的比例,即放大画布的尺寸(比例尺)。对于大型词云图,使用比例尺可能比设置画布尺寸更快,但单词匹配可能不是很好。
prefer_horizontal:浮点数类型,默认值为0.9。指定词语水平方向排版出现的频率。由于水平排版和垂直排版概率之和为1,因此默认垂直方向排版频率为0.1。
1.3.字体和词频
min_font_size:整数类型,默认值为4。指定词云中显示的最小字体大小。
max_font_size:整数类型或None,默认值为None。指定词云中显示的最大字体大小。如果没有设置,则直接使用画布的大小作为参考。
font_step:整数类型,默认值为1。指定词云中字体大小的步进间隔。如果步长大于1,会加快运算速度但可能导致结果出现较大的误差。
max_words:数字类型,默认值为200。指定要显示的词的最大个数。
stopwords:字符串集合或None,默认值为None。指定需要屏蔽的词。如果为空,则使用内置的停用词列表。
1.4.颜色和配色
colormap:字符串或matplotlib colormap类型,默认值为"viridis"。指定给每个单词随机分配颜色的配色方案。如果指定了color_func参数,则忽略此参数。
color_func:可调用对象,默认值为None。指定生成新颜色的函数。如果为空,则使用默认的颜色生成函数。
1.5.其他参数
mode:字符串类型,默认值为"RGB"。当参数为"RGBA"并且background_color不为空时,背景为透明。
relative_scaling:浮点数类型,默认值为0.5。指定词频和字体大小的关联性。如果设置为1,则一个单词出现两次时,其字体大小为原来的两倍。
regexp:字符串或None(可选)。指定使用正则表达式分隔输入的文本。如果没有指定,则使用默认的正则表达式进行分词。
collocations:布尔类型,默认值为True。指定是否包括两个词的搭配(双宾语)。
1.6.常用函数方法
fit_words(frequencies):根据词频生成词云。
generate(text):根据文本生成词云。
generate_from_frequencies(frequencies[, …]):根据词频生成词云,类似于fit_words方法。
generate_from_text(text):根据文本生成词云,类似于generate方法。
recolor([random_state, color_func, colormap]):对现有输出重新着色。重新上色会比重新生成整个词云快很多。

完毕!!感谢您的收看

----------★★历史博文集合★★----------

我的零基础Python教程,Python入门篇 进阶篇 视频教程 Py安装py项目 Python模块 Python爬虫 Json Xpath 正则表达式 Selenium Etree CssGui程序开发 Tkinter Pyqt5 列表元组字典数据可视化 matplotlib 词云图 Pyecharts 海龟画图 Pandas Bug处理 电脑小知识office自动化办公 编程工具 NumPy Pygame


http://www.mrgr.cn/news/78225.html

相关文章:

  • HTML实战课堂之简单的拜年程序
  • OSPF - 2、3类LSA(Network-LSA、NetWork-Sunmmary-LSA)
  • 【linux】文件与目录命令 - mv
  • AIOps 平台
  • Conda虚拟Python环境下安装包遇到的坑
  • 网络安全---信息收集
  • DeSTSeg: Segmentation Guided Denoising Student-Teacher for Anomaly Detection
  • 【笔记】轻型民用无人驾驶航空器安全操控
  • 零基础3分钟快速掌握 ——Linux【终端操作】及【常用指令】Ubuntu
  • webrtc 3A移植以及实时处理
  • Java进阶六-多线程
  • 使用系统内NCCL环境重新编译Pytorch
  • 基于Kubernetes编排部署EFK日志收集系统
  • 16 —— Webpack多页面打包
  • 【346】Postgres内核 Startup Process 通过 signal 与 postmaster 交互实现 (5)
  • NUXT3学习日记四(路由中间件、导航守卫)
  • Python的3D可视化库 - vedo (3)visual子模块 点对象的可视化控制
  • 【小白学机器学习35】数据表:整洁数据表,交叉表/列联表,以及两者转化pd.pivot_table()
  • 深度学习基础1
  • WinFrom调用webapi接口另一个方法及其应用实例
  • JVM调优篇之JVM基础入门AND字节码文件解读
  • STM32C011开发(2)----nBOOT_SEL设置
  • LLamafactory 批量推理与异步 API 调用效率对比实测
  • 【11-20期】Java面试进阶:深入解析核心问题与实战案例
  • 【机器学习】机器学习学习笔记 - 数据预处理 - 01
  • 【机器学习】机器学习学习笔记 - 监督学习 - KNN线性回归岭回归 - 02