当前位置: 首页 > news >正文

Python 代码读取新闻语料文件,并进行新闻主题的统计分析

完整资料: https://download.csdn.net/download/huanghm88/89879439

"""  实训3 新闻语料数据的统计与可视化分析 步骤1 新闻语料读取与类型统计分析  """# 引入 collections 包, codecs 包
import collections, codecs"""
“新闻语料.txt”中储存新闻的格式为:
每行为一条新闻。
每条新闻内,首先为该新闻的主题,然后\t分隔,然后是新闻的内容。例如:
财经\t今年基金高管变动增多2009年,A股市场一路反弹至2500点上方。虽然股指反弹幅度已经超过30%,但仍有不少国外投行纷纷发表言论,称“A股的牛市正在归来”。行情的回暖是否会让基金高管们蠢蠢欲动?目前还无法知道答案。但今年以来,基金高管的变动公告却在悄然增多。景顺长城总经理梁华栋、益民基金总经理刘义鹏都在不久前离职。此外,信诚、中欧、摩根士丹利华鑫基金今年以来也曾先后发布公告,聘任新的公司总经理。在同行间另谋高就、彻底离开公募基金或干脆转向私募……也许,王宏远的离职仅仅是一个开始。晨报记者 王洁
"""# 读取'新闻语料.txt',以一个字典的形式返回新闻语料内容。
# 返回的字典具体格式:key为新闻主题,value为list,储存该主题下的所有新闻。每条新闻为一个字符串。
def load_news() :# 读取 “新闻语料.txt”文件news_corpus = codecs.open('新闻语料.txt'

http://www.mrgr.cn/news/55923.html

相关文章:

  • CISP/NISP二级练习题-第一卷
  • Java爬虫:获取数据的入门详解
  • 反弹Shell
  • SQL 自学:事务处理的COMMIT 和 ROLLBACK 语句的运用
  • C++简介和基本语法介绍
  • 全面解析:优化RAG效果的关键策略,非常详细收藏我这一篇就够了
  • Linux 定时任务 (Crontab)
  • 合成生物学:设计生命的新工具
  • 美图设计室
  • 开源限流组件分析(一):juju/ratelimit
  • 在 gRPC 中,客户端和服务端的 Protocol Buffers(Protobuf)生成的文件必须保持一致性,以确保通信正常。
  • 宠物用品在线商城:SpringBoot技术的应用与实践
  • JAVA同城外卖跑腿团购到店跑腿多合一APP系统小程序源码
  • 推荐一款免费备份还原软件:AOMEI Backupper
  • 深度学习:YOLO目标检测和YOLO-V1算法损失函数的计算
  • 使用Aspose.Slides 控件,使用 Java 在 PowerPoint 中创建条形图
  • 【C++】—— 多态(下)
  • ✨ 灵动AI视频:重塑视频创作,引领智能编辑新时代!✨
  • 智能三相电表主要应用于哪里
  • 【Unity】Unity中获取网络时间进行每日和每月刷新
  • JAVA二手交易发布闲置好物回收系统小程序源码
  • docker 下载netcore 镜像
  • 案例分享:制造业网管系统建设最佳实践
  • 代购系统:商品详情的“时空穿越者”
  • Python中怎样用AKShare获取基金最新数据?
  • 最大化生成式 AI 策略投资回报率的 3 种方法