分析excel硕士序列数据提示词——包含对特征的筛选,非0值的过滤
文章目录
- 1 分析出发点
- 2 围绕出发点的文件分析
- 3 功能模块
- 计算重心
- 相关性计算
- 教学倾向百分比
- 多列相关性计算
- 结果封装
- 证伪——过滤0后的交叉相关系数
- 封装和总控——批量处理
- 特征筛选——筛选提问倾向最大和最小的前五
- 代码
- 总的清洗
1 分析出发点
写一个python代码,遍历"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质"下所有excel文件,计算每个excel的行为类别列和教学倾向列这两列的交叉相关系数,新建一个excel存入文件名作为一列,后面一列是行为倾向交叉系数列,存入对应的系数
以下是完整的 Python 代码,包含了遍历文件夹、收集所有 Excel 文件的绝对路径、并将其写入到一个新的 Excel 文件中,所有文件路径从第一行开始写入:
import os
import pandas as pd# 设置文件夹路径和输出文件路径
folder_path = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质"
output_file = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质结果.xlsx"# 收集所有 Excel 文件的详细信息
data = []
for root, dirs, files in os.walk(folder_path):for file in files:if file.lower().endswith(('.xlsx', '.xls')):full_path = os.path.join(root, f