首页 > 文章 > python教程

如何从包含多列数据的 CSV 文件中合并特定列并计算各个选项出现的比例？

时间：2024-11-01 21:57:47 344浏览收藏

珍惜时间，勤奋学习！今天给大家带来《如何从包含多列数据的 CSV 文件中合并特定列并计算各个选项出现的比例？》，正文内容主要涉及到等等，如果你正在学习文章，或者是对文章有疑问，欢迎大家关注我！后面我会持续更新相关内容的，希望都能帮到正在学习的大家！

如何从包含多列数据的 CSV 文件中合并特定列并计算各个选项出现的比例？

csv 文件合并与内容比例计算

问题：

如何从包含多列数据的 csv 文件中读取内容并合并特定的列，同时计算各个选项出现的比例？

解决方案：

使用 python 的 pandas 库来处理 csv 文件：

import pandas as pd
from collections import Counter

# 读取 CSV 文件
df = pd.read_csv('test.csv', encoding='cp932')

# 获取 CMD 列作为主键
index_list_cmd = df['cmd'].tolist()

# 计算 CMD 出现的次数
idxLstCmd_cnt = Counter(list(index_list_cmd))

# 去除重复的 CMD
index_list_cmd = sorted(set(index_list_cmd), key=list(index_list_cmd).index)

# 计算每个 CMD 出现的次数
cntLst = []
for lst_i in range(len(index_list_cmd)):
    cntLst.append(idxLstCmd_cnt[index_list_cmd[lst_i]])

# 合并 OPT 列
index_list_opt_idx = []

# 删除之前保存的文件
if os.path.isfile(useRateF):
    os.remove(useRateF)

# 遍历 CMD
for cmd_i in range(len(index_list_cmd)):
    # 获得 OPT 列的 index
    index_list_opt_idx = list(df['opt'][df['cmd'] == index_list_cmd[cmd_i]].index.values)

    index_list_opt = []

    # 遍历 OPT
    for opt_i in range(len(index_list_opt_idx)):
        try:
            index_list_opt.append(df.loc[int(index_list_opt_idx[opt_i]), 'opt'])
        except:
            print(index_list_cmd[cmd_i])
            print(index_list_opt_idx[opt_i])
            print(opt_i)

    # 列表转字符串
    str_idxLstOpt = ' '.join(index_list_opt)

    # 字符串转回列表
    lst_idxLstOpt = str_idxLstOpt.split(' ')

    # 计算 OPT 出现的比例
    for tag in sorted(set(lst_idxLstOpt), key=lst_idxLstOpt.index):
        with open(useRateF, 'a', encoding='utf-8_sig') as uf:
            uf.writelines(str(index_list_cmd[cmd_i]) + ',' + tag + ',' + str(lst_idxLstOpt.count(tag)/cntLst[cmd_i]))
            uf.writelines('\n')

这个脚本将读取 csv 文件，合并 opt 列，并输出每个 cmd 选项出现的比例。

今天关于《如何从包含多列数据的 CSV 文件中合并特定列并计算各个选项出现的比例？》的内容就介绍到这里了，是不是学起来一目了然！想要了解更多关于的内容请关注golang学习网公众号！

资料下载

编程学习资料下载

精选编程（Golang、Python、Java、C++、JavaScript等）教程、电子书与示例源码，一键打包本地下载学习。

立即下载

相关阅读

更多>

文章 · python教程 | 2年前 | 高效开发 Flask框架安装技巧

Flask框架安装技巧：让你的开发更高效

501 收藏
文章 · python教程 | 2年前 | Django 技巧多线程

Django框架中的并发处理技巧

501 收藏
文章 · python教程 | 2年前 | 下载速度 pip源配置国内源

提升Python包下载速度的方法——正确配置pip的国内源

501 收藏
文章 · python教程 | 2年前 | Python C++ 选择

Python与C++：哪个编程语言更适合初学者？

501 收藏
文章 · python教程 | 2年前 |

品牌建设技巧

501 收藏

最新阅读

更多>

文章 · python教程 | 1小时前 |

PySerial 串口通信实用教程

135 收藏
文章 · python教程 | 1小时前 |

Flask项目结构设计：MVC实现高内聚代码

109 收藏
文章 · python教程 | 3小时前 |

Flask内存占用高怎么解决\_内存泄漏分析工具推荐

490 收藏
文章 · python教程 | 3小时前 |

Python数据聚类实战：sklearn案例解析

194 收藏
文章 · python教程 | 4小时前 |

Python防SQL注入：参数化查询原理详解

151 收藏
文章 · python教程 | 4小时前 | Python 虚拟环境

CentOS Python虚拟环境安装教程

415 收藏
文章 · python教程 | 4小时前 |

Python列表元素拼接成字符串方法

392 收藏
文章 · python教程 | 4小时前 |

Python打印列表地址方法详解

187 收藏
文章 · python教程 | 4小时前 |

Python日志系统设计与使用技巧

214 收藏
文章 · python教程 | 5小时前 |

Python argparse 与 click 对比分析

366 收藏
文章 · python教程 | 5小时前 |

Python异步下载图片：aiohttp与aiofiles并发存储教程

276 收藏
文章 · python教程 | 6小时前 |

Python Flask开发教程：快速搭建Web应用

321 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习