Pandas时间转分钟教程hhmmss转总分钟
时间:2025-07-24 20:27:28 406浏览 收藏
积累知识,胜过积蓄金银!毕竟在文章开发的过程中,会遇到各种各样的问题,往往都是一些细节知识点还没有掌握好而导致的,因此基础知识点的积累是很重要的。下面本文《Pandas时间转分钟,hhmmss转总分钟教程》,就带大家讲解一下知识点,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
在数据分析和处理中,我们经常会遇到需要将时间数据从一种格式转换为另一种数值表示的场景。例如,将“小时:分钟:秒”的字符串格式转换为总分钟数,这对于时间序列分析、性能指标计算等都至关重要。本教程将详细介绍在Pandas中实现这一转换的有效方法。
数据准备
首先,我们创建一个示例Pandas DataFrame,其中包含一个Time列,其数据为hh:mm:ss格式的字符串。
import pandas as pd df = pd.DataFrame({ 'Name': ["Jim", "Chrissy", "Billy"], 'Time': ['1:33:04', '0:06:39', '10:00:02'] }) print("原始DataFrame:") print(df)
常见错误与分析
在尝试将Time列转换为总分钟数时,初学者可能会遇到一些问题。例如,以下代码尝试通过分割字符串并进行计算来转换,但会导致错误:
# 错误的代码示例 # df['_timemin'] = df['Time'].str.split(':').apply(lambda x: (int(x[0])*60) + int(x[1])) + int(x[2]/60) # 运行此代码会产生 NameError: name 'x' is not defined 或其他错误
上述代码的错误主要有以下几点:
- apply方法应用不完整: lambda x: (int(x[0])*60) + int(x[1])) 这一部分在语法上提前闭合了apply方法,导致后面的 + int(x[2]/60) 不在 apply 的作用域内,x 未被定义。
- 类型转换缺失: x[2](秒数)在进行除法运算前未被转换为数值类型(int),字符串不能直接进行数学运算。
- 逻辑结构错误: 即使语法正确,其逻辑也可能不符合预期,因为apply应该作用于整个分割后的列表x。
正确的方法应该确保lambda函数完整地处理分割后的所有元素,并进行正确的类型转换。
方法一:使用 str.split() 和 apply() 进行转换
这种方法通过将时间字符串分割成小时、分钟和秒,然后进行数学计算来得到总分钟数。
1. 获取整数分钟数(向下取整)
如果我们只需要总分钟数的整数部分,可以将秒数向下取整到最近的分钟。
计算公式: 小时 * 60 + 分钟 + 秒 // 60
df['_timemin_int'] = df['Time'].str.split(':').apply( lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) // 60 ) print("\n使用str.split和apply(整数分钟):") print(df)
解释:
- df['Time'].str.split(':') 将 hh:mm:ss 字符串按冒号分割成一个列表,例如 '1:33:04' 会变成 ['1', '33', '04']。
- .apply(lambda x: ...) 对每个分割后的列表 x 应用一个匿名函数。
- int(x[0]) * 60:将小时部分(字符串)转换为整数并乘以60得到分钟数。
- int(x[1]):将分钟部分(字符串)转换为整数。
- int(x[2]) // 60:将秒部分(字符串)转换为整数,然后使用整数除法(//)将其转换为分钟,并向下取整。
- 将这三部分相加,得到总的整数分钟数。
2. 获取浮点分钟数(保留小数)
如果需要更精确的总分钟数,可以保留秒数转换后的分钟小数部分。
计算公式: 小时 * 60 + 分钟 + 秒 / 60
df['_timemin_float'] = df['Time'].str.split(':').apply( lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) / 60 ) print("\n使用str.split和apply(浮点分钟):") print(df)
解释: 与整数分钟的计算方式类似,但这里使用浮点除法(/),确保秒数转换成的分钟部分保留小数精度。
注意事项: 在使用 str.split() 和 apply() 方法时,务必确保对从字符串中提取的每个部分都进行了正确的类型转换(例如 int()),否则会导致类型错误。
方法二:推荐使用 pd.to_timedelta()
Pandas提供了一个更强大、更简洁、更健壮的工具 pd.to_timedelta() 来处理时间字符串。这种方法不仅代码更简洁,而且能够更好地处理各种时间格式,是处理时间数据的推荐方式。
步骤:
- 使用 pd.to_timedelta() 将时间字符串列转换为 Timedelta 对象。
- 利用 Timedelta 对象的 total_seconds() 方法获取总秒数。
- 将总秒数除以60即可得到总分钟数。
df['_timemin_timedelta'] = pd.to_timedelta(df['Time']).dt.total_seconds() / 60 print("\n使用pd.to_timedelta(推荐方法):") print(df)
解释:
- pd.to_timedelta(df['Time']):将Time列中的每个时间字符串转换为Pandas的Timedelta对象。Timedelta对象表示一个时间段,例如1 hour 33 minutes 4 seconds。
- .dt.total_seconds():这是Timedelta对象的一个访问器,它返回该时间段的总秒数(以浮点数形式)。
- / 60:将总秒数除以60,即可得到总分钟数。
此方法的优势:
- 简洁性: 代码量少,易于理解。
- 健壮性: pd.to_timedelta() 能够自动识别多种时间格式,无需手动分割和类型转换,减少了出错的可能性。
- 性能: 对于大型数据集,Pandas的内置函数通常比apply结合lambda具有更好的性能。
总结与建议
本教程介绍了在Pandas中将hh:mm:ss格式时间字符串转换为总分钟数的两种主要方法:
- str.split() 结合 apply(): 适用于需要手动控制每个时间部分的计算逻辑,或者在特定场景下需要精确控制整数/浮点分钟的取舍。但需要注意类型转换和apply函数的作用域。
- pd.to_timedelta(): 这是处理时间字符串的推荐方法。它更简洁、更健壮,能自动处理多种时间格式,并且性能更优。对于大多数时间转换任务,都应优先考虑使用此方法。
在实际应用中,根据你的数据特点和对精度、代码可读性、性能的要求,选择最适合的转换方法。对于标准的时间格式转换,pd.to_timedelta()无疑是最佳选择。
到这里,我们也就讲完了《Pandas时间转分钟教程hhmmss转总分钟》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
414 收藏
-
495 收藏
-
113 收藏
-
318 收藏
-
125 收藏
-
170 收藏
-
351 收藏
-
164 收藏
-
119 收藏
-
453 收藏
-
147 收藏
-
194 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习