登录
首页 >  文章 >  python教程

Pandas时间转分钟教程hhmmss转总分钟

时间:2025-07-24 20:27:28 406浏览 收藏

积累知识,胜过积蓄金银!毕竟在文章开发的过程中,会遇到各种各样的问题,往往都是一些细节知识点还没有掌握好而导致的,因此基础知识点的积累是很重要的。下面本文《Pandas时间转分钟,hhmmss转总分钟教程》,就带大家讲解一下知识点,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~

Pandas中将hh:mm:ss时间字符串转换为总分钟数教程

本教程旨在指导用户如何在Pandas DataFrame中将hh:mm:ss格式的时间字符串高效转换为总分钟数。文章将分析常见错误,并提供两种主要解决方案:一是利用str.split结合apply方法进行精确计算,区分整数分钟和浮点分钟;二是推荐使用Pandas内置的to_timedelta函数,以更简洁、健壮的方式完成转换,确保数据处理的准确性和效率。

在数据分析和处理中,我们经常会遇到需要将时间数据从一种格式转换为另一种数值表示的场景。例如,将“小时:分钟:秒”的字符串格式转换为总分钟数,这对于时间序列分析、性能指标计算等都至关重要。本教程将详细介绍在Pandas中实现这一转换的有效方法。

数据准备

首先,我们创建一个示例Pandas DataFrame,其中包含一个Time列,其数据为hh:mm:ss格式的字符串。

import pandas as pd

df = pd.DataFrame({
    'Name': ["Jim", "Chrissy", "Billy"],
    'Time': ['1:33:04', '0:06:39', '10:00:02']
})

print("原始DataFrame:")
print(df)

常见错误与分析

在尝试将Time列转换为总分钟数时,初学者可能会遇到一些问题。例如,以下代码尝试通过分割字符串并进行计算来转换,但会导致错误:

# 错误的代码示例
# df['_timemin'] = df['Time'].str.split(':').apply(lambda x: (int(x[0])*60) + int(x[1])) + int(x[2]/60)
# 运行此代码会产生 NameError: name 'x' is not defined 或其他错误

上述代码的错误主要有以下几点:

  1. apply方法应用不完整: lambda x: (int(x[0])*60) + int(x[1])) 这一部分在语法上提前闭合了apply方法,导致后面的 + int(x[2]/60) 不在 apply 的作用域内,x 未被定义。
  2. 类型转换缺失: x[2](秒数)在进行除法运算前未被转换为数值类型(int),字符串不能直接进行数学运算。
  3. 逻辑结构错误: 即使语法正确,其逻辑也可能不符合预期,因为apply应该作用于整个分割后的列表x。

正确的方法应该确保lambda函数完整地处理分割后的所有元素,并进行正确的类型转换。

方法一:使用 str.split() 和 apply() 进行转换

这种方法通过将时间字符串分割成小时、分钟和秒,然后进行数学计算来得到总分钟数。

1. 获取整数分钟数(向下取整)

如果我们只需要总分钟数的整数部分,可以将秒数向下取整到最近的分钟。

计算公式: 小时 * 60 + 分钟 + 秒 // 60

df['_timemin_int'] = df['Time'].str.split(':').apply(
    lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) // 60
)

print("\n使用str.split和apply(整数分钟):")
print(df)

解释:

  • df['Time'].str.split(':') 将 hh:mm:ss 字符串按冒号分割成一个列表,例如 '1:33:04' 会变成 ['1', '33', '04']。
  • .apply(lambda x: ...) 对每个分割后的列表 x 应用一个匿名函数。
  • int(x[0]) * 60:将小时部分(字符串)转换为整数并乘以60得到分钟数。
  • int(x[1]):将分钟部分(字符串)转换为整数。
  • int(x[2]) // 60:将秒部分(字符串)转换为整数,然后使用整数除法(//)将其转换为分钟,并向下取整。
  • 将这三部分相加,得到总的整数分钟数。

2. 获取浮点分钟数(保留小数)

如果需要更精确的总分钟数,可以保留秒数转换后的分钟小数部分。

计算公式: 小时 * 60 + 分钟 + 秒 / 60

df['_timemin_float'] = df['Time'].str.split(':').apply(
    lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) / 60
)

print("\n使用str.split和apply(浮点分钟):")
print(df)

解释: 与整数分钟的计算方式类似,但这里使用浮点除法(/),确保秒数转换成的分钟部分保留小数精度。

注意事项: 在使用 str.split() 和 apply() 方法时,务必确保对从字符串中提取的每个部分都进行了正确的类型转换(例如 int()),否则会导致类型错误。

方法二:推荐使用 pd.to_timedelta()

Pandas提供了一个更强大、更简洁、更健壮的工具 pd.to_timedelta() 来处理时间字符串。这种方法不仅代码更简洁,而且能够更好地处理各种时间格式,是处理时间数据的推荐方式。

步骤:

  1. 使用 pd.to_timedelta() 将时间字符串列转换为 Timedelta 对象。
  2. 利用 Timedelta 对象的 total_seconds() 方法获取总秒数。
  3. 将总秒数除以60即可得到总分钟数。
df['_timemin_timedelta'] = pd.to_timedelta(df['Time']).dt.total_seconds() / 60

print("\n使用pd.to_timedelta(推荐方法):")
print(df)

解释:

  • pd.to_timedelta(df['Time']):将Time列中的每个时间字符串转换为Pandas的Timedelta对象。Timedelta对象表示一个时间段,例如1 hour 33 minutes 4 seconds。
  • .dt.total_seconds():这是Timedelta对象的一个访问器,它返回该时间段的总秒数(以浮点数形式)。
  • / 60:将总秒数除以60,即可得到总分钟数。

此方法的优势:

  • 简洁性: 代码量少,易于理解。
  • 健壮性: pd.to_timedelta() 能够自动识别多种时间格式,无需手动分割和类型转换,减少了出错的可能性。
  • 性能: 对于大型数据集,Pandas的内置函数通常比apply结合lambda具有更好的性能。

总结与建议

本教程介绍了在Pandas中将hh:mm:ss格式时间字符串转换为总分钟数的两种主要方法:

  1. str.split() 结合 apply(): 适用于需要手动控制每个时间部分的计算逻辑,或者在特定场景下需要精确控制整数/浮点分钟的取舍。但需要注意类型转换和apply函数的作用域。
  2. pd.to_timedelta(): 这是处理时间字符串的推荐方法。它更简洁、更健壮,能自动处理多种时间格式,并且性能更优。对于大多数时间转换任务,都应优先考虑使用此方法。

在实际应用中,根据你的数据特点和对精度、代码可读性、性能的要求,选择最适合的转换方法。对于标准的时间格式转换,pd.to_timedelta()无疑是最佳选择。

到这里,我们也就讲完了《Pandas时间转分钟教程hhmmss转总分钟》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>