登录
首页 >  文章 >  python教程

Python快速写入Excel数据的技巧

时间:2025-09-07 15:51:48 421浏览 收藏

还在为Python写入Excel时数值显示为文本而烦恼吗?本文详细讲解了如何使用Python高效、正确地将数值数据写入Excel,告别格式困扰。教程以读取TXT学生成绩数据为例,利用openpyxl库创建Excel文件,并通过`isdigit()`函数判断确保数据类型转换的准确性,将文本数据转换为整数型数值,避免Excel中的格式错误。同时,还演示了如何计算并添加平均值列,让你的Excel报告更具价值。掌握这些技巧,轻松实现数据处理与报告生成,提升工作效率!

使用Python将文本文件中的数值数据高效写入Excel并确保数据类型正确

本教程详细介绍了如何使用Python读取TXT文件中的数据,将其转换为适当的整数类型,并写入Excel文件。核心内容包括利用openpyxl库处理Excel,通过条件判断isdigit()在数据写入阶段确保数值类型正确性,以及计算并添加平均值列,最终生成结构清晰、数据类型准确的Excel报告。

在数据处理和报告生成的场景中,我们经常需要将原始文本数据导入到更结构化的格式,如Excel,以便于进一步分析和展示。本教程将引导您完成一个典型的任务:从TXT文件中读取学生成绩数据,将其写入Excel表格,并确保所有数值数据都被正确识别为整数类型,同时计算每行成绩的平均值。

1. 环境准备与库安装

要处理Excel文件,我们需要使用openpyxl库。如果您尚未安装,可以通过以下命令进行安装:

pip install openpyxl

2. 准备源数据文件

假设我们有一个名为AI.txt的文本文件,其中包含学生的分数数据。文件内容示例如下(每行代表一个学生的两次考试成绩):

Student1 85 90
Student2 78 88
Student3 92 95
Student4 60 70
Student5 80 85
Student6 75 82

请注意,实际文件可能只包含数字,或者像示例一样包含非数字的标识符(如学生姓名)。本教程将展示如何灵活处理这两种情况。

3. Python程序实现

以下是实现上述功能的完整Python程序代码:

import openpyxl

def process_scores_to_excel(txt_file_path, excel_file_path, sheet_name="qq"):
    """
    读取TXT文件中的学生成绩数据,将其转换为整数类型并写入Excel文件,
    同时计算并添加平均值列。

    Args:
        txt_file_path (str): 输入的TXT文件路径。
        excel_file_path (str): 输出的Excel文件路径。
        sheet_name (str): Excel工作表的名称。
    """
    try:
        # 1. 读取TXT文件内容
        with open(txt_file_path, 'r', encoding='utf-8') as file:
            lines = file.readlines()

        # 2. 创建一个新的Excel工作簿和工作表
        workbook = openpyxl.Workbook()
        # 创建一个名为 'qq' 的工作表,并将其设置为第一个工作表
        sheet = workbook.create_sheet(index=0, title=sheet_name)

        # 3. 逐行处理数据并写入Excel
        # 假设第一行可能是标题,但原始数据没有明确标题,我们直接处理数据
        # 如果TXT文件有标题行,需要额外处理

        # 添加一个示例标题行(可选,根据实际需求调整)
        sheet.append(["Student ID", "Exam 1 Score", "Exam 2 Score"]) 

        for line in lines:
            # 移除行首尾空白字符,并按空格分割成列表
            cur_data = line.strip().split()

            # 使用列表推导式进行条件转换:
            # 如果元素是数字,则转换为整数;否则保留原始字符串。
            # 这种方式确保了即使TXT文件中包含非数字(如学生姓名),也能正确处理。
            processed_row = [int(item) if item.isdigit() else item for item in cur_data]

            # 将处理后的行数据追加到Excel工作表
            sheet.append(processed_row)

        # 4. 计算并添加平均值列
        # 首先为平均值列添加标题
        # 假设数据从第2行开始(第1行是标题),数据有3列(ID, Exam1, Exam2)
        # 平均值将添加到第4列
        sheet.cell(row=1, column=4, value="Mean Score")

        # 遍历从第2行开始的所有数据行,计算平均值
        # max_col 需要根据实际数据列数调整。
        # 如果数据只有两列分数,max_col=3(ID, Score1, Score2),平均值在第4列
        # 如果数据没有ID,只有两列分数,max_col=2,平均值在第3列
        # 这里假设数据是 "ID Score1 Score2",所以数据列是3列,平均值在第4列
        for row_index in range(2, sheet.max_row + 1): # 从第二行开始遍历
            # 获取当前行中所有单元格的值
            current_row_values = [sheet.cell(row=row_index, column=col).value 
                                  for col in range(2, sheet.max_column + 1)] # 从第二列开始获取数值

            # 筛选出数值类型(整数或浮点数)进行平均值计算
            numeric_values = [val for val in current_row_values if isinstance(val, (int, float))]

            if numeric_values: # 确保有数值可供计算
                avg_value = sum(numeric_values) / len(numeric_values)
                # 将平均值写入到当前行的第四列
                sheet.cell(row=row_index, column=4, value=avg_value)
            else:
                sheet.cell(row=row_index, column=4, value="N/A") # 如果没有数值,则显示N/A

        # 5. 保存Excel文件
        workbook.save(excel_file_path)
        print(f"数据已成功写入 '{excel_file_path}'。")

    except FileNotFoundError:
        print(f"错误:文件 '{txt_file_path}' 未找到。")
    except Exception as e:
        print(f"发生错误:{e}")

# 调用函数执行程序
if __name__ == "__main__":
    txt_file = 'AI.txt'
    excel_file = 'AI56.xlsx'
    process_scores_to_excel(txt_file, excel_file)

4. 关键代码解析与注意事项

  1. 读取TXT文件:

    with open(txt_file_path, 'r', encoding='utf-8') as file:
        lines = file.readlines()

    使用with语句确保文件被正确关闭。readlines()将文件所有行读取到一个列表中。encoding='utf-8'是处理多种字符编码的良好实践。

  2. 创建Excel工作簿和工作表:

    workbook = openpyxl.Workbook()
    sheet = workbook.create_sheet(index=0, title=sheet_name)

    openpyxl.Workbook()创建一个新的Excel文件。create_sheet(index=0, title='qq')创建名为"qq"的工作表并将其置于第一个位置。

  3. 数据类型转换的核心:

    processed_row = [int(item) if item.isdigit() else item for item in cur_data]
    sheet.append(processed_row)

    这是解决原始问题(Excel中数值仍显示为文本)的关键。

    • line.strip().split():清理每行数据,将其分割成字符串列表。
    • [int(item) if item.isdigit() else item for item in cur_data]:这是一个列表推导式,它遍历cur_data中的每个元素item。
      • item.isdigit():检查item是否只包含数字字符。这个方法对于判断字符串是否可以安全地转换为整数非常有效。
      • 如果item.isdigit()为真,则将其转换为整数int(item)。
      • 否则(例如,如果item是学生姓名或包含非数字字符),则保留其原始字符串形式item。
    • sheet.append(processed_row):openpyxl在append列表时,会自动根据Python的数据类型识别并写入Excel。通过这种预处理,int类型的数值会直接作为Excel的数字类型写入,而不是文本。
  4. 计算平均值:

    # 添加平均值列标题
    sheet.cell(row=1, column=4, value="Mean Score")
    
    for row_index in range(2, sheet.max_row + 1):
        current_row_values = [sheet.cell(row=row_index, column=col).value 
                              for col in range(2, sheet.max_column + 1)] # 假设数据从第2列开始
        numeric_values = [val for val in current_row_values if isinstance(val, (int, float))]
        if numeric_values:
            avg_value = sum(numeric_values) / len(numeric_values)
            sheet.cell(row=row_index, column=4, value=avg_value)
    • sheet.cell(row=R, column=C, value=V)用于向指定单元格写入值。
    • sheet.max_row和sheet.max_column获取当前工作表的最大行号和列号。
    • isinstance(val, (int, float)):在计算平均值之前,我们再次筛选确保只对数值类型(整数或浮点数)进行计算,避免因非数值数据导致错误。
  5. 保存Excel文件:

    workbook.save(excel_file_path)

    将修改后的工作簿保存到指定的文件路径。

5. 总结

通过本教程,您学会了如何使用Python和openpyxl库将文本文件中的数据导入到Excel,并解决了数据类型转换的关键问题。核心在于在将数据追加到Excel之前,利用isdigit()方法对每个数据项进行条件判断和类型转换。这种方法确保了Excel文件中的数值数据能够被正确识别和处理,为后续的数据分析奠定了坚实基础。同时,我们也学习了如何计算并添加新的派生列(如平均值),使生成的Excel报告更加完整和有用。

今天关于《Python快速写入Excel数据的技巧》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>