首页 > 文章 > python教程

“ Python程序过滤CSV行并将输出写入新文件”

来源：dev.to

时间：2025-02-16 23:48:59 268浏览收藏

学习知识要善于思考，思考，再思考！今天golang学习网小编就给大家带来《“ Python程序过滤CSV行并将输出写入新文件”》，以下内容主要包含等知识点，如果你正在学习或准备学习文章，就都不要错过本文啦~让我们一起来看看吧，能帮助到你就更好了！

import csv

input_file = 'input.csv'
output_file = 'output.csv'
column_index = 1

with open(input_file, 'r') as infile:
    csv_reader = csv.reader(infile)
    header = next(csv_reader)
    filtered_rows = [header]

    for row in csv_reader:
        if float(row[column_index]) > 100:
            filtered_rows.append(row)

with open(output_file, 'w', newline='') as outfile:
    csv_writer = csv.writer(outfile)
    csv_writer.writerows(filtered_rows)

print("filtered rows have been written to output.csv")

代码逻辑如下;

>导入csv模块：
> 代码首先导入csv模块，该模块可以帮助我们读取和写入csv文件。
>文件路径和列索引
：>
input_file ='input.csv'告诉程序在哪里找到我们要读取的文件。
- output_file ='output.csv'是程序将保存过滤数据的地方。>
>打开输入文件
> 该程序打开input.csv文件以读取内部的数据。
>
>读取标题

它读取文件的第一行，其中包含列名，并将其存储在标题中。这将稍后在写入新文件时使用。

>
过滤行

：

该程序通过每一行数据：

>它检查指定列中的数字（第二列）是否大于100。 如果该数字大于100，则该程序将保持该行。
如果不是，则行跳过。

>写入输出文件
：

打印消息

：最后，该程序打印一条消息，让您知道已过滤的数据已保存到新文件中。
2a。 ** python多线程解决方案，以同时下载多个文件。

import threading
import requests

urls = [
    'https://example.com/file1.jpg',
    'https://example.com/file2.jpg',
    'https://example.com/file3.jpg'
]

def download_file(url):
    try:
        response = requests.get(url)
        filename = url.split('/')[-1]
        with open(filename, 'wb') as f:
            f.write(response.content)
        print(f"downloaded: {filename}")
    except exception as e:
        print(f"failed to download {url}: {e}")

threads = []
for url in urls:
    thread = threading.thread(target=download_file, args=(url,))
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()

print("all downloads are complete.")

说明代码：

url列表

：urls包含要下载的文件url列表。

下载函数：download_file（url）是一个从url下载单个文件并保存它的函数。

线程创建

：对于每个url，使用螺纹创建一个新线程。线程同时下载文件。

启动线程：在每个线程上调用start（）方法开始下载文件。
等待完成：join（）确保主要程序等待所有线程在打印“所有下载均已完成”之前完成。

2b。一个多处理脚本，以计算1到10的数字阶乘。

import multiprocessing

def factorial(n):
    result = 1
    for i in range(1, n + 1):
        result *= i
    print(f"factorial of {n} is {result}")

if __name__ == '__main__':
    for i in range(1, 11):
        process = multiprocessing.process(target=factorial, args=(i,))
        process.start()
        process.join()

    print("all factorials have been computed.")

：计算数字n的阶乘并打印结果。 >主块

通过1到10的数字循环。 对于每个数字，创建一个新的过程来计算其阶乘。 >开始每个过程，然后等待使用process.join（）在移至下一个过程中完成。
。

> 2c一个简单的python脚本，该脚本演示了如何使用conturrent。
import pandas as pd import concurrent.futures def modify_row(row): row['modified'] = row['value'] * 2 return row def main(): data = {'value': [1, 2, 3, 4, 5]} df = pd.DataFrame(data) with concurrent.futures.ThreadPoolExecutor() as executor: results = list(executor.map(modify_row, [row for _, row in df.iterrows()])) df = pd.DataFrame(results) print(df) if __name__ == '__main__': main()
解释：

dataframe
- > modify_row函数
：

executor.map（modify_row，[...]）在数据框中的每一行中并行运行modify_row函数。

结果

：修改后的数据框在末尾打印出来。

今天关于《“ Python程序过滤CSV行并将输出写入新文件”》的内容介绍就到此结束，如果有什么疑问或者建议，可以在golang学习网公众号下多多回复交流；文中若有不正之处，也希望回复留言以告知！

声明：本文转载于：dev.to 如有侵犯，请联系study_golang@163.com删除