首页 > 文章 > python教程

PythonJSON解析错误解决方法

时间：2025-11-08 20:28:01 338浏览收藏

在Python开发中，解析JSON数据时常遇`TypeError: string indices must be integers, not 'str'`错误。本文深入剖析该错误的根源，即字典迭代的本质：直接迭代字典时，循环变量是键而非键值对。文章提供避免此错误的实用技巧，强调应直接通过键访问字典值，例如`my_dict["key"]`，而非尝试字符串索引。针对API返回JSON数组（字典列表）的情况，则需迭代列表，再通过键访问字典。掌握这些Python JSON解析技巧，能有效避免TypeError，提升数据处理的效率与准确性，让你的代码更健壮！

Python JSON字典解析：避免TypeError的正确姿势

本文旨在解决Python中解析JSON数据时常见的`TypeError: string indices must be integers, not 'str'`错误。通过分析字典迭代的原理，我们揭示了该错误发生的根本原因，并提供了直接访问字典键值对的正确方法，从而高效且准确地从API响应中提取所需信息。

在Python开发中，我们经常需要处理来自API或其他数据源的JSON数据。通常，我们会使用json.loads()方法将JSON字符串转换为Python字典。然而，在尝试从这些字典中提取特定信息时，开发者可能会遇到TypeError: string indices must be integers, not 'str'这样的错误。本文将深入探讨这一问题，并提供正确的解决方案。

理解问题：TypeError的根源

假设我们通过API获取了用户数据，并将其解码为Python字典，如下所示：

import requests
import json

def get_user_data_from_api(user):
    """模拟从API获取用户数据并解析为字典"""
    # 实际应用中，这里会发起HTTP请求
    # get_user_data = requests.get("https://api.sleeper.app/v1/user/" + user)
    # decode_user_data = get_user_data.content.decode("UTF-8")
    # user_data = json.loads(decode_user_data)

    # 为演示目的，使用一个固定的字典作为示例
    user_data = {
        'verification': None,
        'username': 'zeustrl',
        'user_id': '766368574179770368',
        'token': None,
        'summoner_region': None,
        'summoner_name': None,
        'solicitable': None,
        'real_name': None,
        'phone': None,
        'pending': None,
        'notifications': None,
        'metadata': None,
        'is_bot': False,
        'email': None,
        'display_name': 'ZeusTRL',
        'deleted': None,
        'data_updated': None,
        'currencies': None,
        'created': None,
        'cookies': None,
        'avatar': 'f64d0b7a8d0e6fbf0d7856185875d972'
    }
    return user_data

# 假设我们获取到了一个用户的数据
user_data = get_user_data_from_api("some_user")
print(user_data)

现在，我们希望从user_data字典中提取username和user_id。一个常见的错误尝试是使用for循环来遍历这个字典，并试图通过索引i["username"]来访问数据：

user_ids = []
# 错误的尝试
for i in user_data:
    # 尝试访问 i["username"] 或 i["user_id"] 会导致 TypeError
    # user_ids.append({'username': i["username"], 'user_id': i["user_id"]})
    print(f"当前循环变量 i 的值是: {i}, 类型是: {type(i)}")

执行上述代码会发现，for i in user_data: 循环中的 i 并不是字典中的值，也不是字典本身，而是字典的键（key）。这意味着 i 在每次迭代中都是一个字符串，例如 'verification'、'username'、'user_id' 等。

当 i 是一个字符串时，尝试使用 i["username"] 这样的语法去访问它，就等同于尝试对一个字符串进行字符串索引，例如 'username'["username"]。Python 期望字符串索引是整数（例如 'username'[0] 会得到 'u'），而不是另一个字符串。因此，这就会抛出 TypeError: string indices must be integers, not 'str' 错误。

正确的解析方法

鉴于user_data是一个包含单个用户信息的字典，我们不需要进行循环迭代。要提取特定的键值对，我们只需直接通过键来访问字典：

# 直接访问字典中的键
username = user_data["username"]
user_id = user_data["user_id"]

print(f"用户名: {username}, 用户ID: {user_id}")

为了更好地封装和复用，我们可以修改原有的get_user_id函数，使其直接返回包含所需信息的新字典：

def get_user_info(user):
    """
    从API获取用户数据，并返回包含username和user_id的字典。
    参数:
        user (str): 用户名或用户标识符。
    返回:
        dict: 包含'username'和'user_id'的字典。
    """
    # 实际应用中，这里会发起HTTP请求
    # get_user_data = requests.get("https://api.sleeper.app/v1/user/" + user)
    # decode_user_data = get_user_data.content.decode("UTF-8")
    # user_data = json.loads(decode_user_data)

    # 演示目的，使用一个固定的字典
    user_data = {
        'verification': None,
        'username': 'zeustrl',
        'user_id': '766368574179770368',
        'token': None,
        'summoner_region': None,
        'summoner_name': None,
        'solicitable': None,
        'real_name': None,
        'phone': None,
        'pending': None,
        'notifications': None,
        'metadata': None,
        'is_bot': False,
        'email': None,
        'display_name': 'ZeusTRL',
        'deleted': None,
        'data_updated': None,
        'currencies': None,
        'created': None,
        'cookies': None,
        'avatar': 'f64d0b7a8d0e6fbf0d7856185875d972'
    }

    # 直接从字典中提取所需信息
    return {"user_id": user_data["user_id"], "username": user_data["username"]}

# 如果需要将这些信息添加到列表中
user_ids_list = []
user_info = get_user_info("zeustrl") # 调用函数获取用户数据
user_ids_list.append(user_info)

print("提取的用户信息列表:", user_ids_list)

总结与注意事项

字典迭代的本质： 在Python中，直接对字典进行for i in dictionary:循环，i将依次是字典的键（key），而不是值或键值对。
直接访问： 如果json.loads()返回的是一个单一的字典（如本例），要获取特定值，应直接使用键来访问，例如my_dict["key"]。

处理列表中的字典： 如果API响应是一个JSON数组（即Python中的列表），且列表中的每个元素都是一个字典，那么使用for循环迭代列表是正确的。在这种情况下，i将是列表中的每个字典元素，然后你可以通过i["key"]来访问该字典中的值。

# 示例：当API返回的是一个字典列表时
list_of_users_data = [
    {'username': 'user1', 'user_id': '111'},
    {'username': 'user2', 'user_id': '222'}
]

extracted_user_info = []
for user_dict in list_of_users_data:
    extracted_user_info.append({
        'username': user_dict["username"],
        'user_id': user_dict["user_id"]
    })
print("从字典列表提取的信息:", extracted_user_info)

错误处理： 在实际应用中，访问字典键时应考虑键不存在的情况。可以使用dictionary.get('key', default_value)方法来安全地获取值，避免KeyError。

通过理解Python字典的工作原理，并采用正确的访问方式，我们可以避免TypeError，更高效、更健壮地处理JSON数据。

到这里，我们也就讲完了《PythonJSON解析错误解决方法》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于的知识点！