Selenium点击动态表格td教程详解
时间:2026-03-02 21:06:55 403浏览 收藏
本文深入解析了在Selenium自动化中可靠点击伦敦证券交易所(LSE)动态渲染表格中可交互单元格的完整实践方案,直击Cookie横幅拦截、Angular异步数据加载延迟、DOM结构遮挡与事件委托失效等三大典型痛点,通过显式等待精准捕获元素状态、滚动定位+ActionChains模拟真实用户点击、多窗口安全切换等经过实测验证的策略,手把手教你稳定实现从Price Explorer页面逐个点击债券公司名称、跳转详情页并提取Instrument ID等关键数据的端到端自动化流程——不靠猜测式延时,不写脆弱XPath,真正以浏览器渲染生命周期为依据,让每一次点击都稳、准、可复现。

本文详解如何在 Selenium 中可靠点击伦敦证券交易所动态渲染页面中带 `.clickable.td-with-link` 类的 `
在自动化抓取伦敦证券交易所(LSE)Price Explorer 页面(如 Bonds 分类页)时,直接调用 click() 失败是常见问题。根本原因并非代码逻辑错误,而是页面存在三层阻断机制:① 首次访问强制弹出 Cookie 同意横幅;② 表格数据通过 Angular 动态异步加载,
以下为经过实测验证的稳健解决方案,采用显式等待 + 精准定位 + 安全交互策略:
✅ 步骤一:显式等待并接受 Cookie 弹窗
Cookie 横幅会阻塞后续所有元素交互。需先定位并点击「Accept All Cookies」按钮(XPath 稳定性较高,但建议配合 WebDriverWait 防止过早查找):
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
options = Options()
options.add_argument("--start-maximized")
driver = webdriver.Chrome(options=options)
wait = WebDriverWait(driver, 15) # 延长超时至15秒,适应慢速网络
url = "https://www.londonstockexchange.com/live-markets/market-data-dashboard/price-explorer?categories=BONDS"
driver.get(url)
# 等待并点击 Cookie 接受按钮(关键前置步骤)
try:
accept_btn = wait.until(
EC.element_to_be_clickable((By.XPATH, "//button[contains(text(), 'Accept All Cookies')]"))
)
accept_btn.click()
print("✅ Cookie banner accepted.")
except Exception as e:
print("⚠️ Cookie banner not found or not clickable — proceeding anyway.")注意:避免使用绝对 XPath(如 /html/body/div/div[2]/...),因其极易因页面结构微调而失效。优先选择含语义文本(如 "Accept All Cookies")的相对 XPath 或 CSS 选择器。
✅ 步骤二:等待动态表格真实数据加载完成
目标表格 #price-explorer-results-wrapper 加载后,其
# 等待表格主体(tbody)内出现至少一个有效的 instrument-name span
first_company_span = wait.until(
EC.visibility_of_element_located((
By.CSS_SELECTOR,
"table#price-explorer-results-wrapper tbody tr.slide-panel td.instrument-name.gtm-trackable.td-with-link span.ellipsed"
))
)
print(f"✅ Found first company: {first_company_span.text.strip()}")✅ 步骤三:安全点击公司名称并跳转详情页
直接对
from selenium.webdriver.common.action_chains import ActionChains
# 获取所有公司名称 span 元素(非 td!)
company_spans = driver.find_elements(
By.CSS_SELECTOR,
"table#price-explorer-results-wrapper tbody tr.slide-panel td.instrument-name.gtm-trackable.td-with-link span.ellipsed"
)
for i, span in enumerate(company_spans[:3]): # 示例:仅处理前3家公司
try:
# 滚动到元素顶部,消除遮挡
driver.execute_script("arguments[0].scrollIntoView({block: 'center'});", span)
wait.until(EC.element_to_be_clickable(span))
# 使用 ActionChains 点击(比 span.click() 更鲁棒)
ActionChains(driver).move_to_element(span).click().perform()
# 等待新窗口打开并切换
wait.until(lambda d: len(d.window_handles) > 1)
driver.switch_to.window(driver.window_handles[-1])
# 此处可开始解析公司详情页(如 https://www.londonstockexchange.com/stock/957X/3i-group-plc/company-page)
print(f"✅ Navigated to detail page for: {span.text.strip()}")
# 【示例】提取 Instrument ID(位于详情页右上角)
try:
instrument_id = wait.until(
EC.presence_of_element_located((By.CSS_SELECTOR, "div.instrument-id span"))
).text.strip()
print(f" Instrument ID: {instrument_id}")
except:
print(" ❌ Could not extract Instrument ID")
# 关闭当前详情页,返回主窗口
driver.close()
driver.switch_to.window(driver.window_handles[0])
except Exception as e:
print(f"❌ Failed to click company #{i+1} ({span.text.strip()}): {str(e)}")
continue⚠️ 关键注意事项总结
- 绝不依赖 time.sleep():它不可靠且拖慢执行。全程使用 WebDriverWait 配合 expected_conditions(如 element_to_be_clickable, visibility_of_element_located)。
- 定位目标要精准:.clickable.instrument-name... 是
的 class,但实际可点击区域是其子 。对 点击常因 Angular 事件绑定机制失败。 - 处理动态禁用状态:若
存在,说明数据尚未就绪,需等待其消失或被真实内容替换(可通过 EC.invisibility_of_element_located 显式等待)。- 管理多窗口:每次点击链接都会打开新标签页,务必及时 switch_to.window() 并 close(),避免句柄泄漏。
- 反爬友好提示:添加 --disable-blink-features=AutomationControlled 和 user-agent 模拟真实浏览器(生产环境建议)。
通过以上结构化流程,即可稳定实现从 LSE 动态表格中逐个点击公司名称、跳转详情页并提取结构化数据的全链路自动化。核心在于:尊重前端渲染生命周期,以用户视角设计交互,用显式等待替代猜测式延时。
今天关于《Selenium点击动态表格td教程详解》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!
相关阅读更多>-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读更多>-
397 收藏
-
184 收藏
-
260 收藏
-
372 收藏
-
344 收藏
-
159 收藏
-
246 收藏
-
341 收藏
-
371 收藏
-
353 收藏
-
122 收藏
-
194 收藏
课程推荐更多>-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习
- 处理动态禁用状态:若