登录
首页 >  文章 >  linux

Linux用wget下载文件方法详解

时间:2026-05-12 09:53:25 174浏览 收藏

本文深入详解了 Linux 下功能强大且稳定的命令行下载工具 wget,涵盖其核心优势(如断点续传、后台运行、Cookie 登录、限速与 UA 伪装)及各类实战场景:从基础单文件下载、强制覆盖与标准输出重定向,到处理 HTTPS 证书错误、带身份验证的私有资源获取,再到大文件续传、静默后台下载,以及应对反爬策略的限速、随机延时和浏览器伪装技巧;同时明确指出 wget 的能力边界——当遇到依赖 Referer 校验或 JS 渲染的链接时,需转向 curl 或浏览器抓包,为运维、开发和自动化任务提供了全面、可靠、即学即用的下载解决方案。

Linux怎么使用wget下载_Linux如何命令行下载文件资源【方法】

wget 是 Linux 命令行下载最稳的工具,不依赖浏览器、支持断点续传、后台运行,适合服务器环境或批量下载。

基础用法:wget 下载单个文件

最常见场景:从 URL 拿一个压缩包、脚本或安装包。直接执行即可,wget 会自动推断文件名并保存到当前目录:

wget https://example.com/file.tar.gz

注意:wget 默认不会覆盖同名文件,第二次运行会生成 file.tar.gz.1;如果想强制覆盖,加 -O 参数指定输出名:

  • wget -O file.tar.gz https://example.com/file.tar.gz(覆盖写入)
  • wget -O - https://example.com/status.json(输出到 stdout,适合管道处理)
  • 下载时若提示 ERROR: cannot verify example.com's certificate,说明 SSL 证书不可信,可临时加 --no-check-certificate(仅限可信源)

带登录和 Cookie 的下载(如私有资源)

很多内部文档、课程视频、Git LFS 文件需要身份验证。不能只靠 URL,得把登录态带上:

  • 先用浏览器登录目标站点,导出 Cookie(Chrome 可用 EditThisCookie 插件复制为 Netscape 格式),保存为 cookies.txt
  • --load-cookies 加载:wget --load-cookies cookies.txt https://private.example.com/report.pdf
  • 如果网站用 Basic Auth,可直接在 URL 中写:wget https://user:pass@private.example.com/data.zip(注意:密码明文暴露在历史命令和进程列表中,慎用)

断点续传与后台下载

大文件(如 ISO 镜像)中途断网很常见。wget 原生支持续传,但前提是服务器支持 Range 请求(绝大多数 HTTP/HTTPS 服务都支持):

  • 第一次下载中断后,再次运行相同命令,wget 自动检测已下载部分并续传(无需额外参数)
  • 想后台静默运行(比如 SSH 断开也不影响),加 -bwget -b https://releases.ubuntu.com/24.04/ubuntu-24.04-desktop-amd64.iso,日志默认写入 wget-log
  • -c 强制续传(某些旧版 wget 或非标准响应下更可靠):wget -c -O ubuntu.iso https://...

限制速度与规避反爬

批量下载或对公网服务高频请求时,容易被限速甚至封 IP。用以下参数降低“攻击性”:

  • --limit-rate=200k:限速 200KB/s,避免打满带宽
  • --random-wait:在每次请求前随机等待 0.5–1.5 秒
  • --user-agent="Mozilla/5.0 (X11; Linux x86_64)":伪装成浏览器 UA(有些站点会拦截默认的 wget UA)
  • 注意:--wait=2 是固定间隔 2 秒,--random-wait 更自然,但两者不能同时用

真正麻烦的是那些返回 403 却没明显原因的下载——往往不是权限问题,而是服务器校验了 Referer 或要求 JS 渲染后才放行链接。这种情况下 wget 无能为力,得换 curl 模拟完整请求头,或者用浏览器开发者工具抓真实下载地址。

理论要掌握,实操不能落!以上关于《Linux用wget下载文件方法详解》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>