登录
首页 >  文章 >  php教程

微博短链接还原技巧与参数变化解析

时间:2026-01-22 20:32:36 400浏览 收藏

大家好,我们又见面了啊~本文《微博短链接还原方法分析及参数变化解析》的内容中将会涉及到等等。如果你正在学习文章相关知识,欢迎关注我,以后会给大家带来更多文章相关文章,希望我们能一起进步!下面就开始本文的正式内容~

微博t.cn短链接跳转需手动模拟多层重定向,提取并解码base64参数,严格携带Cookie、Referer和User-Agent,否则易被导向登录页或返回403。

微博短链接怎么还原php_分析跳转过程中的参数变化【方法】

微博短链接跳转时发生了什么

微博的 t.cn 短链接不是简单 302 跳转,而是多层重定向 + 前端 JS 注入 + 参数混淆。直接用 file_get_contents()curl 请求原始短链,通常只能拿到中间页 HTML(含 JS),而非最终目标 URL。关键在于:微博在跳转链中插入了 luicodelfidfeatureCode 等动态参数,且部分参数由前端 JS 计算生成(比如时间戳、随机数、加密字段),服务端校验严格。

用 PHP 模拟完整跳转链(绕过 JS)

必须手动跟进每一步 302,并保留 Cookie 和 Referer。微博跳转链典型路径是:
t.cn/xxxweibo.com/sinaurl(带 url= base64 参数)→ weibo.com/xxx(最终页或再次跳转)。注意:sinaurl 页面会返回一个 base64 编码的原始 URL,但该 base64 字符串可能被二次 urlencode,需先 urldecode()base64_decode()

  • 启用 CURLOPT_FOLLOWLOCATION 会失败——微博检测到非浏览器跳转,返回 403 或空白页
  • 必须手动处理每次 Location header,带上上一步响应中的 Set-Cookie
  • 所有请求都得设置 User-AgentReferer: https://weibo.com/,否则第二步就卡住
  • 如果遇到 weibo.com/sinaurl?u=... 中的 u 参数是类似 aHR0cHM6Ly90LmNvLzFhYmMxZA== 的 base64,直接解码即可;但若含 %3D 等编码,先 urldecode()
$ch = curl_init();
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HEADER, true);
curl_setopt($ch, CURLOPT_NOBODY, false);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36');
curl_setopt($ch, CURLOPT_REFERER, 'https://weibo.com/');

// 第一步:请求 t.cn 短链
curl_setopt($ch, CURLOPT_URL, 'https://t.cn/abc123');
$response = curl_exec($ch);
$header_size = curl_getinfo($ch, CURLINFO_HEADER_SIZE);
$headers = substr($response, 0, $header_size);
$body = substr($response, $header_size);

// 提取 Set-Cookie 和 Location
$cookies = [];
if (preg_match_all('/Set-Cookie:\s*([^;]+)/i', $headers, $matches)) {
    $cookies = $matches[1];
}
$location = '';
if (preg_match('/Location:\s*(\S+)/i', $headers, $matches)) {
    $location = trim($matches[1]);
}

// 第二步:请求 sinaurl 页面(带上 cookie)
curl_setopt($ch, CURLOPT_URL, $location);
curl_setopt($ch, CURLOPT_COOKIE, implode('; ', $cookies));
$response2 = curl_exec($ch);
$header_size2 = curl_getinfo($ch, CURLINFO_HEADER_SIZE);
$headers2 = substr($response2, 0, $header_size2);

// 解析 u 参数
if (preg_match('/u=([^&\s]+)/', $location, $u_match)) {
    $u = urldecode($u_match[1]);
    $decoded = base64_decode($u);
    if ($decoded && filter_var($decoded, FILTER_VALIDATE_URL)) {
        echo $decoded; // 最终长链接
    }
}

为什么有些短链还原后是 login 接口或 403

微博对短链做了访问控制:未登录用户、无 Referer、User-Agent 异常、IP 请求频次过高,都会被导向 login.sina.com.cn 或返回 403。更隐蔽的是,部分短链绑定「微博内嵌 WebView」环境,包含 from=wapfrom=singleWeiBo 参数,服务端据此判断是否放行。单纯还原 URL 不等于能访问——你拿到的是“带权限上下文的链接”,脱离原始环境就失效。

  • 检查响应 body 是否含 "login.sina.com.cn""请登录微博" 文本,说明已被拦截
  • 尝试在 curl 中添加 Cookie: SUB=xxx(从已登录浏览器复制有效 SUB cookie)可绕过部分限制
  • 某些短链(如推广链接)末尾拼了 &utm_source=weibo,这些参数不是跳转必需,但删掉可能导致目标站拒绝访问

别依赖前端 JS 渲染还原

网上有方案建议用 headless Chrome 执行跳转页面 JS 来获取最终 URL,但实际不可靠:微博页面 JS 会检测 document.visibilityStatenavigator.webdriver,甚至读取屏幕分辨率和字体列表,稍有异常就中断跳转或返回错误页。PHP 侧纯 HTTP 模拟虽繁琐,但可控、可 debug、不依赖浏览器环境。

真正难的不是解 base64,而是识别哪一层跳转才携带真实目标 URL——有时它藏在第三步的 meta refresh,有时在第二步 HTML 的 data-url 属性里,有时甚至要解析 JS 变量赋值。遇到异常跳转,先用浏览器开发者工具看 Network 面板里每一步的 Response Headers 和 Redirect Chain,再对应写 PHP 补全逻辑。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>