首页 > 文章 > php教程

微博短链接还原技巧与参数变化解析

时间：2026-01-22 20:32:36 400浏览收藏

大家好，我们又见面了啊~本文《微博短链接还原方法分析及参数变化解析》的内容中将会涉及到等等。如果你正在学习文章相关知识，欢迎关注我，以后会给大家带来更多文章相关文章，希望我们能一起进步！下面就开始本文的正式内容~

微博t.cn短链接跳转需手动模拟多层重定向，提取并解码base64参数，严格携带Cookie、Referer和User-Agent，否则易被导向登录页或返回403。

微博短链接怎么还原php_分析跳转过程中的参数变化【方法】

微博短链接跳转时发生了什么

微博的 t.cn 短链接不是简单 302 跳转，而是多层重定向 + 前端 JS 注入 + 参数混淆。直接用 file_get_contents() 或 curl 请求原始短链，通常只能拿到中间页 HTML（含 JS），而非最终目标 URL。关键在于：微博在跳转链中插入了 luicode、lfid、featureCode 等动态参数，且部分参数由前端 JS 计算生成（比如时间戳、随机数、加密字段），服务端校验严格。

用 PHP 模拟完整跳转链（绕过 JS）

必须手动跟进每一步 302，并保留 Cookie 和 Referer。微博跳转链典型路径是：
t.cn/xxx → weibo.com/sinaurl（带 url= base64 参数）→ weibo.com/xxx（最终页或再次跳转）。注意：sinaurl 页面会返回一个 base64 编码的原始 URL，但该 base64 字符串可能被二次 urlencode，需先 urldecode() 再 base64_decode()。

启用 CURLOPT_FOLLOWLOCATION 会失败——微博检测到非浏览器跳转，返回 403 或空白页
必须手动处理每次 Location header，带上上一步响应中的 Set-Cookie
所有请求都得设置 User-Agent 和 Referer: https://weibo.com/，否则第二步就卡住
如果遇到 weibo.com/sinaurl?u=... 中的 u 参数是类似 aHR0cHM6Ly90LmNvLzFhYmMxZA== 的 base64，直接解码即可；但若含 %3D 等编码，先 urldecode()

$ch = curl_init();
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HEADER, true);
curl_setopt($ch, CURLOPT_NOBODY, false);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36');
curl_setopt($ch, CURLOPT_REFERER, 'https://weibo.com/');

// 第一步：请求 t.cn 短链
curl_setopt($ch, CURLOPT_URL, 'https://t.cn/abc123');
$response = curl_exec($ch);
$header_size = curl_getinfo($ch, CURLINFO_HEADER_SIZE);
$headers = substr($response, 0, $header_size);
$body = substr($response, $header_size);

// 提取 Set-Cookie 和 Location
$cookies = [];
if (preg_match_all('/Set-Cookie:\s*([^;]+)/i', $headers, $matches)) {
    $cookies = $matches[1];
}
$location = '';
if (preg_match('/Location:\s*(\S+)/i', $headers, $matches)) {
    $location = trim($matches[1]);
}

// 第二步：请求 sinaurl 页面（带上 cookie）
curl_setopt($ch, CURLOPT_URL, $location);
curl_setopt($ch, CURLOPT_COOKIE, implode('; ', $cookies));
$response2 = curl_exec($ch);
$header_size2 = curl_getinfo($ch, CURLINFO_HEADER_SIZE);
$headers2 = substr($response2, 0, $header_size2);

// 解析 u 参数
if (preg_match('/u=([^&\s]+)/', $location, $u_match)) {
    $u = urldecode($u_match[1]);
    $decoded = base64_decode($u);
    if ($decoded && filter_var($decoded, FILTER_VALIDATE_URL)) {
        echo $decoded; // 最终长链接
    }
}

为什么有些短链还原后是 login 接口或 403

微博对短链做了访问控制：未登录用户、无 Referer、User-Agent 异常、IP 请求频次过高，都会被导向 login.sina.com.cn 或返回 403。更隐蔽的是，部分短链绑定「微博内嵌 WebView」环境，包含 from=wap 或 from=singleWeiBo 参数，服务端据此判断是否放行。单纯还原 URL 不等于能访问——你拿到的是“带权限上下文的链接”，脱离原始环境就失效。

检查响应 body 是否含 "login.sina.com.cn" 或 "请登录微博" 文本，说明已被拦截
尝试在 curl 中添加 Cookie: SUB=xxx（从已登录浏览器复制有效 SUB cookie）可绕过部分限制
某些短链（如推广链接）末尾拼了 &utm_source=weibo，这些参数不是跳转必需，但删掉可能导致目标站拒绝访问

别依赖前端 JS 渲染还原

网上有方案建议用 headless Chrome 执行跳转页面 JS 来获取最终 URL，但实际不可靠：微博页面 JS 会检测 document.visibilityState、navigator.webdriver，甚至读取屏幕分辨率和字体列表，稍有异常就中断跳转或返回错误页。PHP 侧纯 HTTP 模拟虽繁琐，但可控、可 debug、不依赖浏览器环境。

真正难的不是解 base64，而是识别哪一层跳转才携带真实目标 URL——有时它藏在第三步的 meta refresh，有时在第二步 HTML 的 data-url 属性里，有时甚至要解析 JS 变量赋值。遇到异常跳转，先用浏览器开发者工具看 Network 面板里每一步的 Response Headers 和 Redirect Chain，再对应写 PHP 补全逻辑。

今天带大家了解了的相关知识，希望对你有所帮助；关于文章的技术知识我们会一点点深入介绍，欢迎大家关注golang学习网公众号，一起学习编程~