推荐文章 Go 技术课程下载专题 AI

首页 > 数据库 > MySQL

python3.6+scrapy+mysql 爬虫实战

来源：SegmentFault

时间：2023-01-24 08:18:39 402浏览收藏

小伙伴们有没有觉得学习数据库很有意思？有意思就对了！今天就给大家带来《python3.6+scrapy+mysql 爬虫实战》，以下内容将会涉及到MySQL、python、网页爬虫、scrapy、python爬虫，若是在学习中对其中部分知识点有疑问，或许看了本文就能帮到你！

最近闲着，把之前写的小爬虫分享一下，才疏学浅，仅当参考。

[介绍文档]

git clone git@github.com:caffreycc/jb51.com_crawler.git

或者直接到https://github.com/caffreycc/jb51.com_crawler.git 下载zip文件

pip install -r requirements.txt

第三步：修改配置Config.py:

    Config.py 为项目配置文件

    host = '127.0.0.1' #改成你的数据库地址，如果需要保存在线服务器请填写数据库IP
    dbname = 'your database naem'  # 数据库名字，请修改
    user = 'your databse user'  # 数据库账号，请修改
    psw = 'your password'  # 数据库密码，请修改
    port = 3306  # 数据库端口，在dbhelper中使用,一般无需修改

第四步：运行小爬虫

    命令行cd到你的项目文件夹，运行以下命令：
    或者直接在你的爬虫文件夹内shift + 右键 打开命令提示符或者powershell，运行以下命令
    scrapy crawl Common_crawler

    爬取的内容会自动保存到 config.py 中配置的mysql数据库中

问题反馈

　　有任何关于项目的问题欢迎提issues

贡献代码

本项目基于PythonCrawler-Scrapy-Mysql-File-Template开发，感谢作者@lawlite19（https://github.com/lawlite19）的开源分享精神。

项目地址： python3.6+scrapy+mysql 爬虫实战

理论要掌握，实操不能落！以上关于《python3.6+scrapy+mysql 爬虫实战》的详细介绍，大家都掌握了吧！如果想要继续提升自己的能力，那么就来关注golang学习网公众号吧！

mysql MySQL python 网页爬虫 scrapy python爬虫

声明：本文转载于：SegmentFault 如有侵犯，请联系study_golang@163.com删除

相关阅读

更多>

文章 · 常见问题 | 3星期前 | MySQL · 数据库 · 慢查询 · 索引优化 · FAQ · mysql 索引 explain 常见问题慢查询

MySQL 明明加了索引，为什么查询还是很慢？先查这 6 个点

374 收藏
Golang · Go教程 | 3年前 | MySQL · 表存储 · 获取表 · golang

golang MySQL实现对数据库表存储获取操作示例

499 收藏
Golang · Go教程 | 3年前 | MySQL · 分布式 · 读写锁 · golang

golang 基于 mysql 简单实现分布式读写锁

384 收藏
Golang · Go教程 | 3年前 | MySQL · gorm · golang

详解如何利用GORM实现MySQL事务

184 收藏
Golang · Go教程 | 3年前 | MySQL · 操作 · golang

Go语言实现操作MySQL的基础知识总结

265 收藏

最新阅读

更多>

数据库 · MySQL | 5小时前 | MySQL · 权限管理 · 备份 · mysqldump · 数据库安全 · 最小权限 mysqldump备份账号 MySQL角色 partial_revokes 备份权限

mysqldump 备份账号如何避免全库越权：MySQL 角色与 partial_revokes 实战

413 收藏
数据库 · MySQL | 7小时前 |

MySQL JSON_EXTRACT 查询为什么慢：用生成列索引做一次可验证优化实验

278 收藏
数据库 · MySQL | 1天前 | MySQL · JSON · 索引 · 数据库 · 查询优化 · 生成列 · json_extract 索引优化列表筛选生成列 MySQL JSON JSON索引

MySQL JSON 字段怎么给列表筛选提速：生成列、索引与 NULL 边界

351 收藏
数据库 · MySQL | 2天前 | MySQL · 认证 · MySQL 8.4 · 数据库升级 · caching_sha2_password mysql_native_password 账号认证 MySQL 8.4 升级迁移

MySQL 8.4 升级后旧账号连不上：mysql_native_password 迁移到 caching_sha2_password 的实战步骤

236 收藏
数据库 · MySQL | 3天前 | MySQL · 唯一索引 · 数据库设计 · 数据治理 · 软删除 · mysql 唯一索引生成列软删除账号恢复

MySQL 软删除后唯一索引怎么设计：保留历史记录，也允许同邮箱再次注册

471 收藏
数据库 · MySQL | 4天前 | MySQL · 数据库 · SQL · ON DUPLICATE KEY UPDATE · VALUES · 行别名 · MySQL VALUES() 弃用 ON DUPLICATE KEY UPDATE MySQL 行别名 INSERT AS new MySQL upsert INSERT SELECT

MySQL ON DUPLICATE KEY UPDATE 为什么别再用 VALUES()：行别名改写和兼容边界

117 收藏
数据库 · MySQL | 5天前 | MySQL · 索引 · limit · explain · sql优化 · ORDER BY · mysql order by explain limit 复合索引 filesort

MySQL ORDER BY LIMIT 为什么有时不走过滤索引：排序索引、filesort 和核对方法

279 收藏
数据库 · MySQL | 6天前 | 并发 · MySQL · InnoDB · update · 库存扣减 · innodb MySQL 库存扣减条件 UPDATE 防超卖 affected rows

MySQL 库存怎么安全扣减？条件 UPDATE、防超卖和受影响行判断

470 收藏
数据库 · MySQL | 1星期前 | MySQL · 唯一索引 · 幂等 · 订单 · 重复请求唯一索引 MySQL幂等

MySQL 幂等写入怎么设计：重复请求只创建一条订单的取舍

421 收藏
数据库 · MySQL | 1星期前 | MySQL · 慢查询 · explain · sql优化 · 索引优化 · mysql explain SQL优化隐式转换范围查询不走索引函数列

MySQL 查询为什么不走索引：函数列、隐式转换和范围条件怎么改

189 收藏
数据库 · MySQL | 1星期前 | MySQL · 视图 · 后端安全 · 数据库权限 · 报表查询 · mysql 视图数据库安全 GRANT 最小权限只读账号报表查询

MySQL 报表只读账号怎么设计：用视图和最小权限隔离生产数据

412 收藏
数据库 · MySQL | 2星期前 | MySQL · 慢查询 · 数据库优化 · 随机查询 · 事故复盘 · mysql 临时表慢查询 ORDER BY RAND() CPU飙升随机推荐

MySQL ORDER BY RAND() 为什么会拖垮接口：一次随机推荐慢查询复盘

378 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习

评论列表

靓丽的雪碧

受益颇多，一直没懂这个问题，但其实工作中常常有遇到...不过今天到这，帮助很大，总算是懂了，感谢楼主分享技术贴！

2023-01-30 00:07:41
儒雅的秀发

这篇技术贴出现的刚刚好，太全面了，太给力了，码起来，关注作者大大了！希望作者大大能多写数据库相关的文章。

2023-01-25 08:45:57