Spring Boot配置线程池使用多线程插入数据
来源:SegmentFault
时间:2023-02-24 16:27:38 254浏览 收藏
在数据库实战开发的过程中,我们经常会遇到一些这样那样的问题,然后要卡好半天,等问题解决了才发现原来一些细节知识点还是没有掌握好。今天golang学习网就整理分享《Spring Boot配置线程池使用多线程插入数据》,聊聊MySQL、Java,希望可以帮助到正在努力赚钱的你。
前言:
最近在工作中需要将一大批数据导入到数据库中,因为种种原因这些数据不能使用同步数据的方式来进行复制,而是提供了一批文本,文本里面有很多行url地址,需要的字段都包含在这些url中。最开始是使用的正常的普通方式去写入,但是量太大了,所以就尝试使用多线程来写入。下面我们就来介绍一下怎么使用多线程进行导入。
1.文本格式
格式就是类似于这种格式的url,当然这里只是举个例子,大概有300多个文本,每个文本里面有大概25000条url,而每条url要插入两个表,这个量还是有点大的,单线程跑的非常慢。
https://www.test.com/?type=1&code=123456&goodsId=321
2.springboot配置线程池
我们需要创建一个
ExecutorConfig类来设置线程池的各种配置。
@Configuration @EnableAsync public class ExecutorConfig { private static Logger logger = LogManager.getLogger(ExecutorConfig.class.getName()); @Bean public Executor asyncServiceExecutor() { ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor(); //配置核心线程数 executor.setCorePoolSize(5); //配置最大线程数 executor.setMaxPoolSize(10); //配置队列大小 executor.setQueueCapacity(400); //配置线程池中的线程的名称前缀 executor.setThreadNamePrefix("thread-"); // rejection-policy:当pool已经达到max size的时候,如何处理新任务 // CALLER_RUNS:不在新线程中执行任务,而是有调用者所在的线程来执行 executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy()); //执行初始化 executor.initialize(); return executor; } }
3.创建异步任务接口
我们需要创建一个接口,再这个接口里面声明了我们需要调用的异步方法
public interface AsyncService { /** * 执行异步任务 */ void writeTxt(); }
4.创建异步实现类
再创建一个异步类实现上面的异步接口,重写接口里面的方法,最重要的是我们需要在方法上加
@Async("asyncServiceExecutor")注解,它是刚刚我们在线程池配置类的里的那个配制方法的名字,加上这个后每次执行这个方法都会开启一个线程放入线程池中。我下面这个方法是开启多线程遍历文件夹中的文件然后为每个文件都复制一个副本出来。
@Service public class AsyncServiceImpl implements AsyncService { private static Logger logger = LogManager.getLogger(AsyncServiceImpl.class.getName()); @Async("asyncServiceExecutor") public void writeTxt(String fileName){ logger.info("线程-" + Thread.currentThread().getId() + "在执行写入"); try { File file = new File(fileName); Listlines = FileUtils.readLines(file); File copyFile = new File(fileName + "_copy.txt"); lines.stream().forEach(string->{ try { FileUtils.writeStringToFile(copyFile,string,"utf8",true); FileUtils.writeStringToFile(copyFile,"\r\n","utf8",true); } catch (IOException e) { logger.info(e.getMessage()); } }); }catch (Exception e) { logger.info(e.getMessage()); } } }
@RunWith(SpringRunner.class) @SpringBootTest public class BootApplicationTests { @Autowired private AsyncService asyncService; @Test public void write() { File file = new File("F://ac_code_1//test.txt"); try { FileUtils.writeStringToFile(file, "ceshi", "utf8"); FileUtils.writeStringToFile(file, "\r\n", "utf8"); FileUtils.writeStringToFile(file, "ceshi2", "utf8"); } catch (IOException e) { e.printStackTrace(); } }
5.修改为阻塞式
上面的步骤已经基本实现了多线程的操作,但是当我真的开始导入数据的时候又发现一个问题,就是每次运行后才刚开始导入就自动停止了,原因是我在Junit中运行了代码后它虽然开始导入了,但是因为数据很多时间很长,而Juint跑完主线程的逻辑后就把整个JVM都关掉了,所以导入了一点点就停止了,上面的测试方法之所以没问题是因为几个文件的复制速度很快,在主线程跑完之前就跑完了,所以看上去没问题。最开始我用了一个最笨的方法,直接在主线程最后调用
Thread.sleep()方法,虽然有效果但是这也太low了,而且你也没法判断到底数据导完没有。所以我又换了一个方式。
6.使用countDownLatch阻塞主线程
CountDownLatch是一个同步工具类,它允许一个或多个线程一直等待,直到其他线程执行完后再执行。它可以使主线程一直等到所有的子线程执行完之后再执行。我们修改下代码,创建一个CountDownLatch实例,大小是所有运行线程的数量,然后在异步类的方法中的finally里面对它进行减1,在主线程最后调用
await()方法,这样就能确保所有的子线程运行完后主线程才会继续执行。
@RunWith(SpringRunner.class) @SpringBootTest public class BootApplicationTests { private final CountDownLatch countDownLatch = new CountDownLatch(10); @Autowired private AsyncService asyncService; @Test public void mainWait() { try { for (int i = 0; i
@Service public class AsyncServiceImpl implements AsyncService { private static Logger logger = LogManager.getLogger(AsyncServiceImpl.class.getName()); @Override @Async("asyncServiceExecutor") public void mainWait(CountDownLatch countDownLatch) { try { System.out.println("线程" + Thread.currentThread().getId() + "开始执行"); for (int i=1;i
7.导入代码
虽然上面的多线程是重点,不过还是把导入数据的代码展示出来给大家参考一下,当然这是简化版,真实的要比这个多了很多判断,不过那都是基于业务需求做的判断。
@RunWith(value = SpringRunner.class) @SpringBootTest public class ApplicationTests { private static Log logger = LogFactory.getLog(ApplicationTests.class); private final CountDownLatch countDownLatch; @Autowired AsyncService asyncService; @Test public void writeCode() { try { File file = new File("F:\\ac_code_1"); File[] files = file.listFiles(); //计数器数量就等于文件数量,因为每个文件会开一个线程 countDownLatch = new CountDownLatch(files.length); Arrays.stream(files).forEach(file1 -> { File child = new File(file1.getAbsolutePath()); String fileName = child.getAbsolutePath(); logger.info(asyncService.writeCode(fileName,countDownLatch)); }); countDownLatch.await(); catch (InterruptedException e) { e.printStackTrace(); } } }
@Service public class AsyncServiceImpl implements AsyncService { private static Log logger = LogFactory.getLog(AsyncServiceImpl.class); @Autowired IExampleService exampleService; @Override @Async("asyncServiceExecutor") public String writeCode(String fileName,CountDownLatch countDownLatch) { logger.info("线程-" + Thread.currentThread().getId() + "在导入-" + fileName); try { File file = new File(fileName); Listlist = FileUtils.readLines(file); for (String string : list) { String[] parmas = string.split(","); ExampleVo vo = new ExampleVo(); vo.setParam1(parmas[0]); vo.setParam1(parmas[1]); vo.setParam1(parmas[2]); exampleService.save(vo); } return "导入完成-" + fileName; }catch (Exception e){ e.printStackTrace(); return null; }finally { //导入完后减1 countDownLatch.countDown(); } } }
总结:
到这里就已经讲完了多线程插入数据的方法,目前这个方法还很简陋。因为是每个文件都开一个线程性能消耗比较大,而且如果线程池的线程配置太多了,频繁切换反而会变得很慢,大家如果有更好的办法都可以留言讨论。
终于介绍完啦!小伙伴们,这篇关于《Spring Boot配置线程池使用多线程插入数据》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
445 收藏
-
184 收藏
-
237 收藏
-
210 收藏
-
192 收藏
-
364 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习