前些天在实现 MyBatis 批量插入时遇到了一个问题,当批量插入的数据量比较大时,会导致程序执行报错,如下图所示:
原因是 MySQL 只能执行一定长度的 SQL 语句,但当插入的数据量较多时,会生成一条很长的 SQL,这样程序在执行时就会报错。
要解决这个问题,有两种方法:第一,设置 MySQL 可以执行 SQL 的最大长度;第二,将一个大 List 分成 N 个小 List 进行。由于无法准确的界定程序中最大的 SQL 长度,所以最优的解决方案还是第二种,于是就有了今天的这篇文章。
简介
将一个 List 分成多个小 List 的过程,我们称之为分片,当然也可以叫做“List 分隔”,选一个你喜欢的、好理解的叫法就行。
在 Java 中,分片的常见实现方法有以下几种:
使用 Google 的 Guava 框架实现分片;
使用 Apache 的 commons 框架实现分片;
使用国产神级框架 Hutool 实现分片;
使用 JDK 8 中提供 Stream 实现分片;
自定义分片功能。
接下来我们分别来看。
1.Google Guava
先在项目的 pom.xml 中添加框架支持,增加以下配置:
<!--googleguava工具类--><!--https://mvnrepository.com/artifact/com.google.guava/guava--><dependency><groupId>com.google.guava</groupId><artifactId>guava</artifactId><version>31.0.1-jre</version></dependency>
有了 Guava 框架之后,只需要使用 Lists.partition 方法即可实现分片,如下代码所示:
importcom.google.common.collect.Lists;importjava.util.Arrays;importjava.util.List;/***Guava分片*/publicclassPartitionByGuavaExample{//原集合privatestaticfinalList<String>OLD_LIST=Arrays.asList("唐僧,悟空,八戒,沙僧,曹操,刘备,孙权".split(","));publicstaticvoidmain(String[]args){//集合分片List<List<String>>newList=Lists.partition(OLD_LIST,3);//打印分片集合newList.forEach(i->{System.out.println("集合长度:"+i.size());});}}
以上代码的执行结果如下图所示:
2.apache commons
先在项目的 pom.xml 中添加框架支持,增加以下配置:
<!--apache集合工具类--><!--https://mvnrepository.com/artifact/org.apache.commons/commons-collections4--><dependency><groupId>org.apache.commons</groupId><artifactId>commons-collections4</artifactId><version>4.4</version></dependency>
有了 commons 框架之后,只需要使用 ListUtils.partition 方法即可实现分片,如下代码所示:
importorg.apache.commons.collections4.ListUtils;importjava.util.Arrays;importjava.util.List;/***commons.collections4集合分片*/publicclassPartitionExample{//原集合privatestaticfinalList<String>OLD_LIST=Arrays.asList("唐僧,悟空,八戒,沙僧,曹操,刘备,孙权".split(","));publicstaticvoidmain(String[]args){//集合分片List<List<String>>newList=ListUtils.partition(OLD_LIST,3);newList.forEach(i->{System.out.println("集合长度:"+i.size());});}}
以上代码的执行结果如下图所示:
3.Hutool
先在项目的 pom.xml 中添加框架支持,增加以下配置:
<!--工具类hutool--><!--https://mvnrepository.com/artifact/cn.hutool/hutool-all--><dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.7.14</version></dependency>
有了 Hutool 框架之后,只需要使用 ListUtil.partition 方法即可实现分片,如下代码所示:
importcn.hutool.core.collection.ListUtil;importjava.util.Arrays;importjava.util.List;publicclassPartitionByHutoolExample{//原集合privatestaticfinalList<String>OLD_LIST=Arrays.asList("唐僧,悟空,八戒,沙僧,曹操,刘备,孙权".split(","));publicstaticvoidmain(String[]args){//分片处理List<List<String>>newList=ListUtil.partition(OLD_LIST,3);newList.forEach(i->{System.out.println("集合长度:"+i.size());});}}
以上代码的执行结果如下图所示:
4.JDK
Stream 通过 JDK 8 中的 Stream 来实现分片就无需添加任何框架了,具体的实现代码如下:
importjava.util.Arrays;importjava.util.List;importjava.util.Map;importjava.util.stream.Collectors;/***JDKStreamPartition*/publicclassPartitionByStreamExample{//原集合privatestaticfinalList<Integer>OLD_LIST=Arrays.asList(1,2,3,4,5,6);publicstaticvoidmain(String[]args){//集合分片:将大于3和小于等于3的数据分别分为两组Map<Boolean,List<Integer>>newMap=OLD_LIST.stream().collect(Collectors.partitioningBy(i->i>3));//打印结果System.out.println(newMap);}}
以上代码的执行结果如下图所示:
此方式的优点的无需添加任何框架,但缺点是只能实现简单的分片(将一个 List 分为两个),并且要有明确的分片条件。比如本篇案例中设置的分片条件就是数组是否大于 3,如果大于 3 就会被归为一组,否则就会被分到另一组。
5.自定义分片
如果你不想引入第三方框架,并且使用 Stream 也无法满足你的需求,你就可以考虑自己写代码来实现分片功能了。因为此方式不常用,所以咱们这里只给出关键方法。
自定义分片功能的关键实现方法是 JDK 自带的 subList 方法,如下图所示:
使用示例如下:
importjava.util.Arrays;importjava.util.List;publicclassApp{privatestaticfinalList<String>_OLD_LIST=Arrays.asList("唐僧,悟空,八戒,沙僧,曹操,刘备,孙权".split(","));publicstaticvoidmain(String[]args){//集合分隔List<String>list=_OLD_LIST.subList(0,3);//打印集合中的元素list.forEach(i->{System.out.println(i);});}}
以上代码的执行结果如下图所示:
总结
本文介绍了 5 种 List 分片的实现方法,其中最方便的实现方式是引入第三方框架,比如 Google 的 Guava、Apache 的 Commons 或者是国产开源的 Hutool 都可以,当然如果你的项目已经包含了以上任意一种,直接使用就行了。如果是简单的分片就可以考虑使用 JDK 的 Stream 或者是 List 内置的 subList 方法来实现分片功能了。
关注公众号「Java中文社群」查看更多 Java 总结性系列文章。