深圳幻海软件技术有限公司 欢迎您!

没想到字符串分割还能这样玩

2023-02-28

大家好,我是指北君。我们写代码的时候,经常会遇到这样一个场景,那就是分割字符串。比如说把一个字符串分成N个,或者说按照N个字符分割。我们今天就来看看怎么每隔N个字符分割字符串。首先我们就使用JDK中内置的 String#split 来分割。使用 String#split

大家好,我是指北君。

我们写代码的时候,经常会遇到这样一个场景,那就是分割字符串。比如说把一个字符串分成N个,或者说按照N个字符分割。

我们今天就来看看怎么每隔N个字符分割字符串。首先我们就使用 JDK 中内置的 String#split 来分割。

使用 String#split 方法

String 类中 split 方法,是我们平常处理字符串分割最常用的方法之一,它可以根据给定的分隔符或正则表达式将一个字符串分割成多个部分。

我们来看个例子:

public static List<String> usingSplitMethod(String text, int n) {
    String[] results = text.split("(?<=\\G.{" + n + "})");

    return Arrays.asList(results);
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

我们通过使用正则表达式 "(?<=\\G.{" + n + "})"来分割字符串,其中表达式中的 n 表示字符的长度。

我们可以通过以下测试用例代码验证这个正则是否有效。

public class SplitStringEveryNthCharUnitTest {

    public static final String TEXT = "abcdefgh123456";

    @Test
    public void givenString_whenUsingSplit_thenSplit() {
        List<String> results = SplitStringEveryNthChar.usingSplitMethod(TEXT, 3);

        assertThat(results, contains("abc", "def", "gh1", "234", "56"));
    }
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.

使用 String#substring 方法

String#substring 一般情况我们都是用于截取字符串使用的,这里我们也是可以用来处理字符串的分割,只要循环就行。

public static List<String> usingSubstringMethod(String text, int n) {
    List<String> results = new ArrayList<>();
    int length = text.length();

    for (int i = 0; i < length; i += n) {
        results.add(text.substring(i, Math.min(length, i + n)));
    }

    return results;
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.

我们通过以下测试用例代码来验证。

@Test
public void givenString_whenUsingSubstring_thenSplit() {
    List<String> results = SplitStringEveryNthChar.usingSubstringMethod("abcdefgh123456", 4);

    assertThat(results, contains("abcd", "efgh", "1234", "56"));
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.

使用 Pattern 类

Pattern 类通常来说,我们是用于处理正则表达式,做一些match使用,正如第一种 String#split 方法所见,正则表达式也可以用于分割字符串。这里就展示一下,使用Pattern类来处理字符串分割。

public static List<String> usingPattern(String text, int n) {
    return Pattern.compile(".{1," + n + "}")
        .matcher(text)
        .results()
        .map(MatchResult::group)
        .collect(Collectors.toList());
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.

我们使用 .{1,n}构建了一个 Pattern 对象,它能个匹配 1 到 n 个字符, 使用下面的测试用例简单测试一下

@Test
public void givenString_whenUsingPattern_thenSplit() {
    List<String> results = SplitStringEveryNthChar.usingPattern("abcdefgh123456", 5);

    assertThat(results, contains("abcde", "fgh12", "3456"));
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.

使用 Guava

到现在为止,我们已经学了几种通过 JDK 相关 API 完成这个操作的方法,下面我们来看看怎么使用 Guava 来实现这个小功能。

public static List<String> usingGuava(String text, int n) {
    Iterable<String> parts = Splitter.fixedLength(n).split(text);

    return ImmutableList.copyOf(parts);
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

Guava 通过 Splitter 类可以很简单的针对我们的这个使用场景,进行字符串分割。这个 fixedLength() 方法为后续的分割提供了固定的分割长度。

我们通过下面的测试用例来测试一下。

@Test
public void givenString_whenUsingGuava_thenSplit() {
    List<String> results = SplitStringEveryNthChar.usingGuava("abcdefgh123456", 6);

    assertThat(results, contains("abcdef", "gh1234", "56"));
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.

总结

字符串分割在我们工作中很常用,但大部分情况我们只会使用 String#split , 看到其他的一些情况,是不是感觉有点有趣,没想到字符串分割还能这样玩。