我正在尝试解析标准输入,并提取与特定模式匹配的每个字符串,计算每个匹配的出现次数,并按字母顺序打印结果。这个问题似乎很适合Streams API,但是我找不到从Matcher创建匹配流的简洁方法。
我通过在匹配项上实现迭代器并将其包装到Stream中来解决此问题,但是结果不是很可读。如何在不引入其他类的情况下创建正则表达式匹配流?
public class PatternCounter { static private class MatcherIterator implements Iterator<String> { private final Matcher matcher; public MatcherIterator(Matcher matcher) { this.matcher = matcher; } public boolean hasNext() { return matcher.find(); } public String next() { return matcher.group(0); } } static public void main(String[] args) throws Throwable { Pattern pattern = Pattern.compile("[a-zA-Z0-9.!#$%&’*+/=?^_`{|}~-]+@[a-zA-Z0-9-]+(?:\\.[a-zA-Z0-9-]+)"); new TreeMap<String, Long>(new BufferedReader(new InputStreamReader(System.in)) .lines().map(line -> { Matcher matcher = pattern.matcher(line); return StreamSupport.stream( Spliterators.spliteratorUnknownSize(new MatcherIterator(matcher), Spliterator.ORDERED), false); }).reduce(Stream.empty(), Stream::concat).collect(groupingBy(o -> o, counting())) ).forEach((k, v) -> { System.out.printf("%s\t%s\n",k,v); }); } }
很好,在Java 8中,Pattern.splitAsStream它将提供由 定界符 模式分割的项目流,但是不幸的是,没有支持方法来获取 匹配 流。
Pattern.splitAsStream
如果要实现这样的功能Stream,我建议Spliterator直接实现而不是实现和包装Iterator。您可能更熟悉,Iterator但是实现一个简单的方法Spliterator很简单:
Stream
Spliterator
Iterator
final class MatchItr extends Spliterators.AbstractSpliterator<String> { private final Matcher matcher; MatchItr(Matcher m) { super(m.regionEnd()-m.regionStart(), ORDERED|NONNULL); matcher=m; } public boolean tryAdvance(Consumer<? super String> action) { if(!matcher.find()) return false; action.accept(matcher.group()); return true; } }
不过,您可以考虑forEachRemaining使用直接循环覆盖。
forEachRemaining
如果我正确理解了您的尝试,则解决方案应类似于:
Pattern pattern = Pattern.compile( "[a-zA-Z0-9.!#$%&’*+/=?^_`{|}~-]+@[a-zA-Z0-9-]+(?:\\.[a-zA-Z0-9-]+)"); try(BufferedReader br=new BufferedReader(System.console().reader())) { br.lines() .flatMap(line -> StreamSupport.stream(new MatchItr(pattern.matcher(line)), false)) .collect(Collectors.groupingBy(o->o, TreeMap::new, Collectors.counting())) .forEach((k, v) -> System.out.printf("%s\t%s\n",k,v)); }
Java 9 Stream<MatchResult> results()直接在上提供了一种方法Matcher。但是,要在流中查找匹配项,可以使用更加便捷的方法Scanner。这样,实现简化为
Stream<MatchResult> results()
Matcher
Scanner
try(Scanner s = new Scanner(System.console().reader())) { s.findAll(pattern) .collect(Collectors.groupingBy(MatchResult::group,TreeMap::new,Collectors.counting())) .forEach((k, v) -> System.out.printf("%s\t%s\n",k,v)); }
此答案包含Scanner.findAll可与Java 8一起使用的反向端口。
Scanner.findAll