Java 8 (4) Stream 流

在本节中将介绍Stream API支持的许多操作，这些操作可以完成更复杂的数据查询，如筛选、切片、映射、查找、匹配和归约。还有一些特殊的流如：数值流、来自文件和数组等多种来源的流。

筛选和切片

　　1.用谓词筛选

　　　　Streams接口支持filter方法，该操作会接受一个谓词作为参数，并返回一个包含所有符合谓词的元素的流。例如筛选出所有素菜：

List<Dish> vegetarianMenu = menu.stream().filter(Dish::isVegetarian).collect(toList());

　　2.筛选各异的元素

　　　　流海支持一个叫做distinct的方法，它会返回一个元素各异（根据流所生成的元素的hashCode和equals方法的实现）的流。例如筛选所有的偶数并确保没有重复的：

        List<Integer> nums = Arrays.asList(1,2,3,13,12,2,1,2,2,1,2,2,3,4,5);
        List<Integer> oddNums = nums.stream().filter(s->s%2==0).distinct().collect(toList());

　　3.截断流

　　　　流支持limit(n)方法，该方法会返回一个不超过给定长度的流，所需的长度作为参数传递给limit，如果流是有序的，则最多返回前n个元素。例如筛选热量超过300卡路里的前3道菜：

List<Dish> limit3 = menu.stream().filter(c->c.getCalories()>300).distinct().limit(3).collect(toList());

　　4.跳过元素

　　　　流还支持skip(n)方法，该方法会返回一个扔掉了前n个元素的流，如果流中元素U不足n个，则返回一个空流。例如：跳过超过300卡路里的头两道菜，并返回剩下的。

List<Dish> skip2 = menu.stream().filter(c->c.getCalories()>300).distinct().skip(2).collect(toList());

映射

　　比如在SQL中，你可以选择从表中选择一列，Stream API也通过map和flatMap方法提供了类似的工具。

　　1.对流中每一个元素应用函数

　　　　流支持map方法，它接受一个函数作为参数。这个函数会被应用到每个元素上，并将其映射成一个新的元素。例如下面把Dish::getName传给了map方法，来提取流中的菜名：

List<String> names = menu.stream().map(Dish::getName).collect(toList());

　　　　因为getName返回一个String，所以map方法输出的流的类型就是Stream<String>。例如下面把List<String> 映射为List<Integer> 值是String的长度。

List<String> strs = Arrays.asList("lambda","action","java 8","stream");
List<Integer> ints = strs.stream().map(String::length).collect(toList());

　　　　如果要找出每道菜的名称有多长可以再加上一个map:

List<Integer> nameLength = menu.stream().map(Dish::getName).map(String::length).collect(toList());

　　2.流的扁平化

　　　　通过下面这个例子介绍流的扁平化：给定字符串数组：["hello","world"]，返回字符数组["h","e","l","o","w","r","d"]。

第1次尝试：你可能觉得很容易，distinct一下就好了

List<String> words = Arrays.asList("hello","world");

List<String[]> collect = words.stream().map(w -> w.split("")).distinct().collect(toList());

但是，传递给map方法的lambda为每个单词返回了一个Stirng[]，因此map返回的流实际上是Stream<String[]>类型的，而我们想要的是Stream<String>类型的

第2次尝试：map和Arrays.stream()

首先要活的一个字符流，而不是字符串数组流，有一个叫做Arrays.stream()的方法可以接收一个数组并产生一个流：例如

        String[] words = {"hello","world"};
        Stream<String> stream = Arrays.stream(words);

使用这个方法应用到前面的流水线里看看

        List<Stream<String>> collect1 = words.stream()
                .map(w -> w.split(""))
                .map(Arrays::stream)
                .distinct()
                .collect(toList());

还是不行，因为现在得到的是一个流的列表List<Stream<String>>。

第3次尝试：使用flatMap

        List<String> collect2 = words.stream()
                .map(w -> w.split(""))
                .flatMap(Arrays::stream)
                .distinct()
                .collect(toList());

使用flatMap的效果是，各个数组并不是分别映射成一个流，而是映射成流的内容。所有使用map(Arrays::stream)时生成的单个流都被合并起来，即扁平化一个流。

映射练习：

　　1.给定一个数字列表，返回每个数的平方构成的列表：

List<Integer> numbers = Arrays.asList(1,2,3,56,78,9);
List<Integer> collect3 = numbers.stream().map(a -> a * a).collect(toList());

　　2.给定两个数字列表，返回所有的参数对。

        List<Integer> num1 = Arrays.asList(1, 2, 3, 4, 5);
        List<Integer> num2 = Arrays.asList(1, 2, 3, 4, 5);

        List<int[]> collect4 = num1.stream()
                .flatMap(i -> num2.stream().map(j -> new int[]{i, j}))
                .collect(toList());

　　3.扩展前一个例子，只返回总和可以被3整除的。

        List<int[]> collect5 = num1.stream()
                .flatMap(i -> num2.stream().filter(j -> (i + j) % 3 == 0).map(j -> new int[]{i, j}))
                .collect(toList());

查找和匹配

　　查看数据集中的某些元素是否匹配一个给定的属性，Stream API通过allMatch、anyMatch、noneMatch、findFirst和findAny方法提供了这样的工具

　　1.至少匹配一个元素 anyMatch

        if(menu.stream().anyMatch(m->m.getCalories()>400)){
            System.out.println("有卡路里大于400的食物");
        }

　　2.匹配所有元素 allMatch

        if(menu.stream().allMatch(Dish::isVegetarian)){
            System.out.println("所有菜都是素菜");
        }

　　3.没有匹配 noneMatch

        if(menu.stream().noneMatch(m->m.getCalories() < 100)){
            System.out.println("所有菜都不小于100卡路里");
        }

anyMatch、allMatch、noneMatch这三个操作都用到了短路，就是Java中的 && || 运算符短路在流中的版本。

短路：有些操作不需要处理整个流就可以得到结果。例如一个用and连接起来的大布尔表达式，不管表达式有多长，只要找到一个为false就推断整个表达式为false。

对于流而言，某些操作（allMatch、anyMatch、noneMatch、findFirst、findAny）不用处理整个流就可以得到结果，limit也是一个短路操作。

查找元素

　　findAndy方法返回当前流中的任意元素：

Optional<Dish> any = menu.stream().filter(Dish::isVegetarian).findAny();

Optional<T>类是一个容器类，代表一个值存在或不存在。例如这个例子，可能会什么都没找到。

　　isPresent()：optional存在值时返回true，否则返回false。

　　ifPresent(Consumer<T> block)会在值存在的时候执行给定的代码块，（Consumer接口：传递一个T参数，消费这个T 什么也不返回）。

　　T get():值存在时返回值，否则抛出一个NoSuchElement异常。

　　T orElse(T other)：会在值存在时返回值，否则返回一个默认值。

例如：如果找到了输出这个名字，否则什么也不错

menu.stream().filter(Dish::isVegetarian).findAny().ifPresent(d->System.out.println(d.getName()));

　　findFrist方法返回第一个元素：

menu.stream().filter(Dish::isVegetarian).findFirst().ifPresent(d->System.out.println(d.getName()));

findFrist和findAny：找到第一个元素在并行上限制更多，如果不关心返回的元素是哪个就是用findAny，因为它在是用并行流时限制较少。

归约 reduce

　　例如查找所有菜的总卡路里，或菜中最高的卡路里是哪个，这类查询需要将流中所有的元素反复结合起来，得到一个值。这样的查询可以被归类为归约操作。

　　求和：

在是用reduce方法之前，来看看for-each循环来对数字列表中的元素求和：

        List<Integer> nums1 = Arrays.asList(1,2,3,4,5);

        int sum  = 0;
        for(int i : nums1){
            sum +=i;
        }

是用reduce来求和如下：

int reduceSum = nums1.stream().reduce(0, (a, b) -> a + b);

这里的第一个参数就如上面设置的初始值一样，第二个参数就是一个BinaryOperator<T>来将两个元素结合起来产生一个新值。

在Java 8 中，Integer类有一个现有的静态sum方法来对两个数求和，因此可以改写成：

Integer reduce = nums1.stream().reduce(0, Integer::sum);

reduce还有一个重载版本，它不用接受初始值，但会返回一个Optional对象：

Optional<Integer> reduce = nums1.stream().reduce(Integer::sum);

　　最大值和最小值：

Optional<Integer> max = nums1.stream().reduce(Integer::max);
Optional<Integer> min = nums1.stream().reduce(Integer::min);

当然也可以写成 (x,y) -> x< y ? x : y;而不是Integer::min，不过后者更好读。

流操作：无状态和有状态

　　map或feilter等操作会从输入流中获取每一个元素，并在输出流得到0或1个结果。这些操作一般都是无状态的：他们没有内部状态。

　　但reduce、sum、max等操作需要内部状态类累计结果，不管流中又多少元素要处理，内部状态都是有界的。

　　相反，sort或distinct等操作一开始都和filter、map差不多--都是接受一个流，再生成一个流（中间操作），但有一个关键的区别。从流中排序和删除重复项时都需要知道先前的历史，我们把这些操作叫做有状态操作。

到目前学到的流的方法如下：

　　中间操作：

　　　　filter、distinct、skip、limit、map、flatMap、sorted。

　　终端操作：

　　　　anyMatch、noneMatch、allMatch、findAny、findFirst、forEach、collect、reduce、count。

小练习：

public class Trader {
    private final String name;
    private final String city;
}

public class Transaction {
    private final Trader trader;
    private final int year;
    private final int value;
}

        Trader raoul = new Trader("Raoul", "Cambridge");
        Trader mario = new Trader("Mario","Milan");
        Trader alan = new Trader("Alan","Cambridge");
        Trader brian = new Trader("Brian","Cambridge");
        List<Transaction> transactions = Arrays.asList(
                new Transaction(brian, 2011, 300),
                new Transaction(raoul, 2012, 1000),
                new Transaction(raoul, 2011, 400),
                new Transaction(mario, 2012, 710),
                new Transaction(mario, 2012, 700),
                new Transaction(alan, 2012, 950)
        );

        //1.找出2011年发生的所有交易，并按交易额排序(从低到高)
        List<Transaction> collect = transactions.stream()
                .filter(t -> t.getYear() == 2011)
                .sorted(Comparator.comparing(Transaction::getValue))
                .collect(toList());
        System.out.println(collect);

        //2.交易员都在哪些不同的城市工作过?
        List<String> collect1 = transactions.stream()
                .map(m -> m.getTrader().getCity())
                .distinct()
                .collect(toList());
        System.out.println(collect1);

        //3.查找所有来自于剑桥的交易员，并按姓名排序。
        List<Trader> collect2 = transactions.stream()
                .map(m -> m.getTrader())
                .filter(m -> m.getCity() == "Cambridge")
                .distinct()
                .sorted(Comparator.comparing(Trader::getName))
                .collect(toList());

        //4.返回所有交易员的姓名字符串，按字母顺序排序
        String reduce = transactions.stream()
                .map(t -> t.getTrader().getName())
                .distinct()
                .sorted()
                .reduce("", (n1, n2) -> n1 + n2);//效率不高是stirng 拼接 下一节joining

        //5.有没有交易员是在米兰工作的
        boolean milan = transactions.stream().anyMatch(c -> c.getTrader().getCity().equals("Milan"));

        //6.打印生活在剑桥的交易员的所有交易额
        transactions.stream()
                .filter(t->t.getTrader().getCity().equals("Cambridge"))
                .map(Transaction::getValue)
                .forEach(System.out::println);

        //7.所有交易中，最高的交易额是多少
        Optional<Integer> reduce1 = transactions.stream()
                .map(Transaction::getValue)
                .reduce(Integer::max);

        //8.找到交易额最小的交易
        Optional<Transaction> reduce2 = transactions.stream()
                .reduce((t1, t2) -> t1.getValue() < t2.getValue() ? t1 : t2);

        //流还支持min和max方法
        Optional<Transaction> smallTransaction = transactions.stream()
                .min(Comparator.comparing(Transaction::getValue));
        smallTransaction.ifPresent(System.out::println);

数值流

　　前面使用reduce方法计算了元素的总和，例如：

Integer reduce3 = transactions.stream().map(c -> c.getValue()).reduce(0, Integer::sum);

这段代码的问题是，它有一个暗含的装箱成本，每个Integer都必须拆箱成一个原始类型后再进行求和，要是可以像下面这样直接调用sum方法不是更好？

int sum3 = transactions.stream().map(c->c.getValue()).sum();

这是不可能的，因为map方法会生成一个Stream<T>，虽然流中的元素是Integer类型，但Streams接口没有定义sum方法。Stream API提供了原始类型流特化，专门支持处理数值流的方法。

原始类型流特化

　　Java 8 引入了三个原始类型特化流接口来解决这个问题：IntStream、DoubleStream、LongStream，分别将流中的元素特化为int、long和double，从而避免了暗含的装箱成本。

　　1.映射到数值流

　　　　将流转换为特化版本的常用方法是mapToInt、mapToDouble和mapToLong，这些方法返回一个特化流，而不是Stream<T>。例如：

int sum = transactions.stream().mapToInt(Transaction::getValue).sum();

mapToInt返回一个IntStream而不是Stream<Integer>，然后就可以调用IntStream中的sum方法，如果流是空的，sum默认返回0.还支持其他方法如max、min、average等。

　　2.转换回对象流

　　　　将特化流转回非特化流，可以使用boxed方法：

        IntStream intStream = transactions.stream().mapToInt(Transaction::getValue);
        Stream<Integer> stream = intStream.boxed();

　　3.默认值OptionalInt

　　　　Optional对于三中原始流特化，也分别有一个Optional原始类型特化版本：OptionalInt、OptionalDouble、OptionalLong。例如要找到最大元素：

OptionalInt max = transactions.stream().mapToInt(Transaction::getValue).max();

如果没有最大值可以给一个默认值：

int i = transactions.stream().mapToInt(Transaction::getValue).max().orElse(1);

数值范围

　　在Java 8中引入了两个可以用于IntStream和LongStream的静态方法，帮助生成这种1到100之间数字的范围：range和rangeClosed。这两个方法第一个参数起始值，第二个参数结束值。但range是不包含结束值的，而rangeClosed则包含结束值。就是< 和<=的区别。

        IntStream evenNumbers = IntStream.rangeClosed(1,100).filter(i->i%2==0);
        System.out.println(evenNumbers.count());//50

如果是range方法则只有49个结果因为它不包含最后100这个数字。

range示例：取出1到100之间的勾股数：

        Stream<double[]> stream1 = IntStream.rangeClosed(1, 100)
                .boxed()
                .flatMap(a -> IntStream.rangeClosed(a, 100)
                        .mapToObj(
                                b -> new double[]{a, b, Math.sqrt(a * a + b * b)}
                        ).filter(t -> t[2] % 1 == 0));
        stream1.limit(3).forEach(t -> System.out.println(t[0] + "," + t[1] + "," + t[2]));

构建流

　　1.由值创建流

　　　　Stream.of方法可以显示的创建一个流，它可以接受任意数量的参数。例如：创建一个字符串流，将字符串转换为大写，再打印出来：

        Stream<String> stringStream = Stream.of("Java 8", "Lambdas", "in", "Action");
        stringStream.map(String::toUpperCase).forEach(System.out::println);

　　　　还可以使用mepty得到一个空流：

Stream<String> emptyString = Stream.empty();

　　2.由数组创建流

　　　　Arrays.Stream可以从数组创建一个流，它接受一个数组作为参数，例如你可以讲一个原始类型int的数组转换成一个IntStream：

        int[] nums4 = {2,3,5,56,6,4,4,45,234,2};
        IntStream stream2 = Arrays.stream(nums4);

　　3.由文件生成流

　　　　Files.lines可以从文件得到一个流，其中的每个元素都是该文件的一行。

        Stream<String> lines = Files.lines(Paths.get("/Users/baidawei/Desktop/test.txt"), Charset.defaultCharset());
        lines.forEach(c->System.out.println(c.toString()));

　　4.由函数生成流：创建无限流

　　　　Stream.iterate和Stream.generate这两个静态方法可以创建所谓的无限流：不像从固定集合创建的流那样有固定大小的流。由这两个产生的流会用给定的函数按需创建值，因此可以无穷的计算下去，一般来说应该使用limit来对这种流加以限制。

　　　　4.1 迭代

        Stream.iterate(0,n->n+2)
                .limit(10)
                .forEach(System.out::println);

　　　　　　iterate 第一个参数是起始值，第二个参数是一个lambda表达式（UnaryOperator<T>)类型的，没有终止条件，按需计算。所以需要limit截断

　　　　4.2 生成

　　　　　　与iterate类似，generate也可以让你按需生成一个无限流。但generate不是依次对每个新生成的值应用函数的。它接受一个Supplier<T>类型的Lambda提供新的值：

       Stream.generate(Math::random)
                .limit(5)
                .forEach(System.out::println);

　　　　　　我们使用的供应源（Math::radom）是无状态的：它不会在任何地方记录任何值。

小结：

　　1. 、筛选和切片:filter、distinct、skip、limit。

　　2、映射：map、flatMap。

　　3、查找：findFirst、findAny。

　　4、匹配：allMatch、anyMatch、noneMatch。

　　5、这些方法都利用了短路：找到结果就立即停止计算，没有必要处理整个流。

　　6、归约：reduce、聚合计算最大最小值。

　　7、filter和map等是无状态的，他们并不存储任何状态。reduce等操作需要存储状态才能计算一个值。sorted和distinct等操作也要存储状态，因为他们需要把六中的所有元素缓存起来才能返回一个新的流。这种操作称为有状态操作。

　　8、流油三种基本的原始类型特化：IntStream、DoubleStream和LongStream。

　　9、流不尽可以从集合创建，也可以从值、数组、文件以及iterate与generate等方法创建。

　　10、无限流是没有固定大小的流。