Scala数据结构(二)

一、集合的基础操作

1,head头信息

//获取集合的第一个元素
val list = List(1,3,5) 
list.head    //1

2,tail尾信息

//获取集合除去头元素之外的所有元素
val list = List(1,3,5)
list.tail //List(3,5)

3,last最后元素

//获取集合的最后一个元素
val list = List(1,3,5)
list.last    //5

4,init初始化

//获取集合除去最后一个元素的前面所有元素
val list = List(1,3,5)
println(list.init)    //List(1,3)

5,reverse反转

//集合反转
val list = List(1,3,5)
val resList: List[Int] = list.reverse    //List(5, 3, 1)

6,sum、max、min

val list = List(1,3,5)
println(list.sum)    //9 求和
println(list.max)    //5 最大值        
println(list.min)    //1 最小值

7,take(n)获取前n个元素

val list = List(1,3,5)
val takeList = list.take(1)    //List(1)

二、集合的高级操作

1,sortBy和sortWith

//sortBy只能按照升序排列,sortWith可自定义升降序
val list = List(10,9,1,4,7,3)
val sortByList: List[Int] = list.sortBy(x=>x)   //List(1, 3, 4, 7, 9, 10) 
val sortWithList: List[Int] = list.sortWith((left,right)=>left>right)    //List(10, 9, 7, 4, 3, 1),如果要升序可以left<right

2,groupBy分组

//定义按照元素分组会生成对应的map
val list = List(3,9,1,4,1,3)
val groupByMap: Map[Int, List[Int]] = list.groupBy(x=>x)    //Map(4 -> List(4), 1 -> List(1, 1), 9 -> List(9), 3 -> List(3, 3))

3,map映射

  在Scala中可以通过map映射操作来解决:将集合中的每一个元素通过指定功能(函数)映射(转换)成新的结果集合。这里其实就是所谓的将函数作为参数传递给另外一个函数,这是函数式编程的特点

//将list集合中的每个元素*2
val list = List(1,3,5)
val newList: List[Int] = list.map(_*2) //List(2,6,10)

4,flatMap扁平化

  将集合中的每个元素的子元素映射到某个函数并返回新的集合。

val list = List(List(1,2,3),1,List(4,98))
val newList = list.flatMap {
  case item =>
    //判断类型如果是List[Any]类型就转换
    if (item.isInstanceOf[List[Any]]) {
      item.asInstanceOf[List[Any]]
    } else {
      //如果是普通类型就直接List(item)包装
      List(item)
    }
}
println(newList)    //List(1, 2, 3, 1, 4, 98)

5,filter过滤

//filter过滤获取为true的元素组成集合
val list = List(1, 25, 3, 11, 4, 98)
val filterList: List[Int] = list.filter(_ > 20)    //List(25, 98)

6,reduce化简

      

val list = List(1, 2, 3, 4)
//1+2+3+4       10
val reduceLeft: Int = list.reduce(_ + _)
//1-(2-(3-4))   -2
val reduceRight: Int = list.reduceRight(_ - _)

7,folder折叠

   

val list = List(1, 2, 3, 4) //集合List
//(100,1, 2, 3, 4) =>化简  (((100-1)-2) -3)) – 4 = 90
println(list.foldLeft(100)(_-_)) // [函数柯里化(将多个参数,分别传递)]
//(1,2,3,4,100) => 化简 1-(2-(3-(4-100))) = 98
println(list.foldRight(100)(_-_))

 

三、模式匹配

  模式匹配语法中,采用match关键字声明,每个分支采用case关键字进行声明,当需要匹配时,会从第一个case分支开始,如果匹配成功,那么执行对应的逻辑代码,如果匹配不成功,继续执行下一个分支进行判断。如果所有case都不匹配,那么会执行case _ 分支,类似于Javadefault语句

1,类型匹配

val oper = '-'
val n1 = 20
val n2 = 10
var res = 0
oper match {
  case '+' => res = n1 + n2
  case '-' => res = n1 - n2
  case '*' => res = n1 * n2case '/' => res = n1 / n2
  case _ => println("oper error")
}
println("res=" + res) //10
1)如果所有case都不匹配,那么会执行case _ 分支,类似于Java中default语句
2)如果所有case都不匹配,又没有写case _ 分支,那么会抛出MatchError
3)每个case中,不用break语句,自动中断case
4)可以在match中使用其它类型,而不仅仅是字符,可以是表达式
5)=> 等价于 java swtich 的 :
6)=> 后面的代码块到下一个 case, 是作为一个整体执行,可以使用{} 扩起来,也可以不扩。 

2,匹配列表

for (list <- Array(List(0), List(1, 0), List(88), List(0, 0, 0), List(1, 0, 0))) {
  val result = list match {
    case 0 :: Nil => "0" // 匹配的 List(0)
    case x :: y :: Nil => x + " " + y // 匹配的是有两个元素的List(x,y)
    case 0 :: tail => "0 ..." // 匹配 以0 开头的后面有任意元素的List
    case x :: Nil => List(x)
    case _ => "something else"
  }
  println(result)
}

3,匹配元组

//请返回 (34, 89) => (89,34)
for (pair <- Array((0, 1),(34,89), (1, 0), (1, 1),(1,0,2))) {
  val result = pair match { //
    case (0, _) => "0 ..." // 表示匹配 0 开头的二元组
    case (y, 0) => y //表示匹配 0 结尾的二元组
    case (x,y) => (y,x)
    case _ => "other" //.默认
  }
  println(result)
}

4,对象匹配

val number: Double = 36.0 //Square(6.0)
number match {
  case Square(n) => println(n) // 6.0
  case _ => println("nothing matched")
}

//说明
//1. unapply 为对象提取器
//2. apply 对象构建器
object Square { //静态性质
  def unapply(z: Double): Option[Double] = {
    println("unapply 被调用 z =" + z) // 36.0
    Some(math.sqrt(z)) // Some(6.0)
  }
  def apply(z: Double): Double = z * z
}
1)构建对象时apply会被调用 ,比如 val n1 = Square(5)
2)当将 Square(n) 写在 case 后时[case Square(n) => xxx],会默认调用unapply 方法(对象提取器)
3)number 会被 传递给def unapply(z: Double) 的 z 形参
4)如果返回的是Some集合,则unapply提取器返回的结果会返回给 n 这个形参
5)case中对象的unapply方法(提取器)返回some集合则为匹配成功
6)返回None集合则为匹配失败

4,for循环

val map = Map("A"->1, "B"->0, "C"->3) //map集合
for ( (k, v) <- map ) { //每次遍历,取出k和v
  println(k + " -> " + v)
}
//说明: 只会取出 value= 0 的 k-v
println("==================================")
for ((k, 0) <- map) {
  println(k + " --> " + 0)
}
println("=====================================")
//说明 取出 value 在 [0,3] 的范围的 key-val
for ((k, v) <- map if v > 0 && v < 3) {
  println(k + " ---> " + v)
}

5,样例类

1)样例类仍然是类
2)样例类用case关键字进行声明。
3)样例类是为模式匹配(对象)而优化的类
4)构造器中的每一个参数都成为val——除非它被显式地声明为var(不建议这样做)
5)在样例类对应的伴生对象中提供apply方法让你不用new关键字就能构造出相应的对象
6)提供unapply方法让模式匹配可以工作
7)将自动生成toString、equals、hashCode和copy方法(有点类似模板类,直接给生成,供程序员使用)

四、Scala泛型

1,scala的类和方法、函数都可以是泛型。
2,关于对类型边界的限定分为上边界和下边界(对类进行限制)
  上边界:表达了泛型的类型必须是"某种类型"或某种类型的"子类",语法为“<:”,
  下边界:表达了泛型的类型不做限,可以传任意值,语法为“>:”,
3, "<%" :view bounds可以进行某种神秘的转换,把你的类型在没有知觉的情况下转换成目标类型,
  其实你可以认为view bounds是上下边界的加强和补充,语法为:"<%",要用到implicit进行隐式转换
4,"T:classTag":相当于动态类型,你使用时传入什么类型就是什么类型,(spark的程序的编译和运行是区分了Driver和Executor的,只有在运行的时候才知道完整的类型信息)
  语法为:"[T:ClassTag]"下面有列子
5,逆变和协变:-T和+T(下面有具体例子)+T可以传入其子类和本身(与继承关系一致)-T可以传入其父类和本身(与继承的关系相反),
6,"T:Ordering" :表示将T变成Ordering[T],可以直接用其方法进行比大小,可完成排序等工作
/**
  * +T告诉scala允许协变,即
  * 在类型检查期间,让scala接收某个类型及其子类
  */
class MyList[+T]
var list1 = new MyList[Int]
//不写类型,默认为MyList[Nothing]
var list2: MyList[Any] = null
list2 = list1
/**
  * 告诉scala允许逆变
  * 即允许接收某个类型及其超类
  */
class MyList2[-T]
var list3 = new MyList2[Any]
var list4: MyList2[Int] = null
list4 = list3

五、AKKA

  概念参考:https://blog.csdn.net/pml18710973036/article/details/87807387

  SparkDemo:https://blog.csdn.net/itcats_cn/article/details/91129794

  

原文地址:https://www.cnblogs.com/bbgs-xc/p/13227199.html