数据结构与算法

程序=数据结构+算法

结构来看:变量,列表=数组
数据怎么存储,就是数据结构
整个就是一个过程,修改这个过程就是算法

数据是静态 ,算法是动态,加起来就是程序

时间复杂度:大O表示法

如何一眼判断时间复杂度？
循环减半的过程O(logn)
几次循环就是n的几次方的复杂度

li = [1, 2, 10, 30, 33, 99]
value = 10

# 二分法
# 时间复杂度O(logN)

'''
思路:
先取得该列表的索引中间值mid,如len(li)==0,则没有这个值
判断如li[mid]>最终值,则后再在递归调用前半部分,
判断如li[mid]<最终值,则后再在递归调用后半部分,如li[mid]=最终值,就找到结果.
'''

def binarysearch(li,value): if len(li)==0: print('not got it') return mid = len(li) // 2 if li[mid] == value: print('got it') return mid elif li[mid] > value: binarysearch(li[:mid], value) elif li[mid] < value: binarysearch(li[mid+1:], value) binarysearch(li, value)

斐波那契数列O(n^2)

二分法查找

排序


'''
快速排序、堆排序、归并排序-小结
三种排序算法的时间复杂度都是O(nlogn)

一般情况下，就运行时间而言：
快速排序 < 归并排序 < 堆排序

三种排序算法的缺点：
快速排序：极端情况下排序效率低
归并排序：需要额外的内存开销
堆排序：在快的排序算法中相对较慢
'''

import random
import time
import sys
sys.setrecursionlimit(1000000)

'''
排序Low B三人组

冒泡排序:两次循环
选择排序:选择苹果
插入排序:斗地主插排
'''

def caltime(func):
    def inner(*args, **kwargs):
        start  = time.time()
        func(*args, **kwargs)
        end = time.time()
        print('%s时间是: %s' % (func.__name__, end-start))
    return inner

冒泡排序



'''
#冒泡排序,代码关键点:趟,无序区
首先，列表每两个相邻的数，如果前边的比后边的大，那么交换这两个数……
会发生什么？
优化:如果冒泡排序中执行一趟而没有交换，则列表已经是有序状态，可以直接结束算法。
##时间复杂度: O(n^2)
'''

@caltime
def BubbleSort(li):
    for i in range(len(li)):
        #### i = 0 i = 1  --- 8
        flag = False
        for j in range(len(li)-i-1):  ### j = 0, 1, 2, 3, 7
            if li[j] > li[j+1]: ### li[0] > li[1] | li[1] > li[2] | li[2] > li[3]
                li[j], li[j+1] = li[j+1], li[j]   #### [5,4,6,7,3,8,2,1,9]
                flag = True
        if not flag:
            return

选择排序



'''
#选择排序,代码关键点:无序区,最小数的位置
思路:
一趟遍历记录最小的数，放到第一个位置；
再一趟遍历记录剩余列表中最小的数，继续放置；
#### 时间复杂度:O(n^2)
……

'''


@caltime
def selectSort(li):
    for i in range(len(li)):
        minLoc = i  # minLoc = i = 0
        for j in range(i+1, len(li)):  # j = 1, j = 2
            if li[j] < li[minLoc]:   ### li[2] < li[minLoc]  4 < 5
         
       li[j], li[minLoc] = li[minLoc], li[j] ## [5,7,4,6,3,8,2,9,1]

插入排序


    
 '''
 #插入排序,代码关键点:摸到的牌,手里的牌
思路:
列表被分为有序区和无序区两个部分。最初有序区只有一个元素。
每次从无序区选择一个元素，插入到有序区的位置，直到无序区变空。
#### 时间复杂度:O(n^2)
 '''
@caltime
def insertSort(li):
    for i in range(1, len(li)):
        tmp = li[i]  ## tmp = li[1] = 5
        j = i - 1    ## j = 1 - 1 = 0
        while j >= 0 and li[j] > tmp:  ## li[0] = 7 > 5:
            li[j+1] = li[j]   ## li[1] = li[0] = 7 ==> [7,7,4,6,3,8,2,9,1]
            j = j - 1       ## j = -1
        li[j+1] = tmp   ### li[0] = tmp = 5  ==> [5,7,4,6,3,8,2,9,1]

快速排序




'''
#快速排序
   好写的排序算法里最快的
   快的排序算法里最好写的
快排思路：
取一个元素p（第一个元素），使元素p归位；
列表被p分成两部分，左边都比p小，右边都比p大；
递归完成排序。

详细思路:
归位第一个值,归位值的前半段和后半段进行排序
归位:
    最左边的值定义tmp
    如左边的索引大于右边,且最右边的值大于等于tmp,最右的索引-1.最左边的值赋值给最右边
    如左边的索引大于右边,且最右边的值小于等于tmp,最左的索引+1.最右边的值赋值给最左边
    如左边的索引非大于右边,那temp就还是最左边的值
    返回最左边值的索引


'''
### O(n)
def partition(li, left, right):
    tmp = li[left]
    while left < right:
        while left < right and li[right] >= tmp:
            right = right - 1
        li[left] = li[right]
        while left < right and li[left] <= tmp:
            left = left + 1
        li[right] = li[left]
    li[left] = tmp
    return left

## 时间复杂度: O(nlogn)
def _quickSort(li, left, right):
    if left < right:
        mid = partition(li, left, right) ### O(n)
        _quickSort(li, left, mid - 1)   ### O(logn)
        _quickSort(li, mid + 1, right)
@caltime
def quickSort(li, left, right):
    _quickSort(li, left, right)

归并排序


'''
归并排序:
分解：将列表越分越小，直至分成一个元素。
一个元素是有序的。
合并：将两个有序列表归并，列表越来越大。

'''
   
###  时间复杂度: O(nlogn)
def merge(li, low, mid, right):
    i = low
    j = mid + 1
    ltmp = []
    while i <= mid and j <= right:
        if li[i] < li[j]:
            ltmp.append(li[i])
            i = i + 1
        else:
            ltmp.append(li[j])
            j = j + 1

    while i <= mid:
        ltmp.append(li[i])
        i = i + 1

    while j <= right:
        ltmp.append(li[j])
        j = j + 1

    li[low:right+1] = ltmp

def mergeSort(li, low, high):
    if low < high:
        mid = (low + high) // 2
        mergeSort(li, low, mid)
        mergeSort(li, mid + 1, high)
        print('归并之前:', li[low:high+1])
        merge(li, low, mid, high)
        print('归并之后:', li[low:high + 1])

计数排序

现在有一个列表，列表中的数范围都在0到100之间，列表长度大约为100万。设计算法在O(n)时间复杂度内将列表进行排序。

'''
计数排序:创建一个列表，用来统计每个数出现的次数。

思路:
count定义循环列出1到10的数(按需求),如果li中有值在count中,定义count[index]计数+1
清空li
枚举count,把计算添加进li



'''
def countSort(li):
    count = [0 for i in range(11)]

    for index in li:
        count[index] += 1

    li.clear()

    for index, val in enumerate(count):
        print(index, val)
        for i in range(val):
            li.append(index)


li = [10,4,6,3,8,4,5,7]
countSort(li)
print(li)

li = [random.randint(1,100) for _  in range(10000)]
BubbleSort(li)

li = [random.randint(1,100) for _  in range(10000)]
selectSort(li)

li = [random.randint(1,100) for _  in range(10000)]
insertSort(li)

li = [random.randint(1,100) for _  in range(100000)]
print(li)
quickSort(li, 0, len(li)-1)
print(li)

现在有n个数（n>10000），设计算法，按大小顺序得到前10大的数。

'''
现在有n个数（n>10000），设计算法，按大小顺序得到前10大的数。

应用场景：榜单TOP 10

解析：
　　　　因为只要最大的十个数，所以没有必要将整个数据进行排序，因为剩下的数据是否有序不影响结果。
　　　　所以可以新建一个数量为10的数组，并将这个数组进行排序，使其有序。
　　　　然后从第11位开始取数据，拿取到的数据和十位的列表中的最小的那个做比较，如果不够大就继续循环取数，如果比最小的数大，就把取出的数据覆盖掉最小的数，并再对十位的数组排序。直至数据取完，十位数组里面储存的就是最大的十个数字。
　　　　按照这个思路可以用插入排序或者堆排序实现，下面用的是插入排序。
'''

# 将一个数组按照左大右小顺序排好
def inser_sort(list):
    for i in range(1, len(list)):
        tem = list[i]
        j = i - 1
        while j >= 0 and list[j] < tem:
            list[j + 1] = list[j]
            j = j - 1
        list[j + 1] = tem

def topk(li, k):
    list = li[0:k]  # 创建一个长度为k的数组来储存最大的k个数
    inser_sort(list)  # 将这个K数组先按照大小顺序用插入偶排序排好
    print(list)
    print(list[-1])

    for i in range(k, len(li)):  # 将剩下的数字依次拿到
        # 将拿到的数字和数组中最小的数字做对比
        if li[i] > list[-1]:  # 如果比最小的数字大，就做交换，把最小的数字换成取到的数
            list[-1] = li[i]
            # 交换之后进行排序
            inser_sort(list)
    print(list)

给定一个列表和一个整数,找到两个数的下标,使得这两个数的各为给定的整数,保证肯定仅有一个结果

'''
算法例子一:
给定一个列表和一个整数,找到两个数的下标,
使得这两个数的各为给定的整数,保证肯定仅有一个结果
'''
# 穷举法:
def brute_force(li,target):
    n=len(li)

    for i in range(0,n):
        for j in range(i+1,n):
            if li[i]+li[j]==target:
                return i,j
# 二分查找法:
def bin_search(li, val):
    low = 0
    high = len(li) - 1

    while low <= high:
        mid = (low + high) // 2
        if li[mid] == val:
            return mid
        elif li[mid] > val:
            high = mid - 1
        else:
            low = mid + 1
    return None

def search_index(li, target):
    li.sort()

    for i in range(0, len(li)):
        j=bin_search(li[i + 1:], target - li[i])
        if j:
            return i,j
'''
方法三
先给列表排序,然后循环遍历列表,如果列表第一个数与列表最后一个数相加的和大于target,把被加数向左偏移一位,

如果列表第一个数与列表最后一个数相加的和小于target,把加数向右偏移一位

如果列表中两个数相加等于target,则返回列表中的两个数的下标
'''
def search_index(li,target):
    li.sort()

    j=len(li)-1

    for i in range(j):
        if li[i] + li[j] < target:
            i += 1
        elif li[i] + li[j] > target:
            j -=1
        else:
            return i,j

给定一个升序列表和一个整数,返回该整数在列表中的下标范围

'''
算法例子二:给定一个升序列表和一个整数,返回该整数在列表中的下标范围
思路:先使用二分法找到val在列表中的下标,然后把下标分别向左和向中移动,直到下标的值不等于目标整数时返回下标的元组
'''
def bin_search(li,val):
    low=0
    high=len(li)-1

    while low <= high:
        mid=(low + high) // 2

        if li[mid] == val:
            return mid
        elif li[mid] > val:
            high = mid -1
        else:
            low=mid + 1

    return None

def search_index(li,val):
    i=0
    j=0

    mid=bin_search(li,val)
    i=mid-1
    j=mid + 1

    while li[i] ==val:
        i -= 1

    while li[j] == val:
        j += 1

    return (i+1,j-1)

two_sum求两数之和

# two_sum求两数之和
# 给定一个列表和一个整数,设计算法找到两个数的下标,使得两个数之和为给定的整数,保证肯定仅有一个结果.
# 例:列表li=[0, 1, 2, 3, 4, 5, 6]与目标整数6,结果为{0: 6, 1: 5, 2: 4, 3: 3}.
li = [0, 1, 2, 3, 4, 5, 6]

# 解法1:
def two_sum_1(li, target):
    for i in range(len(li)):
        for j in range(i + 1, len(li)):
            if li[i] + li[j] == target:
                return i, j
print(two_sum_1(li, 6))

# 解法2
def two_sum_2(li, target):
    d = {}
    for i in range(len(li)):
        b = target - li[i]
        if b in d:
            return d[b], i
        else:
            d[li[i]] = i
print(two_sum_2(li, 6))

# 解法3
# 结合二分查找法,可以找到所有的可能组合.
# 缺点:提供的列表必须是有序的,否则这个办法没有作用.
class Solution:
    # 二分查找法
    def binary_search(self, li, val, start, end):
        while start <= end:
            mid = (start + end) // 2
            if li[mid] < val:
                start = mid + 1
            elif li[mid] > val:
                end = mid - 1
            else:
                return mid
        else:
            return None

    # 给定一个列表和一个整数,设计算法找到两个数的下标,使得两个数之和为给定的整数.
    def two_sum3(self, li, target):
        dic = {}
        for i in range(len(li)):
            a = li[i]
            b = target - a
            # 写0时,{0: 6, 1: 5, 2: 4, 3: 3, 4: 2, 5: 1, 6: 0}
            # 写i时,{0: 6, 1: 5, 2: 4, 3: 3}
            # 写i+1时,{0: 6, 1: 5, 2: 4}
            res = self.binary_search(li, b, i, len(li) - 1)
            if res != None:
                dic[i] = res
        return dic

# 实例化对象
s = Solution()
# 调用类方法
print(s.two_sum3(li, 6))

数组和链表

数组:就像在app上看连续几,可以自选哪一集观看
链表:就像电视台播放连续剧,只能等一集一集的播放.

数据结构与算法

程序=数据结构+算法

时间复杂度:大O表示法

斐波那契数列O(n^2)

二分法查找

排序

冒泡排序

选择排序

插入排序

快速排序

归并排序

计数排序

现在有一个列表，列表中的数范围都在0到100之间，列表长度大约为100万。设计算法在O(n)时间复杂度内将列表进行排序。

现在有n个数（n>10000），设计算法，按大小顺序得到前10大的数。

给定一个列表和一个整数,找到两个数的下标,使得这两个数的各为给定的整数,保证肯定仅有一个结果

给定一个升序列表和一个整数,返回该整数在列表中的下标范围

two_sum求两数之和

数组和链表

线性表

顺序表

数组

引用数组

动态数组

链表

单向链表

双向链表

反转链表

链表交换相邻元素

探测环

栈,队列:都是线性的容器

堆栈stack: 先进后出

队列queue: 先进先出

string判断,{[()]}是否完整

用堆栈实现队列

实时判断数据流中第K大元素

滑动窗口最大值

map vs set, hash

有效的字母异位词

两数之和

三数之和

树,二叉树,二叉搜索树

二叉树:每个节点只有两个孩子

图

二叉搜索树

验证二叉搜索树

二叉树搜索树的最近公共祖先

二叉树的遍历

算法

递归Recursion和分治

Pow(x,n)

求众数

贪心算法greedy

36元最少需要多少张纸币

买卖股票的最佳时机

广度优先搜索BFS

深度优先搜索DFS

二叉树的层次遍历