列表、栈、队列、链表、哈希表

数据结构:

线性结构,元素存在一对一的关系,例如列表
树结构,元素存在一对多的关系,例如层级结构
图结构,元素存在多对多的关系,例如地图

列表:

列表:
1、列表中的元素是怎么存储的?
是顺序存储的,是一块连续的内存
2、列表的操作:按下标查找,插入元素,删除元素


先说C中的数组:
查找的时间复杂度是O(1),因为知道首地址+每个元素的大小*index就找到了地址
数组与列表有两点不同:
1、数组元素类型要相同
2、数组长度固定

python中的列表如何实现?
Python中列表的类型可以不同
Python中的列表存放的不是值而是地址,32位机器一个地址占4个字节,地址的长度是固定的
列表长度不固定
Python解释器自动维护的,发现长度不够会新开辟一块内存,把之前的列表进行拷贝
python下标查找和append复杂度是O(1)
python列表的插入和删除的复杂度是O(n)

栈:

栈(stack)是一个数据集合,可以理解为只能在一端进行插入或删除操作的列表
栈的特点:LIFO
栈的概念:栈顶,栈底
栈的基本操作:(用列表可以实现)
进栈:li.append
出栈: li.pop()
取栈顶: li[-1]
class Stack(object):
def __init__(self):
self.stack = []
def pop(self):
return self.stack.pop()
def push(self, element):
return self.stack.append(element)
def get_top(self):
if self.stack:
return self.stack[-1]
else:
return None

栈的应用:括号匹配问题 '{[()[]{}]}'遇到左括号就入栈,遇到右括号就看栈顶的左括号,把匹配的左括号出栈,匹配完后栈为空说明匹配。

队列:

队列的实现:

class Queue:
    def __init__(self, size=100):
        self.queue = [0 for _ in range(size)]
        self.size = size
        self.rear = 0
        self.front = 0

    def push(self, element):
        if self.is_filled():
            raise IndexError("Queue is filled.")
        self.rear = (self.rear + 1) % self.size
        self.queue[self.rear] = element

    def pop(self):
        if self.is_empty():
            raise IndexError("Queue is empty.")
        self.front = (self.front + 1) % self.size
        return self.queue[self.front]

    def is_empty(self):
        return self.rear == self.front

    def is_filled(self):
        return (self.rear + 1) % self.size == self.front

q = Queue(5)
for i in range(4):
    q.push(i)
print(q.is_filled())
队列简单实现
Python队列内置模块

python中有线程queue,进程queue,这里是普通的双向queue

使用方法:from collections import deque
创建队列:q = deque([1, 2, 3], maxlen=5)
进队:append()
出队:popleft()
队首进队:appendleft()
队尾出队:pop()

 栈和队列的应用:迷宫问题

# 用栈实现迷宫问题:找到的不一定是最短路径
# 深度优先搜索,又叫回溯法
# 栈里存放走的路径,先选一个方向,走一步,入栈,再选方向,走一步,入栈....,当前所在位置就是栈顶的值
# 如果某一步走不通,退一步,出栈,再换方向走,循环,直到到达终点

# 用栈实现迷宫问题:
# 深度优先搜索,又叫回溯法
# 栈里存放走的路径,先选一个方向,走一步,入栈,再选方向,走一步,入栈....,当前所在位置就是栈顶的值
# 如果某一步走不通,退一步,出栈,再换方向走,循环,直到到达终点
maze = [
    [1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
    [1, 0, 0, 1, 0, 0, 0, 1, 0, 1],
    [1, 0, 0, 1, 0, 0, 0, 1, 0, 1],
    [1, 0, 0, 0, 0, 1, 1, 0, 0, 1],
    [1, 0, 1, 1, 1, 0, 0, 0, 0, 1],
    [1, 0, 0, 0, 1, 0, 0, 0, 0, 1],
    [1, 0, 1, 0, 0, 0, 1, 0, 0, 1],
    [1, 0, 1, 1, 1, 0, 1, 1, 0, 1],
    [1, 1, 0, 0, 0, 0, 0, 0, 0, 1],
    [1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
]
# 四个方向的坐标
dirs = [
    lambda x, y: (x + 1, y),
    lambda x, y: (x - 1, y),
    lambda x, y: (x, y - 1),
    lambda x, y: (x, y + 1),
]

def maze_path(x1, y1, x2, y2):
    stack = []
    stack.append((x1, y1))
    while (len(stack) > 0):
        curNode = stack[-1]
        if curNode[0] == x2 and curNode[1] == y2:
            # 走到终点了
            print(stack)
            return
        # 四个方向,随便选一个能走通的路走,走过的标记为2,下次不走
        for dir in dirs:
            nextNode = dir(curNode[0], curNode[1])
            # 如果下个节点能走
            if maze[nextNode[0]][nextNode[1]] == 0:
                stack.append(nextNode)
                maze[nextNode[0]][nextNode[1]] = 2
                break
        else:
            stack.pop()
    else:
        print('没有路')

maze_path(1, 1, 8, 8)
用栈解决迷宫问题
# 使用队列实现迷宫问题,广度优先搜索,找到的一定是最短路径
# 使用队列存储当前正在考虑的节点


# 为了计算路径,还需要用一个列表来保存“哪个点让这个点进队列的”

 

maze = [
    [1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
    [1, 0, 0, 1, 0, 0, 0, 1, 0, 1],
    [1, 0, 0, 1, 0, 0, 0, 1, 0, 1],
    [1, 0, 0, 0, 0, 1, 1, 0, 0, 1],
    [1, 0, 1, 1, 1, 0, 0, 0, 0, 1],
    [1, 0, 0, 0, 1, 0, 0, 0, 0, 1],
    [1, 0, 1, 0, 0, 0, 1, 0, 0, 1],
    [1, 0, 1, 1, 1, 0, 1, 1, 0, 1],
    [1, 1, 0, 0, 0, 0, 0, 0, 0, 1],
    [1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
]
# 四个方向的坐标
dirs = [
    lambda x, y: (x + 1, y),
    lambda x, y: (x - 1, y),
    lambda x, y: (x, y - 1),
    lambda x, y: (x, y + 1),
]
from collections import deque


def print_path(path):
    '''
    打印路径
    '''
    curNode = path[-1]
    realpath = []
    while curNode[2] != -1:
        realpath.append(curNode[0:2])
        curNode = path[curNode[2]]
    realpath.append(curNode[0:2])  # 起点
    realpath.reverse()
    print(realpath)


def maze_path_queue(x1, y1, x2, y2):
    queue = deque()
    queue.append((x1, y1, -1))  # 第三个数表示谁引发它进队列的,存path中的下标
    path = []
    while len(queue) > 0:
        curNode = queue.popleft()
        path.append(curNode)    # 出队列的放入path,用于计算路径
        if curNode[0] == x2 and curNode[1] == y2:
            # 走到终点了
            print_path(path)
            return
        for dir in dirs:
            nextNode = dir(curNode[0], curNode[1])
            if maze[nextNode[0]][nextNode[1]] == 0:
                queue.append((nextNode[0], nextNode[1], len(path) - 1))  # path中最后一个元素就是引发它进队列的点
                maze[nextNode[0]][nextNode[1]] = 2
    else:
        print("没有路")

maze_path_queue(1, 1, 8, 8)
用队列解决迷宫问题

栈和队列的应用 :广度优先和深度优先遍历文件夹

import os


def bfs_scan(dir):
    """广度优先"""
    queue = []  # 先进先出:queue.append()  queue.pop(0)
    queue.append(dir)
    while len(queue) > 0:
        tmp = queue.pop(0)
        if os.path.isdir(tmp):
            for f in os.listdir(tmp):
                abs_path = os.path.join(tmp, f)
                if os.path.isdir(abs_path):
                    queue.append(abs_path)
                else:
                    print("找到文件>>", abs_path)
        else:
            print("找到文件>>", tmp)


if __name__ == '__main__':
    dir = "C:\Users\Administrator\Desktop\test"
    bfs_scan(dir)
广度优先遍历目录【用队列】
import os


def dfs_scan(dir):
    """深度优先"""
    stack = []  # 后进先出:queue.append()  queue.pop()
    stack.append(dir)
    while len(stack) > 0:
        tmp = stack.pop()
        if os.path.isdir(tmp):
            for f in os.listdir(tmp):
                abs_path = os.path.join(tmp, f)
                if os.path.isdir(abs_path):
                    stack.append(abs_path)
                else:
                    print("找到文件>>", abs_path)
        else:
            print("找到文件>>", tmp)


if __name__ == '__main__':
    dir = "C:\Users\Administrator\Desktop\test"
    dfs_scan(dir)
深度优先遍历目录【用堆栈】

链表:

 

顺序表与链表时间复杂度对比:
  按元素值查找:O(n)
  按下标查找:O(1) O(n)
  在某元素后插入:O(n) O(1)
  删除某元素:O(n) O(1)
总结:
  1.链表在插入和删除的操作上明显快于顺序表
  2.链表的内存可以更灵活的分配
  3.可以实现堆和栈

 哈希表

哈希表:
哈希表通过哈希函数来计算数据存储位置的数据结构,通常支持如下操作
insert:插入键值对
get:如果存在键为key的返回其value,否则返回空
delete:删除为key的键值对
直接寻址表:

直接寻址技术缺点:
  域U很大时,需要消耗大量内存,不实际
  域U很大而实际出现的key很少,则大量空间被浪费
  无法处理关键字不是数字的情况
直接寻址表:key=k的元素放在列表的k位置

直接寻址表改为哈希表:
  1、构建大小为m的寻址表T
  2、key=k的元素放到h(k)位置上
  3、h(k)是一个函数,作用是将域U映射到表T[0,1,2,...,m-1]

哈希表
哈希表又称散列表,是一种线性表的存储结构。哈希表由一个
直接寻址表和一个哈希函数组成。哈希函数h(k)将元素关键字作为自变量,
返回元素的存储下标。

假设有一个长度为7的哈希表,哈希函数h(k)=k%7,元素集合
{14,22,3,5}的存储方式如下图:

哈希冲突:
  由于哈希表的大小是有限的,而要存储的值的总数量是无限的,
  因此对于任何哈希函数,都会出现两个不同元素映射到同一个位置上的情况,
  这种情况叫做哈希冲突.
比如h(k)=k%7, h(0)=h(7)=h(14)=...
解决hash冲突的两种方式:
一、开放寻址法:如果哈希函数返回的位置已经有值,则可以向后探查新的位置来存储这个值。
  线性探查:如果位置i被占用,则探查i+1,i+2,...查找的时候,也要进行线性探查
  二次探查:如果位置i被占用,则探查i+1²,i-1²,i+2²,i-2²,...
  二度哈希:有n个哈希函数,当使用第1个哈希函数h1发生冲突时,则尝试使用h2,h3...
  这个方式大家不太喜欢,有可能hash表满了,就肯定没空间了

二、拉链法
  哈希表每个位置都连接一个链表,当冲突发生时,冲突的元素将被加到该位置链表的最后。
  查找的时候,先找到hash函数计算的位置,再在链表里找

 常见的哈希函数:

class LinkList:
    class Node:
        def __init__(self, item=None):
            self.item = item
            self.next = None

    class LinkListIterator:
        def __init__(self, node):
            self.node = node

        def __next__(self):
            if self.node:
                cur_node = self.node
                self.node = cur_node.next
                return cur_node.item
            else:
                raise StopIteration

        def __iter__(self):
            return self

    def __init__(self, iterable=None):
        self.head = None
        self.tail = None
        if iterable:
            self.extend(iterable)

    def append(self, obj):
        s = LinkList.Node(obj)
        if not self.head:
            self.head = s
            self.tail = s
        else:
            self.tail.next = s
            self.tail = s

    def extend(self, iterable):
        for obj in iterable:
            self.append(obj)

    def find(self, obj):
        for n in self:
            if n == obj:
                return True
        return False

    def __iter__(self):
        return self.LinkListIterator(self.head)

    def __repr__(self):
        return "<<" + ", ".join(map(str, self)) + ">>"


# 类似于集合的结构
class HashTable:
    def __init__(self, size=101):
        self.size = size
        self.T = [LinkList() for _ in range(self.size)]

    def h(self, k):
        '''
        hash函数
        '''
        return k % self.size

    def insert(self, k):
        i = self.h(k)
        if self.find(k):
            print('Duplicated Insert')
        else:
            self.T[i].append(k)

    def find(self, k):
        i = self.h(k)
        return self.T[i].find(k)

    def __repr__(self):
        return ",".join(map(str, self.T))


ht = HashTable()
ht.insert(0)
ht.insert(1)
ht.insert(0)
ht.insert(202)
print(ht)
print(ht.find(202))
哈希表实现集合

 

 

 

23223

原文地址:https://www.cnblogs.com/staff/p/11447791.html