python2.0_day18_django

python2.0_day18_django_ORM

Django_ORM
day1516我们学到的ORM都是最基本的增删改查.下面我们稍作升级,学习下高级点的增删改查.
先创建一个新的APP项目

1  python3.5 manage.py startapp blog

1.编辑blog/models.py

 1 from django.db import models
 2 
 3 # Create your models here.
 4 
 5 class Blog(models.Model):
 6     name = models.CharField(max_length=100)
 7     tagline = models.TextField()
 8 
 9     def __str__(self):              # __unicode__ on Python 2
10         return self.name
11 
12 class Author(models.Model):
13     name = models.CharField(max_length=50)
14     email = models.EmailField()
15 
16     def __str__(self):              # __unicode__ on Python 2
17         return self.name
18 
19 class Entry(models.Model):
20     blog = models.ForeignKey(Blog)
21     headline = models.CharField(max_length=255)
22     body_text = models.TextField()
23     pub_date = models.DateField()
24     mod_date = models.DateField()
25     authors = models.ManyToManyField(Author)
26     n_comments = models.IntegerField()
27     n_pingbacks = models.IntegerField()
28     rating = models.IntegerField()
29 
30     def __str__(self):              # __unicode__ on Python 2
31         return self.headline

2. 在配置文件中添加blog项目,这样blog/models.py文件才可以被引用

 1 INSTALLED_APPS = [
 2     'django.contrib.admin',
 3     'django.contrib.auth',
 4     'django.contrib.contenttypes',
 5     'django.contrib.sessions',
 6     'django.contrib.messages',
 7     'django.contrib.staticfiles',
 8     'app01',
 9     'blog',
10 ]

3. 初始化数据库

1  python3.5 manage.py makemigrations  生成配置文件
2  python3.5 manage.py migrate    初始化数据库


在自己写的脚本里调用Django models


我们直接在pycharm中运行这个脚本文件.发现报错:

    % (desc, ENVIRONMENT_VARIABLE))
django.core.exceptions.ImproperlyConfigured: Requested setting DEFAULT_INDEX_TABLESPACE, but settings are not configured. You must either define the environment variable DJANGO_SETTINGS_MODULE or call settings.configure() before accessing settings.

为什么会报错? 说白了,你现在无法调用数据库的东西.如果你想在自己的脚本调用数据库的东西,你需要导入settings.
我们之前在做命令行测试的时候,使用python3.5 manger.py shell进入到python命令行模式.
因为maneger.py文件在执行时引入了系统环境变量.我们通过查看maneger.py代码可见:

1    #!/usr/bin/env python
2     import os
3     import sys
4 
5     if __name__ == "__main__":
6         os.environ.setdefault("DJANGO_SETTINGS_MODULE", "day18_site.settings")  #这里设置了环境变量,相当于Linux中用户环境变量一样
7         from django.core.management import execute_from_command_line
8         execute_from_command_line(sys.argv)

也就是说我们如果想让自己的脚本也可以调用数据库,就必须把settings.py文件引入到脚本里.

 1 #!/usr/bin/evn python3.5
 2 # -*- coding:utf-8 -*-
 3 # Author:Zhou Ming
 4 import os
 5 import sys
 6 base = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))  # 这里要加上否则找不到day18_site目录
 7 sys.path.append(base)
 8 
 9 os.environ['DJANGO_SETTINGS_MODULE'] = 'day18_site.settings'
10 import django
11 django.setup()
12 from blog import models
13 entry = models.Entry.objects.get(pk=1)
14 print(entry)

完成后,我们在直接运行此脚本程序就不会有报错了.
我这里想，我们为什么要自己写orm_test.py文件呢？是因为我们在实际开发中，都是在视图文件views.py中直接写orm代码的，这样当访问进来后调用，但是在正式调用之前，我们是需要在一个.py文件里测试这些orm代码是否符合要求，所以要自己创建一个orm_test.py文件。

接下来看下ORM的一些基本语法
创建
    普通表的创建

    >>> from blog.models import Blog
    >>> b = Blog(name='Beatles Blog', tagline='All the latest Beatles news.')
    >>> b.save()

    处理带外键关联或多对多关联的对象
    ForeignKey的关联

    >>> from blog.models import Entry
    >>> entry = Entry.objects.get(pk=1)   # 先获取一个记录对象
    >>> cheese_blog = Blog.objects.get(name="Cheddar Talk") # 获得一个blog对象实例
    >>> entry.blog = cheese_blog        #设置外键
    #>>> entry.blog_id = cheese_blog.id       #或者设置id设置外键,两种设置外键的方式结果是一样的
    >>> entry.save()            # 改完之后要保存

    ManyToManyField关联

    >>> from blog.models import Author
    >>> joe = Author.objects.create(name="Joe") # 创建一个Author对象
    >>> entry.authors.add(joe)                  # 添加,而不是=,这个是多对多方式
    # 添加完成后,不需要进行保存

    添加多个ManyToMany对象

    >>> john = Author.objects.create(name="John")
    >>> paul = Author.objects.create(name="Paul")
    >>> george = Author.objects.create(name="George")
    >>> ringo = Author.objects.create(name="Ringo")
    >>> entry.authors.add(john, paul, george, ringo)

查询的例子:

 1     all_entries = Entry.objects.all() #查询所有
 2     Entry.objects.filter(pub_date__year=2006) #查询所有pub_date为2006年的纪录
 3     Entry.objects.all().filter(pub_date__year=2006) #与上面那句一样,有的同学会以为这条是先查出来在过滤,不是,最终它和上面的那条语句会产生一摸一样的原生sql语句.所以是一样的
 4     >>> Entry.objects.filter(   #链式查询
 5     ...     headline__startswith='What'
 6     ... ).exclude(
 7     ...     pub_date__gte=datetime.date.today   #表示大于等于今天的的意思
 8     ... ).filter(
 9     ...     pub_date__gte=datetime(2005, 1, 30) # 然后在取时间大于等于2005/1/30
10     ... )
11 
12     one_entry = Entry.objects.get(pk=1) #单条查询
13 
14     Entry.objects.all()[:5] #查询前5条  ,好多同学以为查出所有的记录然后在截取前5条,其实不是的,最终转换的sql语句,就是limit 5
15     Entry.objects.all()[5:10] #你猜 limit5,10
16 
17     Entry.objects.order_by('headline')[0] #按headline排序取第一条
18 
19     Entry.objects.filter(pub_date__lte='2006-01-01') #相当于sql语句SELECT * FROM blog_entry WHERE pub_date <= '2006-01-01';
20 
21     Entry.objects.get(headline__exact="Cat bites dog") #相当于SELECT ... WHERE headline = 'Cat bites dog';
22     Blog.objects.get(name__iexact="beatles blog") #与上面相同,只是大小写不敏感
23 
24     Entry.objects.get(headline__contains='Lennon') #相当 于SELECT ... WHERE headline LIKE '%Lennon%';

单表内查询语句

1     #This example retrieves all Entry objects with a Blog whose name is 'Beatles Blog':
2     Entry.objects.filter(blog__name='Beatles Blog')
3 
4     Blog.objects.filter(entry__headline__contains='Lennon')  反过来找
5 
6

关联查询


接下来学习一个有点意思的F_expressions
    对于同一表中不同字段进行对比查询,我们上面的例子中,我们建立的查询过滤条件或对比条件给到的都是一个常规的值,比如Entry.objects.all().filter(pub_date__year=2006)  2006就是一个常规的值
    现在我们有一个需求,拿上面的Entry表举例:Entry表里有两个字段注释数 N comments 和 评论数N pingbacks
    我现在想找,所有 N comments <=  N pingbacks的记录条目.
    我们看这里面的条件过滤就是使用同一个表中的两个字段.我们使用sql原生语句很好实现.但是在Django中的ORM如何实现呢?
    Django提供一个F()表达式,允许同表的不同字段进行比较.F()是一个实例.具体用法如下:

        >>> from django.db.models import F
        >>> Entry.objects.filter(n_comments__gt=F('n_pingbacks'))

    原生sql语句 :select n_comments,n_pingbacks from Entry where n_comments <= n_pingbacks


    不仅可以直接比较,还可以对后面的条件进行运算后在进行比较,如:

        >>> Entry.objects.filter(n_comments__gt=F('n_pingbacks') * 2)

    甚至可以多个字段进行运算,2个至多个都行,如下:

        >>> Entry.objects.filter(rating__lt=F('n_comments') + F('n_pingbacks'))
    原生sql语句: select n_comments,n_pingbacks,rating from blog_entry where rating > (n_comments + n_pingbacks)

    找出在发布后三天后进行修改的条目

        >>> from datetime import timedelta
        >>> Entry.objects.filter(mod_date__gt=F('pub_date') + timedelta(days=3))


Caching and QuerySets
缓存      和  结果集
    为什么把缓存和结果集放到一起说呢?
    每一个结果集都会包含一个缓存,来降低对数据库的访问.我们要理解这个,有助于我们写一个搞笑的orm的代码.
    在一个刚创建的一个结果集.(什么是刚创建的?)假如我们执行一个orm代码使用filter()获得了的记录会存到QuerySets这个结果集里,紧接着我们要循环这些记录,这个时候我们就不需要去数据库中取了,而是循环结果集.
    使用QuerySets 就非常的高效的使你的数据库查询结果提高利用率了.

        >>> print([e.headline for e in Entry.objects.all()])
        >>> print([e.pub_date for e in Entry.objects.all()])

    上面的代码做了两次for循环,这两个for循环将会产生两次对数据库的查询.而不是查询一次存入QuerySets ,然后在对QuerySets进行循环.
    并且两次的循环结果很可能不一样,因为每一次查询的结果集可能不一样.
    要是用缓存和结果集,就要写成:

        >>> queryset = Entry.objects.all() #这段代码并未真正的将数据从数据库读到内存中,它只是读了一小部分,这个只有当大数据查询能看到.比如你有100W条数据进行select,你会发现,你执行后立刻就返回了.你在print(queryset),只会打印前几十条,后面省略了只显示前几十条和总共的数量.其实是没取,不是省略.
        # 在什么时候会去数据库中取呢?当你第一次真正去遍历它的时候,它才会去把数据从数据库中取出来.第二次就可以直接用了
        >>> print([p.headline for p in queryset]) # Evaluate the query set.
        >>> print([p.pub_date for p in queryset]) # Re-use the cache from the evaluation.


    什么情况下不会被缓存?
    下面例子的时候:

        >>> queryset = Entry.objects.all()      前查出一部分
        >>> print queryset[5] # Queries the database  只取一个值的时候
        >>> print queryset[5] # Queries the database again

        >>> queryset = Entry.objects.all()
        >>> [entry for entry in queryset] # Queries the database
        >>> print queryset[5] # Uses cache
        >>> print queryset[5] # Uses cache

Complex lookups with Q objects（复杂查询）
    我们在filter中实现sql原声语句中的and条件,如（接下来的语句都是在orm_test.py中书写的）:

1         Entry.objects.filter(n_comments__gt=F('n_pingbacks'),
2                             pub_date__lte='2006-01-01')

    那如果我们要实现原生语句中的OR关系条件,应该如何书写呢?就不能使用filter了,要使用Q了
    具体使用如下:

1         from django.db.models import Q
2         Q(question__startswith='What')

    你可以使用"|"."|"表示or关系,","表示and的关系

1         Q(question__startswith='Who') | Q(question__startswith='What')
2     ＃上面的语句的意思就是:
3     ＃  WHERE question LIKE 'Who%' OR question LIKE 'What%'

    还可以使用~,表示非

1         Q(question__startswith='Who') | ~Q(pub_date__year=2005)

   orm代码中的写法举例:

1         Poll.objects.get(
2             Q(question__startswith='Who'),
3             Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6))
4         )
5     ＃这句就如同:
6     ＃    SELECT * from polls WHERE question LIKE 'Who%'
7     ＃        AND (pub_date = '2005-05-02' OR pub_date = '2005-05-06')

  那我们想,在不使用Q的时候,我们直接些某一个字段=值,那这种普通的写法和Q()能在一起使用吗?可以,不过要保证Q()的方式在前面,而普通方式在后面的顺序.
    如:

1         Poll.objects.get(
2             Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)),
3             question__startswith='Who')
4     下面这种写法就错了:
5     # INVALID QUERY
6         Poll.objects.get(
7             question__startswith='Who',
8             Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)))

更新　
    Updating multiple objects at once
        # Update all the headlines with pub_date in 2007.

1         Entry.objects.filter(pub_date__year=2007).update(headline='Everything is the same')

    在原有数据的基础上批量自增

1         >>> Entry.objects.all().update(n_pingbacks=F('n_pingbacks') + 1)

    注释:批量更新有一个要注意的点,就是只能对本表内的字段进行自增,不能对外键和manytomany进行自增
    另外付值时也不能用外键或者manytomany

1        # THIS WILL RAISE A FieldError
2         >>> Entry.objects.update(headline=F('blog__name'))


反向关联查询:
我们知道整个Blog系统有如下几张表,

 1     class Publisher(models.Model):
 2         name = models.CharField(max_length=30,unique=True)   # CharField后必须有(max_length=?)
 3         address = models.CharField(max_length=50)
 4         city = models.CharField(max_length=60)
 5         state_province = models.CharField(max_length=30)
 6         country = models.CharField(max_length=50)
 7         website = models.URLField()
 8         def __str__(self):
 9             return "<%s>"%(self.name)
10 
11     class Author(models.Model):
12         first_name = models.CharField(max_length=30)
13         last_name = models.CharField(max_length=40)
14         email = models.EmailField()
15         def __str__(self):
16             return "<%s %s>"%(self.first_name,self.last_name)
17 
18     class Book(models.Model):
19         title = models.CharField(max_length=100)
20         authors = models.ManyToManyField(Author)
21         publisher = models.ForeignKey(Publisher)
22         publication_date = models.DateField()

其中Book表中publisher字段外键关联Publisher表类.所以我们可以在查询Book表publisher字段获得Publisher实例.
那么在Django的ORM中能不能在被外键关联的表中获取,一个Publisher实例被几个Book记录关联.答案是能!!

1     from app01 import models as book_models
2     pub_obj = book_models.Publisher.objects.last()
3     print(pub_obj.name,pub_obj.book_set.select_related())  打印所有关联pub_obj对象的book实例，结果是关联对象实例列表

    book_set是什么?我们在Publisher表里没有定义吧,而是自己生成的.只要你有反向关联,它就会自动的生成 返向关联表名_set,我们models文件中定义的是Book,但是在数据库中生成的却是app01_book,所以这里生成的是book_set,而不是Book_set.

 ＃而select_related() 就是把所有的跟我这个publisher实例关联的记录查出来的方法.

book_set是一个被关来类的实例的方法。而在外键类的反向查询中用的是:

     Blog.objects.filter(entry__headline__contains='Lennon')  反过来找,这里是通过类来找被关联对象为headline like 'lennon'的blog实例。结果是被关联对象列表

总结：这两个都是具有反向查找的功能，
当为某一个具体的实例查找时：pub_obj.book_set.select_related()
当从类的角度反向查找时：Blog.objects.filter(entry__headline__contains='Lennon')

如果我们想查每一个publisher实例,被关联多少次

1     pub_objs = book_models.Publisher.objects.annotate(book_nums=Count('book'))
2     for publisher in pub_ojbs: #分类聚合
3         print(publisher.book_nums)

    上面的写法实际上是分类的聚合.我们会问.annotate()是什么意思?

Aggregation（聚合）
聚合是什么意思?比如说我想查出来我们班级里所有人的平均成绩.
    from django.db.models import Avg,Sum,Min,Max
    print(models.Entry.objects.all().aggregate(Avg('n_pingbacks'),Sum('n_pingbacks'),
                                                Min('n_pingbacks')
                                                ))