知识点

https://www.cnblogs.com/hiit/p/11192384.html

1 . apache 与 nginx

Nginx

轻量级，采用 C 进行编写，同样的 web 服务，会占用更少的内存及资源
抗并发，nginx 以 epoll and kqueue 作为开发模型，处理请求是异步非阻塞的，负载能力比 apache 高很多，而 apache 则是阻塞型的。在高并发下 nginx 能保持低资源低消耗高性能，而 apache 在 PHP 处理慢或者前端压力很大的情况下，很容易出现进程数飙升，从而拒绝服务的现象。
nginx 处理静态文件好，静态处理性能比 apache 高三倍以上
nginx 的设计高度模块化，编写模块相对简单
nginx 配置简洁，正则配置让很多事情变得简单，而且改完配置能使用 -t 测试配置有没有问题，apache 配置复杂，重启的时候发现配置出错了，会很崩溃
nginx 作为负载均衡服务器，支持 7 层负载均衡
nginx 本身就是一个反向代理服务器，而且可以作为非常优秀的邮件代理服务器
启动特别容易, 并且几乎可以做到 7*24 不间断运行，即使运行数个月也不需要重新启动，还能够不间断服务的情况下进行软件版本的升级
社区活跃，各种高性能模块出品迅速

Apache

apache 的 rewrite 比 nginx 强大，在 rewrite 频繁的情况下，用 apache
apache 发展到现在，模块超多，基本想到的都可以找到
apache 更为成熟，少 bug ，nginx 的 bug 相对较多
apache 超稳定
apache 对 PHP 支持比较简单，nginx 需要配合其他后端用
apache 在处理动态请求有优势，nginx 在这方面是鸡肋，一般动态请求要 apache 去做，nginx 适合静态和反向。
apache 仍然是目前的主流，拥有丰富的特性，成熟的技术和开发社区

总结

两者最核心的区别在于 apache 是同步多进程模型，一个连接对应一个进程，而 nginx 是异步的，多个连接（万级别）可以对应一个进程

一般来说，需要性能的 web 服务，用 nginx 。如果不需要性能只求稳定，更考虑 apache ，后者的各种功能模块实现得比前者，例如 ssl 的模块就比前者好，可配置项多。epoll(freebsd 上是 kqueue ) 网络 IO 模型是 nginx 处理性能高的根本理由，但并不是所有的情况下都是 epoll 大获全胜的，如果本身提供静态服务的就只有寥寥几个文件，apache 的 select 模型或许比 epoll 更高性能。当然，这只是根据网络 IO 模型的原理作的一个假设，真正的应用还是需要实测了再说的。

更为通用的方案是，前端 nginx 抗并发，后端 apache 集群，配合起来会更好。

2 . redis 特点及使用场景缓存穿透缓存雪崩及对应解决方案

关于redis，更多

缓存穿透

一般的缓存系统，都是按照key去缓存查询，如果不存在对应的value，就应该去后端系统查找（比如DB）。如果key对应的value是一定不存在的，并且对该key并发请求量很大，就会对后端系统造成很大的压力。这就叫做缓存穿透

a. 对查询结果为空的情况也进行缓存，缓存时间设置短一点，或者该key对应的数据insert了之后清理缓存

b. 对一定不存在的key进行过滤。可以把所有的可能存在的key放到一个大的Bitmap中，查询时通过该bitmap过滤

缓存雪崩

当缓存服务器重启或者大量缓存集中在某一个时间段失效，这样在失效的时候，也会给后端系统(比如DB)带来很大压力。

a. 在缓存失效后，通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存，其他线程等待

b. 不同的key，设置不同的过期时间，让缓存失效的时间点尽量均匀

c. 做二级缓存，A1为原始缓存，A2为拷贝缓存，A1失效时，可以访问A2，A1缓存失效时间设置为短期，A2设置为长期

缓存预热

缓存预热就是系统上线后，将相关的缓存数据直接加载到缓存系统。这样避免，用户请求的时候，再去加载相关的数据。

解决思路：

a. 直接写个缓存刷新页面，上线时手工操作下。

b. 数据量不大，可以在WEB系统启动的时候加载。

c. 定时刷新缓存，

缓存更新

缓存淘汰的策略有两种：

a. 定时去清理过期的缓存。

b. 当有用户请求过来时，再判断这个请求所用到的缓存是否过期，过期的话就去底层系统得到新数据并更新缓存。

两者各有优劣，第一种的缺点是维护大量缓存的key是比较麻烦的，第二种的缺点就是每次用户请求过来都要判断缓存失效，逻辑相对比较复杂，具体用哪种方案，大家可以根据自己的应用场景来权衡。1. 预估失效时间 2. 版本号（必须单调递增，时间戳是最好的选择）3. 提供手动清理缓存的接口。

3. mysql sql语句优化原则性能优化方案主从复制读写分离分表分库

a. 尽量避免在列上进行运算，这样会导致索引失效。

b. 使用JOIN时，应该用小结果集驱动大结果集。同时把复杂的JOIN查询拆分成多个Query。因为JOIN多个表时，可能导致更多的锁定和堵塞

c. 注意LIKE模糊查询的使用，避免%%。

例如：

SELECT * FROM table WHERE name LIKE '%de%';

优化：

SELECT * FROM table WHERE name >= 'de' AND name < 'df';

d. 仅列出需要查询的字段，这对速度不会有明显的影响，主要考虑节省内存

e. 使用批量插入语句节省交互

f. LIMIT 的基数比较大时使用 BETWEEN

例如：

SELECT * FROM article ORDER BY id LIMIT 100000,10

优化：

SELECT * FROM article WHERE id BETWEEN 100000 AND 100010 ORDER BY id;

BETWEEN 限定比 LIMIT 快，所以在海量数据访问时，建议用 BETWEEN 或是 WHERE 替换掉 LIMIT 。但是 BETWEEN 也有缺陷，如果 id 中间有断行或是部分 id 不读取的情况，总读取的数量会少于预计数量！在读取比较后面的数据时，通过 DESC 方式把数据反向查找，以减少对前端数据的扫描，让 LIMIT 的基数越少越好！

g. 不要使用 RAND 函数获取多条随机记录

例如：

SELECT * FROM table ORDER BY RAND() LIMIT 20;

使用下面的语句代替：

SELECT * FROM table AS t1
JOIN (
　　SELECT ROUND(RAND() * ((SELECT MAX(id) FROM table) - (SELECT MIN(id) FROM table)) + (SELECT MIN(id) FROM table)) AS id
) AS t2
WHERE t1.id >= t2.id ORDER BY t1.id LIMIT 1;

这是获取一条随机记录，这样即使执行 20 次，也比原来的语句高效。或者先用PHP产生随机数，把这个字符串传给MySQL，MySQL里用IN查询。

h. 避免使用NULL

i. 不要使用 COUNT(id) ，而应该是 COUNT(*)

j. 不要做无谓的排序操作，而应尽可能在索引中完成排序。

4. session 与 cookie

cookie数据存放在客户的浏览器上，session数据放在服务器上。

cookie不是很安全，别人可以分析存放在本地的cookie并进行cookie欺骗，考虑到安全应当使用session。

session会在一定时间内保存在服务器上。当访问增多，会比较占用你服务器的性能，考虑到减轻服务器性能方面，应当使用cookie。

单个cookie保存的数据不能超过4K，很多浏览器都限制一个站点最多保存20个cookie。

可以考虑将登陆信息等重要信息存放为session，其他信息如果需要保留，可以放在cookie中。

5. php新特性

php7新特性

6. php应用的完成请求过程

在浏览器中输入一个http地址，如：http://localhost/
——>浏览器会请求DNS服务器，获取到对应的IP地址
——>通过IP地址找对应的服务器（如：Apache服务器）
——>服务器接到请求，解析Url字符，得到URL中IP地址后的文件路径名
——>1.在服务器的web目录下查找是否有对应html、css、xml文件，如果有直接返回给浏览器，浏览器显示解析返回的数据并显示
——>2.如果请求的php方件，如http://localhost/info.php的话，因为Apache处理不了，会将这个转给PHP程序处理然后PHP将处理结果以html的形式返回给Apache，Apache再返回给浏览器。

所以，在安装Apache与PHP时，需要将Apache与PHP关联起来，当Apache遇到是请求php文件时，将其转给php程序处理

7. 魔术方法

__construct()构造方法

执行时机：在使用 new关键字使用类实例化一个对象时自动执行

功能作用：通常用于对对象的属性进行初始化

__destruct()析构方法

执行时机：在对象被销毁（unset或PHP执行结束）时自动执行

功能作用：通常用于释放对象占用的第三方资源（如：数据库）

__toString()转换字符串

执行时机：在对象被当成字符串使用时自动执行

功能作用：兼容对象的字符串调用形式，根据用户需求显示出对象的字符串形态

__invoke()函数调用方法

执行时机：在对象被当成函数使用时自动执行

功能作用：兼容对象的函数调用形式，允许用户像使用函数一样使用对象

__clone()克隆方法

执行时机：在克隆（clone）对象时自动执行

功能作用：在克隆对象时可以同时执行一些其它操作，甚至可以阻止对象被克隆

__call()

魔术方法__call()在调用不存在或不可访问的方法时会被调用。

它接收两个参数，一个是调用的方法的名字，一个是包含函数参数的数组。我们可以使用这种方法调用子对象中得同名函数

__callStatic()

魔术方法__callStatic()与__call()的功能一样，唯一不同的是，该方法在尝试访问一个不存在或不可访问的静态方法时会被调用

__set()

__set()魔术方法在我们尝试修改一个不可访问的属性时会被调用，它接收两个参数，一个表示属性的名字，一个表示属性的值

__isset()

__isset()魔术方法在对一个不可访问的属性调用isset()方法时会被调用，它接收一个参数，表示属性的名字。它应该返回一个布尔值，用来表示该属性是否存在

8. php生命周期

我们从未手动开启过PHP的相关进程，它是随着Apache的启动而运行的；

PHP通过mod_php5.so模块和Apache相连（具体说来是SAPI，即服务器应用程序编程接口）；

PHP总共有三个模块：内核、Zend引擎、以及扩展层；

PHP内核用来处理请求、文件流、错误处理等相关操作；

Zend引擎（ZE）用以将源文件转换成机器语言，然后在虚拟机上运行它；

扩展层是一组函数、类库和流，PHP使用它们来执行一些特定的操作。比如，我们需要mysql扩展来连接MySQL数据库；

当ZE执行程序时可能会需要连接若干扩展，这时ZE将控制权交给扩展，等处理完特定任务后再返还；

最后，ZE将程序运行结果返回给PHP内核，它再将结果传送给SAPI层，最终输出到浏览器上。

Apache启动，PHP解释程序也随之启动，PHP通过SAPI（服务器应用程序编程接口）和Apache相连。PHP的启动首先是PHP调用各个拓展MINT方法，使这些拓展切换到可用状态，也就是初始化一些环境变量，作用于整个SAPI生命周期。然后当一个页面请求发生时SAPI层将控制权交给PHP层，于是PHP设置了用于回复本次请求的环境变量，同时他还产生了一个变量表，用于存放执行过程中产生的变量名和值，PHP调用各个模块的RINT方法，RINIT方法可以看作是一个准备过程，在程序执行时就会自动启动。一旦页面执行完毕，PHP就会启动清理程序。它会按顺序调用各个模块的RSHUTDOWN方法，RSHUTDOWN用以清除程序运行时产生的符号表，也就是对每个变量调用unset函数，最后，所有的请求都已处理完毕，SAPI也准备关闭了，PHP调用每个扩展的MSHUTDOWN方法，这是各个模块最后一次释放内存的机会。

请求-->DNS服务器-->Apache-->SAPI-->PHP内核-->zend引擎-->PHP内核-->SAPI-->Apache-->浏览器

10. mvc

mvc分为了三个层次，而且三个层次各司其职，互不干扰，首先简单介绍下，各个层次，view即是视图，也就是web页面，control即是控制器向系统发出指令的工具，model 简单说是从数据库中取出数据进行处理。

Mvc的工作流程：第一步浏览者->调用控制器，对此发出指令

第二步控制器->按指令选取一个合适的模型

第三步模型->按照控制器指令选取相应的数据

第四步控制器->按指令选取相应的视图

第五步视图->把第三步取到的数据按用户想要的样子显示出来

11. 开发调试

PHP调试方式

12. linux 命令文本查看文本处理 head tail awk sed | crontab

head

head命令的作用就像它的名字一样，用于显示文件的开头部分文本。

head -n 100 file #显示file的前100行
head -n -100 file #显示file的除最后100行以外的内容。

tail

tail命令显示文件尾部的内容

tail -100 file  #显示file最后100行内容
tail -n +100 file  #从第100行开始显示file内容

用于实时文本更新内容。比如说，有一个日志文件正在写，并且实时在更新，就可以用命令：

tail -f note.log

awk

awk “样式” 文件：把符合样式的数据行显示出来。
awk { 操作 } 文件：对每一行都执行{}中的操作。
awk " 样式 { 操作 }" 文件：对符合样式的数据行，执行{}中的操作

# 每行按空格或TAB分割，输出文本中的1、4项
awk '{print $1,$4}' log.txt

sed

sed是一个很好的文件处理工具，本身是一个管道命令，主要是以行为单位进行处理，可以将数据行进行替换、删除、新增、选取等特定工作，下面先了解一下sed的用法
sed命令行格式为：

sed [-nefri] ‘command’ 输入文本

查看一定时间段的文件内容

sed -n '/2018-12-20T19:15:00+08:00/,/2018-12-20T19:15:28+08:00/p' 20.log

sed和awk

13. 阻塞非阻塞异步同步

同步：
所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回。也就是必须一件一件事做,等前一件做完了才能做下一件事。
例如普通B/S模式（同步）：提交请求->等待服务器处理->处理完毕返回这个期间客户端浏览器不能干任何事
异步：
异步的概念和同步相对。当一个异步过程调用发出后，调用者不能立刻得到结果。实际处理这个调用的部件在完成后，通过状态、通知和回调来通知调用者。
例如
ajax请求（异步）: 请求通过事件触发->服务器处理（这是浏览器仍然可以作其他事情）->处理完毕
阻塞
阻塞调用是指调用结果返回之前，当前线程会被挂起（线程进入非可执行状态，在这个状态下，cpu不会给线程分配时间片，即线程暂停运行）。函数只有在得到结果之后才会返回。
有人也许会把阻塞调用和同步调用等同起来，实际上他是不同的。对于同步调用来说，很多时候当前线程还是激活的，只是从逻辑上当前函数没有返回而已。例如，我们在socket中调用recv函数，如果缓冲区中没有数据，这个函数就会一直等待，直到有数据才返回。而此时，当前线程还会继续处理各种各样的消息。
非阻塞
非阻塞和阻塞的概念相对应，指在不能立刻得到结果之前，该函数不会阻塞当前线程，而会立刻返回。
对象的阻塞模式和阻塞函数调用
对象是否处于阻塞模式和函数是不是阻塞调用有很强的相关性，但是并不是一一对应的。阻塞对象上可以有非阻塞的调用方式，我们可以通过一定的API去轮询状态，在适当的时候调用阻塞函数，就可以避免阻塞。而对于非阻塞对象，调用特殊的函数也可以进入阻塞调用。函数select就是这样的一个例子。
1. 同步，就是我调用一个功能，该功能没有结束前，我死等结果。
2. 异步，就是我调用一个功能，不需要知道该功能结果，该功能有结果后通知我（回调通知）
3. 阻塞，就是调用我（函数），我（函数）没有接收完数据或者没有得到结果之前，我不会返回。
4. 非阻塞，就是调用我（函数），我（函数）立即返回，通过select通知调用者
同步IO和异步IO的区别就在于：数据拷贝的时候进程是否阻塞！
阻塞IO和非阻塞IO的区别就在于：应用程序的调用是否立即返回！
对于举个简单c/s 模式：
同步：提交请求->等待服务器处理->处理完毕返回这个期间客户端浏览器不能干任何事
异步：请求通过事件触发->服务器处理（这是浏览器仍然可以作其他事情）->处理完毕
同步和异步都只针对于本机SOCKET而言的。
同步和异步,阻塞和非阻塞,有些混用,其实它们完全不是一回事,而且它们修饰的对象也不相同。
阻塞和非阻塞是指当进程访问的数据如果尚未就绪,进程是否需要等待,简单说这相当于函数内部的实现区别,也就是未就绪时是直接返回还是等待就绪;
而同步和异步是指访问数据的机制,同步一般指主动请求并等待I/O操作完毕的方式,当数据就绪后在读写的时候必须阻塞(区别就绪与读写二个阶段,同步的读写必须阻塞),异步则指主动请求数据后便可以继续处理其它任务,随后等待I/O,操作完毕的通知,这可以使进程在数据读写时也不阻塞。(等待"通知")

进程线程

14. git 冲突解决

保留本地的修改的改法

1）直接commit本地的修改 ----也一般不用这种方法

2）通过git stash ---- 通常用这种方法

git stash
git pull
git stash pop

通过git stash将工作区恢复到上次提交的内容，同时备份本地所做的修改，之后就可以正常git pull了，git pull完成后，执行git stash pop将之前本地做的修改应用到当前工作区。

git stash: 备份当前的工作区的内容，从最近的一次提交中读取相关内容，让工作区保证和上次提交的内容一致。同时，将当前的工作区内容保存到Git栈中。

git stash pop: 从Git栈中读取最近一次保存的内容，恢复工作区的相关内容。由于可能存在多个Stash的内容，所以用栈来管理，pop会从最近的一个stash中读取内容并恢复。

git stash list: 显示Git栈内的所有备份，可以利用这个列表来决定从那个地方恢复。

git stash clear: 清空Git栈。此时使用gitg等图形化工具会发现，原来stash的哪些节点都消失了。

放弃本地修改的改法 ----这种方法会丢弃本地修改的代码，而且不可找回

git reset --hard

git pull 

15.swoole简介

swoole &&官方文档

16.xss csrf 说明与防御

WEB安全----XSS和CSRF

17. HTTP HTTPS TCP IP ‘三次握手四次挥手’

HTTP （Hyper Text Transfer Protocol）超文本传输协议，建立在TCP上的无状态连接，HTTP属于应用层协议，在传输层使用TCP协议，在网络层使用IP协议。IP协议主要解决网络路由和寻址问题，TCP协议主要解决如何在IP层之上可靠的传递数据包，使在网络上的另一端收到发端发出的所有包，并且顺序与发出顺序一致。TCP有可靠，面向连接的特点。

HTTP协议是无状态的，指的是协议对于事务处理没有记忆能力，服务器不知道客户端是什么状态。也就是说，打开一个服务器上的网页和你之前打开这个服务器上的网页之间没有任何联系。HTTP是一个无状态的面向连接的协议，无状态不代表HTTP不能保持TCP连接，更不能代表HTTP使用的是UDP协议（无连接）

HTTP（80）协议以明文方式发送内容，不提供任何方式的数据加密，如果攻击者截取了Web浏览器和网站服务器之间的传输报文，就可以直接读懂其中的信息，因此，HTTP协议不适合传输一些敏感信息，比如：信用卡号、密码等支付信息。为了解决HTTP协议的这一缺陷，需要使用另一种协议：安全套接字层超文本传输协议HTTPS（443），为了数据传输的安全，HTTPS在HTTP的基础上加入了SSL协议，SSL依靠证书来验证服务器的身份，并为浏览器和服务器之间的通信加密。

所谓三次握手（Three-Way Handshake）即建立TCP连接，是指建立一个TCP连接时，需要客户端和服务端总共发送3个包以确认连接的建立。在socket编程中，这一过程由客户端执行connect来触发，整个流程如下图所示：

（1）第一次握手：Client将标志位SYN置为1，随机产生一个值seq=J，并将该数据包发送给Server，Client进入SYN_SENT状态，等待Server确认。

（2）第二次握手：Server收到数据包后由标志位SYN=1知道Client请求建立连接，Server将标志位SYN和ACK都置为1，ack (number )=J+1，随机产生一个值seq=K，并将该数据包发送给Client以确认连接请求，Server进入SYN_RCVD状态。

（3）第三次握手：Client收到确认后，检查ack是否为J+1，ACK是否为1，如果正确则将标志位ACK置为1，ack=K+1，并将该数据包发送给Server，Server检查ack是否为K+1，ACK是否为1，如果正确则连接建立成功，Client和Server进入ESTABLISHED状态，完成三次握手，随后Client与Server之间可以开始传输数据了。

四次挥手（Four-Way Wavehand）即终止TCP连接，就是指断开一个TCP连接时，需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中，这一过程由客户端或服务端任一方执行close来触发，整个流程如下图所示：

由于TCP连接时全双工的，因此，每个方向都必须要单独进行关闭，这一原则是当一方完成数据发送任务后，发送一个FIN来终止这一方向的连接，收到一个FIN只是意味着这一方向上没有数据流动了，即不会再收到数据了，但是在这个TCP连接上仍然能够发送数据，直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭，而另一方则执行被动关闭，上图描述的即是如此。

（1）第一次挥手：Client发送一个FIN，用来关闭Client到Server的数据传送，Client进入FIN_WAIT_1状态。

（2）第二次挥手：Server收到FIN后，发送一个ACK给Client，确认序号为收到序号+1（与SYN相同，一个FIN占用一个序号），Server进入CLOSE_WAIT状态。

（3）第三次挥手：Server发送一个FIN，用来关闭Server到Client的数据传送，Server进入LAST_ACK状态。

（4）第四次挥手：Client收到FIN后，Client进入TIME_WAIT状态，接着发送一个ACK给Server，确认序号为收到序号+1，Server进入CLOSED状态，完成四次挥手。

上面是一方主动关闭，另一方被动关闭的情况，实际中还会出现同时发起主动关闭的情况，具体流程如下图：

HTTP更多

1. 查看nginx的PID，以常用的80端口为例：

netstat -anop | grep 0.0.0.0:80

2. 通过相应的进程ID(比如：4562）查询当前运行的nginx路径：

ll /proc/4562/exe

3. 获取到nginx的执行路径后，使用-t参数即可获取该进程对应的配置文件路径，如：

# /usr/local/nginx/sbin/nginx -t

nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok

nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful

知识点