java web项目通常采用的技术概述

序：

　　网站的架构一般来说，分为前端和后端。前端负责页面的展示，后端则是业务逻辑的实现。由于HTML5的兴起，前端领域发展极快，在经典的java web的开发模式中，我们使用JSP技术作为展现层的实现，其实就是前端。除了JSP，还要懂得HTML，CSS，JS,AJAX等前端的基础知识。JSP在其中扮演外层包装的角色。后端是由一些实现了业务逻辑的java代码和数据库组成，说到这，就可以推出web开发中经典的MVC模式：model-view-controller。view就是表现层，model是用来承载数据的抽象结构，而controller则是view和model的桥梁。view存在于前端代码中，controller和model存在于后端代码中，

　　在后端代码中，为了保证代码的整洁，易读性，一般会采用分层。自顶向下分别为controller层，service层，dao层，数据层或者叫持久层（直接与数据库打交道）。有时候为了达到解耦的目的，会在上述基层中间加入响应的接口层，。在更加大型的网站，会在dao层和数据层之间出现缓存层。或者访问压力增大后，需使用集群，负载均衡等高级技术。

　　综上，一个web项目前端需要表现层，后端有controller层，service层，dao层，持久层。在表现层，除了提到的HTML，css,js,jsp,ajax等基础知识，还会用到许多框架，比如tiles，velocity，freemaker等模板。在持久层，除了jdbc，还有mybatis,hibernate等框架。在java web中最耀眼的当属spring，spring作为一个贯穿始终的框架，为项目开发带来依赖注入，面向切面编程等功能，除了这些还要掌握一种关系型数据库，如MySQL Oracle等，能掌握非关系型数据库更好如Redis mongodb等。

　　掌握了上述知识点，恭喜你，你已经可以开始写java web项目了。但是只会写而不会部署，我们的项目仍然不能拿出来用。需要一个容器来运行我们的代码。这里所说的容器不是java里的数据类型，而是指应用服务器，此处要区分应用服务器和web服务器。目前比较流行的应用服务器有Tomcat等，常用的web服务器有Nginx，Apache等。

java web技能树：

大后台：

web后台属于后台，但后台的范围非常广泛。两者是包含关系，从网络协议的角度来看，web后台更多关注的是http，而C++后台关注的是tcp协议。

web后台可以看作是一个大后台最靠前的东西，它解析了HTTP请求，然后可能层层转发给了后面整个分布式系统的许多组件，然后调用他们的服务。公司内部服务器主机之间绝大部分是通过TCP来通信额。具体来说C++后台关注的是socket，也就是网络编程，还有并发的知识（当然了C++也可以做web后台的：CGI 逃）。因为大公司的server一般都是Linux，所以应聘C++后台，一定要会Linux，这里的会Linux操作大致分为两类：一类是Linux基本操作，包括常用Linux命令和工具的使用、shell脚本的编写，能通过脚本完成一些日常任务。另一类才是重点——Linux环境编程，你需要对Linux/Unix环境下各种环境编程的API要熟悉（POSIX那些函数，当然ANSI标准库的函数也要熟）。经常考察的就是IO、各类IPC的操作方式、socket通信的流程、select/poll/epoll 等IO多路复用模型。socket和IO多路复用是网络编程的重点。题主还问操作系统一般问什么，这些东西就是一般和操作系统杂糅到一起的，学习Linux环境编程绝对不仅仅是记忆几个函数接口那么简单，因为大多数是系统调用，参与内核操作的，所以需要了解其中的原理，而其中的原理就是操作系统的概念了，比如上面我说的IPC，就可以扯出fork函数，进而面试官就可以问题进程的其他东西，然后和线程做过比较之类的，线程又可以牵扯出同步、互斥锁等概念，怎么样是不是想起操作系统课本了。还没完。其实面试制胜的关键并不是面试官会问你什么，而是你能主动给输出什么。面试不是做选择题，判断题。换句话说：要学会举一反三。比如他不问你Linux环境编程，他问了你一个malloc、new区别之类的东西，这个问题很好答，说完之后呢，你可以主动输出一些更深入的东西，通过它们的区别来深入谈论操作系统的内存管理，比如边界对齐，还有这块内存的首部或尾部包含其他信息等等。具体可以阅读CSAPP内存管理的章节，此外了解一下C++的placement new可以帮助你对malloc和new的区别有更深的了解，从而更好的回答这类问题。C/C++语言的一大特点就是，语言不仅仅是语言，你总能和操作系统扯上一腿。另外无论是哪种后台，数据库是必然逃不开的。你肯定要对数据库有了解。不仅仅是SQL，还要懂一些优化，了解主键的原理（B树/B+树啊）。MySQL的话，了解一下引擎的知识吧。数据结构、算法等内容也是必考，不过那不只针对C++后台开发，这里就不过多介绍了。如果你想知道C++怎么写web后台的话，那么了解一下CGI。HTTP协议的内容也是知道比不知道要好。起码知道个get/post，cookie/session之类的。。

参考书籍：《C++ primer》，《effective C++》，《STL源码解析》，《深度搜索C++对象模型》

extern关键字作用
static关键字作用
volatile是干啥的
说说const的作用，越多越好
new与malloc区别
C++多态性与虚函数表

C++多态的实现？
虚函数的作用？
虚函数用于实现多态，这点大家都能答上来但是虚函数在设计上还具有封装和抽象的作用。比如抽象工厂模式。
动态绑定是如何实现的？
静态多态和动态多态。静态多态是指通过模板技术或者函数重载技术实现的多态，其在编译器确定行为。动态多态是指通过虚函数技术实现在运行期动态绑定的技术。
虚函数表
虚函数表是针对类的还是针对对象的？同一个类的两个对象的虚函数表是怎么维护的？
编译器为每一个类维护一个虚函数表，每个对象的首地址保存着该虚函数表的指针，同一个类的不同对象实际上指向同一张虚函数表。

纯虚函数如何定义，为什么对于存在虚函数的类中析构函数要定义成虚函数
析构函数能抛出异常吗
构造函数和析构函数中调用虚函数吗？
指针和引用的区别
指针与数组千丝万缕的联系
智能指针是怎么实现的？什么时候改变引用计数？

构造函数中计数初始化为1；
拷贝构造函数中计数值加1；
赋值运算符中，左边的对象引用计数减一，右边的对象引用计数加一；
析构函数中引用计数减一；
在赋值运算符和析构函数中，如果减一后为0，则调用delete释放对象。
share_prt与weak_ptr的区别？

C++四种类型转换：static_cast, dynamic_cast, const_cast, reinterpret_cast
内存对齐的原则
内联函数有什么优点？内联函数与宏定义的区别？
C++内存管理
STL里的内存池实现
STL里set和map是基于什么实现的。红黑树的特点？
STL里的其他数据结构和算法实现也要清楚
这个问题，把STL源码剖析好好看看，不仅面试不慌，自己对STL的使用也会上升一个层次。
必须在构造函数初始化式里进行初始化的数据成员有哪些
模板特化
定位内存泄露
(1)在windows平台下通过CRT中的库函数进行检测；
(2)在可能泄漏的调用前后生成块的快照，比较前后的状态，定位泄漏的位置
(3)Linux下通过工具valgrind检测
手写strcpy，memcpy，strcat，strcmp等函数

数据结构与算法

这一块考察范围太广，主要靠多刷题吧，牛客网，剑指OFFER，LeetCode等。

Hash表

Hash表实现（拉链和分散地址）
Hash策略常见的有哪些？
STL中hash_map扩容发生什么？
(1) 创建一个新桶，该桶是原来桶两倍大最接近的质数(判断n是不是质数的方法：用n除2到sqrt(n)范围内的数) ；
(2) 将原来桶里的数通过指针的转换，插入到新桶中(注意STL这里做的很精细，没有直接将数据从旧桶遍历拷贝数据插入到新桶，而是通过指针转换)
(3) 通过swap函数将新桶和旧桶交换，销毁新桶。

树

二叉树结构，二叉查找树实现；
二叉树的六种遍历；
二叉树的按层遍历；
递归是解决二叉树相关问题的神级方法；
树的各种常见算法题(http://blog.csdn.net/xiajun07061225/article/details/12760493)；
什么是红黑树？
红黑树与AVL树的区别
Trie树(字典树)

链表

链表和插入和删除，单向和双向链表都要会
链表的问题考虑多个指针和递归
(1) 反向打印链表(递归)
(2) 打印倒数第K个节点(前后指针)
(3) 链表是否有环(快慢指针)等等。

栈和队列

队列和栈的区别？(从实现，应用，自身特点多个方面来阐述，不要只说一个先入先出，先入后出，这个你会别人也会，要展现出你比别人掌握的更深)
典型的应用场景

海量数据问题

十亿整数（随机生成，可重复）中前K最大的数
十亿整数（随机生成，可重复）中出现频率最高的一千个

排序算法

排序算法当然是基础内容了，必须至少能快速写出，快排，建堆，和归并
每种算法的时间空间复杂度，最好最差平均情况

位运算

布隆过滤器

几十亿个数经常要查找某一个数在不在里面，使用布隆过滤器，布隆过滤器的原理。布隆过滤器可能出现误判，怎么保证无误差？

网络与TCP/IP

参考书籍：《图解TCP/IP》，《TCP/IP详解卷一》，《图解HTTP》，《HTTP权威指南》

TCP与UDP之间的区别
(1) IP首部，TCP首部，UDP首部
(2) TCP和UDP区别
(3) TCP和UDP应用场景
(4) 如何实现可靠的UDP
TCP三次握手与四次挥手
详细说明TCP状态迁移过程
(1) 三次握手和四次挥手状态变化；
(2) 2MSL是什么状态？作用是什么？
(3)三次握手为什么不是两次或者四次？
TCP相关技术

TCP重发机制，Nagle算法
TCP的拥塞控制使用的算法和具体过程
TCP的窗口滑动

HTTP

http/https 1.0、1.1、2.0的特点和区别
get/post 区别
HTTP返回状态码
http 协议头相关

http数据由请求行，首部字段，空行，报文主体四个部分组成
首部字段分为：通用首部字段，请求首部字段，响应首部字段，实体首部字段

https与http的区别？如何实现加密传输？加解密方式？
浏览器中输入一个URL发生什么，用到哪些协议？

安全相关

至少了解攻击的原理和基本的防御方法，常见的攻击方法有一下几种

SQL注入
XSS
CSRF
SYN洪水攻击
APR欺骗

数据库

主要参考书籍：《数据库系统概念》，《高性能MySQL》

SQL语言(内外连接，子查询，分组，聚集，嵌套，逻辑)
MySQL索引方法？索引的优化？
InnoDB与MyISAM区别？
事务的ACID
事务的四个隔离级别
查询优化(从索引上优化，从SQL语言上优化)
B-与B+树区别？
MySQL的联合索引(又称多列索引)是什么？生效的条件？
分库分表

Linux

主要参考书籍：《现代操作系统》，《APUE》，《UNP》，《LINUX内核设计与实现》，《深入理解LINUX内核》

进程与线程

(1) 进程与线程区别？
(2) 线程比进程具有哪些优势？
(3) 什么时候用多进程？什么时候用多线程？
(4) LINUX中进程和线程使用的几个函数？
(5) 线程同步？
在Windows下线程同步的方式有：互斥量，信号量，事件，关键代码段
在Linux下线程同步的方式有：互斥锁，自旋锁，读写锁，屏障(并发完成同一项任务时，屏障的作用特别好使) 知道这些锁之间的区别，使用场景？

进程间通讯方式

匿名管道与命名管道的区别：匿名管道只能在具有公共祖先的两个进程间使用。
共享文件映射mmap
mmap建立进程空间到文件的映射，在建立的时候并不直接将文件拷贝到物理内存，同样采用缺页终端。mmap映射一个具体的文件可以实现任意进程间共享内存，映射一个匿名文件，可以实现父子进程间共享内存。
常见的信号有哪些？：SIGINT，SIGKILL(不能被捕获)，SIGTERM(可以被捕获)，SIGSEGV，SIGCHLD，SIGALRM

内存管理

虚拟内存的作用？
虚拟内存的实现？
操作系统层面对内存的管理？
内存池的作用？STL里内存池如何实现？
进程空间和内核空间对内存的管理不同？
Linux的slab层，VAM？
伙伴算法
高端内存

进程调度

Linux进程分为两种，实时进程和非实时进程；
优先级分为静态优先级和动态优先级，优先级的范围；
调度策略
交互进程通过平均睡眠时间而被奖励；

死锁

(1) 死锁产生的条件；
(2) 死锁的避免；

命令行

Linux命令在一个文件中，倒序打印第二行前100个大写字母

cat filename | head -n 2 | tail -n 1 | grep '[[:upper:]]' -o | tr -d '
'| cut -c 1-100 | rev

与CPU，内存，磁盘相关的命令(top，free, df, fdisk)
网络相关的命令netstat，tcpdump等
sed, awk, grep三个超强大的命名，分别用与格式化修改，统计，和正则查找
ipcs和ipcrm命令
查找当前目录以及字母下以.c结尾的文件，且文件中包含”hello world”的文件的路径
创建定时任务

IO模型

五种IO模型：阻塞IO，非阻塞IO，IO复用，信号驱动式IO，异步IO
select，poll，epoll的区别

线程池，内存池自己动手实现一遍

Linux的API

fork与vfork区别
fork和vfork都用于创建子进程。但是vfork创建子进程后，父进程阻塞，直到子进程调用exit()或者excle()。
对于内核中过程fork通过调用clone函数，然后clone函数调用do_fork()。do_fork()中调用copy_process()函数先复制task_struct结构体，然后复制其他关于内存，文件，寄存器等信息。fork采用写时拷贝技术，因此子进程和父进程的页表指向相同的页框。但是vfork不需要拷贝页表，因为父进程会一直阻塞，直接使用父进程页表。
exit()与_exit()区别
exit()清理后进入内核，_exit()直接陷入内核。
孤儿进程与僵死进程

孤儿进程是怎么产生的？
僵死进程是怎么产生的？
僵死进程的危害？
如何避免僵死进程的产生？

Linux是如何避免内存碎片的

伙伴算法，用于管理物理内存，避免内存碎片;
高速缓存Slab层用于管理内核分配内存，避免碎片。

共享内存的实现原理？
系统调用与库函数(open, close, create, lseek, write, read)
同步方法有哪些？

互斥锁，自旋锁，信号量，读写锁，屏障
互斥锁与自旋锁的区别：互斥锁得不到资源的时候阻塞，不占用cpu资源。自旋锁得不到资源的时候，不停的查询，而然占用cpu资源。
死锁

其他

++i是否是原子操作
明显不是，++i主要有三个步骤，把数据从内存放在寄存器上，在寄存器上进行自增，把数据从寄存器拷贝会内存，每个步骤都可能被中断。
判断大小端

设计模式

单例模式线程安全的写法
STL里的迭代器模式，适配器模式

分布式系统

map_reduce原理（这篇文章讲的很通俗易懂）
负载均衡
CDN

code everywhere everytime!