2020系统综合实践第4次实践作业

(1)使用Docker-compose实现Tomcat+Nginx负载均衡

理解nginx反向代理原理

反向代理（Reverse Proxy）方式是指以代理服务器来接受Internet上的连接请求，然后将请求转发给内部网络上的服务器；并将从服务器上得到的结果返回给Internet上请求连接的客户端，此时代理服务器对外就表现为一个服务器。

nginx代理tomcat集群，代理2个以上tomcat；

项目结构：

default.conf:

upstream tomcats {
    server tomcat01:8080;
    server tomcat02:8080; 
    server tomcat03:8080; 
}

server {
    listen 8079;
    server_name localhost;

    location / {
        proxy_pass http://tomcats; # 请求转向tomcats
    }
}

docker-compose.yml:

version: "3"
services:
    nginx:
        image: nginx
        container_name: "nginx-tomcat"
        ports:
            - 80:8079
        volumes:
            - ./nginx/default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
        depends_on:
            - tomcat01
            - tomcat02
            - tomcat03

    tomcat01:
        image: tomcat
        container_name: "tomcat01"
        volumes:
            - ./tomcat-1:/usr/local/tomcat/webapps/ROOT # 挂载web目录

    tomcat02:
        image: tomcat
        container_name: "tomcat02"
        volumes:
            - ./tomcat-2:/usr/local/tomcat/webapps/ROOT

    tomcat03:
        image: tomcat
        container_name: "tomcat03"
        volumes:
            - ./tomcat-3:/usr/local/tomcat/webapps/ROOT

三个html:

配置完毕后执行sudo docker-compose up -d:

查看容器sudo docker ps -a:

用firebox访问：

tomcat01:
tomcat02:
tomcat03:
了解nginx的负载均衡策略，并至少实现nginx的2种负载均衡策略；
轮询策略

创建文件webtest.py，编写爬虫程序：

import requests

url="http://127.0.0.1"
count={}
for i in range(0,2000):
	response=requests.get(url)
	if response.text in count:
	        count[response.text]+=1;
	else:
	        count[response.text]=1
for a in count:
	print(a, count[a])

运行爬虫程序：

python3 webtest.py

权重策略

修改default.conf：

upstream tomcats {
    server tomcat01:8080 weight=1;
    server tomcat02:8080 weight=2;
    server tomcat03:8080 weight=3;
}

server {
    listen 8079;
    server_name localhost;

    location / {
        proxy_pass http://tomcats; # 请求转向tomcats
    }
}

重启容器：

sudo docker restart nginx-tomcat

再次运行爬虫程序：

python3 webtest.py

(2)使用Docker-compose部署javaweb运行环境

这里的webapps用老师给的例子

分别构建tomcat、数据库等镜像服务；

文件结构：

Dockerfile:

#  这个是构建MySQL的dockerfile
FROM registry.saas.hand-china.com/tools/mysql:5.7.17
# mysql的工作位置
ENV WORK_PATH /usr/local/
# 定义会被容器自动执行的目录
ENV AUTO_RUN_DIR /docker-entrypoint-initdb.d
#复制gropshop.sql到/usr/local 
COPY grogshop.sql  /usr/local/
#把要执行的shell文件放到/docker-entrypoint-initdb.d/目录下，容器会自动执行这个shell
COPY docker-entrypoint.sh  $AUTO_RUN_DIR/
#给执行文件增加可执行权限
RUN chmod a+x $AUTO_RUN_DIR/docker-entrypoint.sh

docker-entrypoint.sh:

#!/bin/bash
mysql -uroot -p123456 << EOF
source /usr/local/grogshop.sql;

docker-compose.yml:

version: "3"   #版本
services:     #服务节点
  tomcat00:     #tomcat 服务
    image: tomcat    #镜像
    hostname: hostname       #容器的主机名
    container_name: tomcat00   #容器名
    ports:      #端口
     - "5050:8080"
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.15
  tomcat04:     #tomcat 服务
    image: tomcat    #镜像
    hostname: hostname       #容器的主机名
    container_name: tomcat04   #容器名
    ports:      #端口
     - "5055:8080"
    volumes:  #数据卷
     - "./webapps:/usr/local/tomcat/webapps"
     - ./wait-for-it.sh:/wait-for-it.sh
    networks:   #网络设置静态IP
      webnet:
        ipv4_address: 15.22.0.16
  mymysql:  #mymysql服务
    build: .   #通过MySQL的Dockerfile文件构建MySQL
    image: lzsmysql
    container_name: lzs_mysql
    ports:
      - "3307:3306" 
#红色的外部访问端口不修改的情况下，要把Linux的MySQL服务停掉
#service mysql stop
#反之，将3306换成其它的
    command: [
            '--character-set-server=utf8mb4',
            '--collation-server=utf8mb4_unicode_ci'
    ]
    environment:
      MYSQL_ROOT_PASSWORD: "123456"
    networks:
      webnet:
        ipv4_address: 15.22.0.6
  nginx:
      image: nginx
      container_name: lzs_nginx-tomcat
      ports:
          - 8080:8080
      volumes:
          - ./default.conf:/etc/nginx/conf.d/default.conf # 挂载配置文件
      tty: true
      stdin_open: true
      depends_on:
          - tomcat00
          - tomcat04
      networks:
       webnet:
        ipv4_address: 15.22.0.7
networks:   #网络设置
 webnet:
   driver: bridge  #网桥模式
   ipam:
     config:
      - 
       subnet: 15.22.0.0/24   #子网

default.conf:

upstream tomcat {
    server tomcat00:8080;
    server tomcat04:8080;
}

server {
    listen 8080;
    server_name localhost;

    location / {
        proxy_pass http://tomcat;
    }
}

修改连接数据库的IP地址：

构建镜像查看容器：

sudo docker-compose up -d
sudo docker ps -a

访问前端页面：
http://127.0.0.1:8080/ssmgrogshop_war 或 http://主机ip地址:8080/ssmgrogshop_war

成功部署Javaweb程序，包含简单的数据库操作；
查询:
插入:

修改:

删除:

为上述环境添加nginx反向代理服务，实现负载均衡。

测试代理服务：

从5050端口访问：
从5055端口访问：

(3)使用Docker搭建大数据集群环境

直接用机器搭建Hadoop集群，会因为不同机器配置等的差异，遇到各种各样的问题；也可以尝试用多个虚拟机搭建，但是这样对计算机的性能要求比较高，通常无法负载足够的节点数；使用Docker搭建Hadoop集群，将Hadoop集群运行在Docker容器中，使Hadoop开发者能够快速便捷地在本机搭建多节点的Hadoop集群。
要求：

完成hadoop分布式集群环境配置，至少包含三个节点（一个master，两个slave）；
成功运行hadoop 自带的测试实例。

一、搭建hadoop环境

1.拉取ubuntu镜像：

2.在启动Ubuntu镜像前，需要先在个人文件下创建一个目录，用于向Docker内部的Ubuntu系统传输文件

3.然后运行ubuntu

sudo docker run -it -v /home/lzs_hadoop/build:/root/build --name ubuntu ubuntu

4.安装必要工具：

apt-get update
apt-get install vim # 用于修改配置文件
apt-get install ssh # 分布式hadoop通过ssh连接

5.把启动sshd服务命令写进~/.bashrc文件：

vim ~/.bashrc

在该文件中最后一行添加如下内容：

/etc/init.d/ssh start

6.启动sshd服务：

7.配置ssh无密码连接本地sshd服务：

ssh-keygen -t rsa
cat id_dsa.pub >> authorized_keys

8.安装JDK：

apt-get install default-jdk

打开~/.bashrc文件，写入以下内容：

export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64/
export PATH=$PATH:$JAVA_HOME/bin

然后输入以下指令使之生效

source ~/.bashrc

检验安装：

java -version

9.登录dockerhub账号，然后保存当前镜像为ubuntu/jdkinstalled，表示jdk安装成功的ubuntu版本，命令如下:

docker commit 容器ID ubuntu/jdkinstalled

10.安装hadoop：
运行新的镜像

sudo docker run -it -v /home/lzs_hadoop/build:/root/build --name ubuntu-jdkinstalled ubuntu/jdkinstalled

把下载到共享文件夹的hadoop-3.1.3.tar.gz移动到到个人创建的build目录下：

cd /root/build
tar -zxvf hadoop-3.1.3.tar.gz -C /usr/local

检验安装：

cd /usr/local/hadoop-3.1.3
./bin/hadoop version

二、配置hadoop集群

1.进入配置目录修改相应文件

vim hadoop-env.sh
vim core-site.xml
vim hdfs-site.xml
vim mapred-site.xml
vim yarn-site.xml

1.hadoop-env.sh:

在任意位置添加

export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64/

2.core-site.xml:

<configuration>
      <property>
          <name>hadoop.tmp.dir</name>
          <value>file:/usr/local/hadoop/tmp</value>
          <description>Abase for other temporary directories.</description>
      </property>
      <property>
          <name>fs.defaultFS</name>
          <value>hdfs://master:9000</value>
      </property>
</configuration>

3.hdfs-site.xml:

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/namenode_dir</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/datanode_dir</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
</configuration>

4.mapred-site.xml(复制mapred-site.xml.template,再修改文件名):

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3</value>
    </property>
    <property>
        <name>mapreduce.map.env</name>
        <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3</value>
    </property>
    <property>
        <name>mapreduce.reduce.env</name>
        <value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3</value>
    </property>
</configuration>

5.yarn-site.xml:

<configuration>
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>
               <name>yarn.resourcemanager.hostname</name>
               <value>master</value>
        </property>
        <!--虚拟内存和物理内存比，不加这个模块程序可能跑不起来-->
        <property>
               <name>yarn.nodemanager.vmem-pmem-ratio</name>
               <value>2.5</value>
        </property>
</configuration>

2.添加参数
进入目录/usr/local/hadoop-3.1.3/sbin

对于start-dfs.sh和stop-dfs.sh文件，添加下列参数

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

对于start-yarn.sh和stop-yarn.sh，添加下列参数

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

3.构建镜像

sudo docker commit 容器ID ubuntu/hadoopinstalled

4.利用构建好的镜像运行主机
开启三个终端运行ubuntu/hadoopinstalled镜像，分别表示Hadoop集群中的master,slave01和slave02；

# 第一个终端
sudo docker run -it -h master --name master ubuntu/hadoopinstalled
# 第二个终端
sudo docker run -it -h slave01 --name slave01 ubuntu/hadoopinstalled
# 第三个终端
sudo docker run -it -h slave02 --name slave02 ubuntu/hadoopinstalled

5.分别查看三个主机的/etc/hosts

得到IP地址如下：

172.17.0.2    master
172.17.0.3    slave01
172.17.0.4    slave02

6.三个终端分别vim /etc/hosts打开/etc/hosts,根据各自ip修改为如下形式

172.17.0.2      master
172.17.0.3      slave01
172.17.0.4      slave02

用如下命令来检测下是否master是否可以连上slave01和slave02

ssh slave01
ssh slave02
exit

7.修改master上workers文件

vim /usr/local/hadoop-3.1.3/etc/hadoop/workers

将localhost替换成两个slave的主机名

slave01
slave02

三、测试Hadoop集群

1.jps查看服务是否开启成功

#在master上操作
cd /usr/local/hadoop-3.1.3
bin/hdfs namenode -format      #首次启动Hadoop需要格式化
sbin/start-all.sh              #启动所有服务
jps                            #分别查看三个终端

四、运行自带的测试实例

准备测试样例的输入文件

bin/hdfs dfs -mkdir -p /user/hadoop/input
bin/hdfs dfs -put ./etc/hadoop/*.xml /user/hadoop/input
bin/hdfs dfs -ls /user/hadoop/input

测试样例并输出结果

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar grep /user/hadoop/input output 'dfs[a-z.]+'    
bin/hdfs dfs -cat output/*

(4)实验报告

记录实验过程的主要问题和解决方法，分享经验和感想；

1.web服务配置好后访问网页失败
注意端口号和工作目录是否正确，然后重启容器
2.实验三无法做出正确结果
注意所有操作都是在容器中进行，以此来构建镜像

记录完成作业所花的时间

1、使用Docker-compose实现Tomcat+Nginx负载均衡：大约3.5h
2、使用Docker-compose部署javaweb运行环境：大约2h
3、使用Docker搭建大数据集群环境：大约6.5h
总计约12h

感想

这次作业量极大，但也让我学到不少新东西