方阵行列式并行化计算(OpenMP,MPI),并计算加速比

以下内容为本人并行计算课程的期末作业,有不足的地方,请多多指教!

实验目的

本实验的目的主要有以下三点:

1 实现方阵行列式的计算。

2 实现方阵行列式的并行计算,分别基于 OpenMP MPI

3 比较以上三种算法的运行时间,算加速比。

实验设计

2.生成方阵

为方便,本实验的方阵不采取手动输入的方式,而是使用随机数来生成矩阵元素。

定义了一个全局方阵变——int p[100][100]在创建方阵时,方阵的阶数N(N<100)外部输入。然后用两层for循环来给方阵 p左上角 N×N个位置赋值。具体实现如下

/*
 * 定义矩阵阶数N
 */

int N;

/*
 * 定义一个全局矩阵
 */

int p[100][100];

/*
 * 用随机数生成矩阵
 */

void create(){
	int i,j;
	for(i=0;i<N;i++)
	{
		for(j=0;j<N;j++)
	
	     {
           int a=rand()%15;//产生随机数,并赋给数组
	       p[i][j]=a;
		 }
	}
}


2.打印矩阵

将生成的矩阵输出,以便验算其计算行列式的正确性。具体实现如下:

/*
 * 输出矩阵
 */

void print()
{
	int i,j;
	for(i=0;i<N;i++)
    {
		for(j=0;j<N;j++)
			printf("%d ",p[i][j]);
		printf("
");
	}
}

2.计算矩阵行列式

计算矩阵行列式的方法有很多,本实验选择的方法是:行列式按行展开法。行列式等于它任一行的各元素与其对应的代数余子式乘积之和。代数余子式:A(ij)=-1)^(i+j)M(ij).  (ij)为下标。某个元素的余子式等于原行列式划去该元素所在的行和列。本实验采取按第一行展开的方法。即:将高阶的行列式按第一行展开,一直重复展开行为,直到阶数为 1。上述过程可用递归完成。

2.3.递归实现代码

根据上面的理论,我们容易得出如下的实现方法:

/*
 * 计算行列式的函数
 */

long long mydet(int  p [100][100],int n){
	if(n==1)  //n=1返回矩阵的唯一数,停止递归
		return p[0][0];
	else{
		long long sum=0;
		for(int i=0;i<n;i++)
		{
			    int pp[100][100];//用于存放少一维的矩阵,为方便直接定义为100×100.
			for(int j=1,j1=0;j<n;j++)//去掉第一行
			{
				for(int k=0,k1=0;k<n;k++)
				{
					if(k==i)
						;//去掉对应的列
					else
					{

				     pp[j1][k1]=p[j][k];//pp为余子式	
					 k1++;
					}
				}
			    j1++;
			}
			if(i%2)
                sum+=(-1)*p[0][i]*mydet(pp,n-1);
			else
				sum+=p[0][i]*mydet(pp,n-1);
		}
		return sum;
	}
}

2.4  实现串行OpenMPMPI计算

我这里的并行主要是放在第一次的按行展开那,具体实现看代码吧。

2.4.1  串行代码

/*************************************************************************
    > File Name: matrix_det.c
    > Author: surecheun
    > Mail: surecheun@163.com
    > Created Time: 2017年12月06日 星期三 17时28分00秒
 ************************************************************************/
#include<stdlib.h>
#include<stdio.h>
#include<math.h>
#include<time.h>
#include<time.h>
/*
 * 定义矩阵阶数N
 */

int N;

/*
 * 定义一个全局矩阵
 */

int p[100][100];

/*
 * 用随机数生成矩阵
 */

void create(){
	int i,j;
	for(i=0;i<N;i++)
	{
		for(j=0;j<N;j++)
	
	     {
           int a=rand()%15;//产生随机数,并赋给数组
	       p[i][j]=a;
		 }
	}
}
      
/*
 * 输出矩阵
 */

void print()
{
	int i,j;
	for(i=0;i<N;i++)
    {
		for(j=0;j<N;j++)
			printf("%d ",p[i][j]);
		printf("
");
	}
}

/*
 * 计算行列式的函数
 */

long long mydet(int  p [100][100],int n){
	if(n==1)  //n=1返回矩阵的唯一数,停止递归
		return p[0][0];
	else{
		long long sum=0;
		for(int i=0;i<n;i++)
		{
			    int pp[100][100];//用于存放少一维的矩阵,为方便直接定义为100×100.
			for(int j=1,j1=0;j<n;j++)//去掉第一行
			{
				for(int k=0,k1=0;k<n;k++)
				{
					if(k==i)
						;//去掉对应的列
					else
					{

				     pp[j1][k1]=p[j][k];//pp为余子式	
					 k1++;
					}
				}
			    j1++;
			}
			if(i%2)
                sum+=(-1)*p[0][i]*mydet(pp,n-1);
			else
				sum+=p[0][i]*mydet(pp,n-1);
		}
		return sum;
	}
}

int main(){
	printf("N= ");
	scanf("%d",&N);
    while(N){       //如果输入N就可以继续算下去,这个设计主要为了方便获取时间数据来计算平均用时
		create();
		print();
		clock_t start_t=clock();  //开始计时
		printf("the sum of 串行 is %lld .
",mydet(p,N));
	         clock_t  end_t=clock();  //结束计时
		double   runing_t =(double)(end_t-start_t)/CLOCKS_PER_SEC;
		printf("the runing time of 串行 is %f s.",runing_t);  //输出时间
		printf("
");
		printf("N= ");
		scanf("%d",&N);
	}
 
	return 0;
}

2.4.2 OpenMP代码

/*************************************************************************
    > File Name: matrix_det_omp.c
    > Author: surecheun
    > Mail: surecheun@163.com
    > Created Time: 2017年12月07日 星期四 17时23分51秒
 ************************************************************************/

#include<stdlib.h>
#include<stdio.h>
#include<math.h>
#include<vector>
#include<time.h>
#include<omp.h>

/*
 * 定义线程数
 */
#define n_threads 2

 /*
 *定义矩阵的阶数为全局变量
 */

int N;

/*
 * 定义一个全局矩阵
 */

int p[100][100];

/*
 * 用随机数生成矩阵
 */

void create(){
	int i,j;
	for(i=0;i<N;i++)
	{
		for(j=0;j<N;j++)
	
	     {
           int a=rand()%15;//产生随机数,并赋给数组
	       p[i][j]=a;
	     }
	}
}
      
/*
 * 输出矩阵
 */

void print()
{
	int i,j;
	for(i=0;i<N;i++)
    {
		for(j=0;j<N;j++)
			printf("%d ",p[i][j]);
		printf("
");
	}
}

/*
 * 计算行列式的函数
 */

long long mydet(int  p [100][100],int n){
	if(n==1)  //n=1返回矩阵的唯一数,停止递归
		return p[0][0];
	else{
		long long sum=0;
		for(int i=0;i<n;i++)
		{
		    int pp[100][100];
			for(int j=1,j1=0;j<n;j++)//去掉第一行
			{
				for(int k=0,k1=0;k<n;k++)
				{
					if(k==i)//去掉和改数相同的列
						;
					else
					{

				     pp[j1][k1]=p[j][k];	//pp为代数余子式
					 k1++;
					}
				}
			    j1++;
			}
			if(i%2)
                                          sum+=(-1)*p[0][i]*mydet(pp,n-1);
			else
				sum+=p[0][i]*mydet(pp,n-1);
		}
		return sum;
	}
}

 
int main(){
	printf("N= ");
	scanf("%d",&N);
    while(N){       //如果输入的N>0,则继续计算
		create();  //创建矩阵
		print();   //打印创建的矩阵
		  double start1,finish1;
                    start1=omp_get_wtime();  //开始计算时间
                    long long sum=0;
             omp_set_num_threads(n_threads);//设置线程数
           #pragma omp parallel for reduction(+:sum)//并行化
       for(int i=0;i<N;i++)
		{
		    int pp[100][100];
			for(int j=1,j1=0;j<N;j++)//去掉第一行
			{
				for(int k=0,k1=0;k<N;k++)
				{
					if(k==i)//去掉和i相同的列
						;
					else
					{

				     pp[j1][k1]=p[j][k];	//pp为余子式
					 k1++;
					}
				}
			    j1++;
			}
			if(i%2)
				sum+=(-1)*p[0][i]*mydet(pp,N-1);
			else
				sum+=p[0][i]*mydet(pp,N-1);
		}
        printf("the sum of omp is %lld .
",sum);//输出结果
	    finish1=omp_get_wtime();   //结束计算时间
		double   runing_t =finish1-start1;
		printf("the runing time of opm is %f s.",runing_t);//输出时间
		printf("
");
		printf("N= ");
		scanf("%d",&N);
	}
	return 0;
	}

2.4.3 MPI实现代码

/*************************************************************************
    > File Name: matrix_det_mpi.c
    > Author: surecheun
    > Mail: surecheun@163.com
    > Created Time: 2017年12月07日 星期四 16时24分03秒
 ************************************************************************/

#include<stdlib.h>
#include<stdio.h>
#include<math.h>
#include<time.h>
#include<mpi.h>

/*
 *定义矩阵的阶数为全局变量
 */

int N;

/*
 * 定义一个全局矩阵
 */

int p[100][100];

/*
 * 用随机数生成矩阵
 */

void create(){
	int i,j;
	for(i=0;i<N;i++)
	{
		for(j=0;j<N;j++)
	
	     {
           int a=rand()%15;//产生随机数,并赋给数组
	       p[i][j]=a;
	     }
	}
}
      
/*
 * 输出矩阵
 */

void print()
{
	int i,j;
	for(i=0;i<N;i++)
    {
		for(j=0;j<N;j++)
			printf("%d ",p[i][j]);
		printf("
");
	}
}

/*
 * 计算行列式的函数
 */

long long mydet(int  p [100][100],int n){
	if(n==1)  //n=1返回矩阵的唯一数,停止递归
		return p[0][0];
	else{
		long long sum=0;
		for(int i=0;i<n;i++)
		{
		    int pp[100][100];
			for(int j=1,j1=0;j<n;j++)//去掉第一行
			{
				for(int k=0,k1=0;k<n;k++)
				{
					if(k==i)
						;
					else
					{

				     pp[j1][k1]=p[j][k];	
					 k1++;
					}
				}
			    j1++;
			}
			if(i%2)
                sum+=(-1)*p[0][i]*mydet(pp,n-1);
			else
				sum+=p[0][i]*mydet(pp,n-1);
		}
		return sum;
	}
}



int main(int argc,char *argv[]){  
	  scanf("%d",&N);
      int num_procs,my_rank;    
      double start = 0.0, stop = 0.0;  //记录时间的变量
      long long  per_procs = 0.0;  //记录每个进程算的和
      long long  result = 0.0;  //矩阵行列式结果
      MPI_Init(&argc, &argv);  
      MPI_Comm_size(MPI_COMM_WORLD, &num_procs);  
      MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);  
      if (my_rank == 0)
	  {//0号线程创建矩阵
        create(); 
        print(); //打印创建的矩阵
       }  
     start = MPI_Wtime();   //开始计算时间
 
      MPI_Bcast(&N, 1, MPI_INT, 0, MPI_COMM_WORLD);    //将矩阵大小广播给所有进程  
      for (int i = 0; i <N; i++)
	  {  
      MPI_Bcast(p[i],N, MPI_INT, 0, MPI_COMM_WORLD);  
      }           //将矩阵广播给所有进程  
   
      for (int i = my_rank; i <N; i += num_procs){ //每个线程处理不同的行和列 
            long long sum_i=0;
		    int pp[100][100];
			for(int j=1,j1=0;j<N;j++)//去掉第一行
			{
		    	for(int k=0,k1=0;k<N;k++)
				{
					if(k==i)
						;
					else
					{
				     pp[j1][k1]=p[j][k];	
					 k1++;
					}
				}
			    j1++;
			}
       if(i%2)
                sum_i=(-1)*p[0][i]*mydet(pp,N-1);
      else
		sum_i=p[0][i]*mydet(pp,N-1);
        per_procs += sum_i;  //记录每个进程的和
    }  
    MPI_Reduce(&per_procs, &result, 1, MPI_LONG_LONG_INT, MPI_SUM, 0, MPI_COMM_WORLD);//在0号进程求总和  
    if (my_rank == 0){  
        printf("the sum of mpi is %lld .
",result) ; 
        stop = MPI_Wtime();  //结束计算时间
        printf("the time of mpi is %f s
", stop - start);  
        fflush(stdout);  
    }  
    MPI_Finalize();
    return 0;  
}  

4 实验结果

4.1 正确性

4.1.1串行

结果分析,以 n=4为例,输出的矩阵为:

13

1

12

10

8

10

1

12

9

1

2

7

5

4

8

1




输出结果为:3875

和matlab计算结果一致!

4.1.2 OpenMP

结果分析,以 n=4为例,输出的矩阵为:

5

0

8

1

1

5

11

3

2

5

1

1

0

0

14

12







输出结果为:-2710

和matlab计算结果一致!

4.1.3 MPI

结果分析,以n=4为例,输出矩阵为:

9

1

2

7

5

4

8

1

0

6

7

1

11

8

12

9







输出结果为:-202

和matlab计算结果一致!

4.2 加速比

通过多次求平均,得到三种计算实现方法的计算时间(保留 3 位有效数字)如下:

N(数)

串行

OpenMP

MPI

9

0.0239s

0.0117s

0.0117s

10

0.195s

0.105s

0.100s







柱状图如下:


【原创声明】转载请标明出处:https://www.cnblogs.com/surecheun/
原文地址:https://www.cnblogs.com/surecheun/p/9648981.html