第十届中国软件杯大赛——A1-数据智能分析报告系统

第十届中国软件杯大赛--A组赛题

赛题名称:数据智能分析报告系统

组类: A组( 本科、研究生、高职)

 

数据样例已提供,详情见赛题;

赛题简介:介绍整个赛题的实现目标、实用价值、涉及技术和整体要求

通过开发NLP、ML/DL模型学习数据分析报告样例,在给定新数据后,自动生成数据分析报告文档。

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景

民航业信息系统每天产生海量的业务交易数据,航司、机场、监管机构等民航从业者需要对数据进行深入挖掘,为决策提供数据依据。其中有一部分是需要每天/每周/每月等定期刷新的固定版式的数据报告,还有经过数据分析师分析挖掘后形成的判断结论。目前NLP、ML/DL技术的发展,已经出现了可以自主组织素材撰写新闻稿件的机器人,自动化的、智能化的生成数据分析报告成为可能。

基本功能要求

1、输入数据表、模板(docx、xlsx等格式)生成固定格式数据报告(docx、xlsx、pdf等格式),模板中对需要计算的字段通过特殊符号进行标记,将在附件中提供。例如每日统计客座率信息,程序应能够自动生成当天日期。

2、在功能1的基础上,通过NLP、ML/DL模型学习数据分析报告的撰写风格,从输入数据表中自动提取聚合或计算数据,生成图表,并生成文字,形成报告。报告具有以下功能:

(1)生成图表,且图表合理、美观;

(2)生成图表标题、对图表进行描述的文字;

(3)报告包含从数据中得到一定的判断、结论性质的文字。例如运营指标异常发现,同比环比,趋势判断等;

(4)生成的文本应基本符合阅读习惯,通顺达意。

具体的民航业运营指标及计算公式会在附件中提供,例如旅客量、客座率、客公里收入、座公里收入等。

非功能性要求

在配有GPU的平台上,运行时间不应过长

实现条件:开发环境、实验平台、开发语言、

数据库、编译器、涉及硬件等实现条件

开发语言:核心算法为Python3

开发环境:Linux x64(RHEL7.5及以上),Anaconda3

数据仓库:PostgreSQL

测试数据或平台:提供给参赛者的测试环境和测试数据

数据分析报表样例、数据样例下载:A数据智能分析报告系统-样例报告和数据.zip

(如需解压密码,请在大赛官方qq群中私信 组委会 王艳  或 组委会 赵瑞华,发送报名截图;

中国软件杯官方学生qq群:179326524 、209318323、215410234 任意进一个群即可)

需要更多数据的参赛团队,在"航指数网站"维护不能登陆期间,可参考民航局网站上的数据
中国民用航空局:http://www.caac.gov.cn/index.html

开发所需设备及设备指标需求说明

文档及其他要求

相关设计和说明文档应包含:算法说明、软件结构、功能模块、接口设计、数据结构等,为读者提供清晰的算法说明和源代码阅读指南

各评分项及大致占比

1、提交材料(20%)

提交的程序可运行(或有详实的演示录屏),代码、文档完整清晰

2、功能和非功能实现(60%)。

按功能点打分

3、创新(20%)

在基本要求外,视完成情况及难度、新颖性评定分数

初赛作品提交要求

源文件、可执行文件、相关设计和说明文档、演示视频(7分钟之内)、ppt等

【参赛团队作品中团队自主开发部分的软件作品著作权归参赛团队所有,其中具有市场应用及拓展的优秀作品,出题企业具有优先权,可以优先合作开发或者优先购买。另如基于该作品的任何合作升级开发、市场拓展等活动,以及在这一过程中所获得的任何商业费用,出题企业应与参赛团队协商解决。】

出题企业:中国民航信息网络股份有限公司

答疑老师:刘老师  yfliu@travelsky.com.cn   

原文地址:https://www.cnblogs.com/Aming-/p/14941568.html