分析一套源代码的代码规范和风格并讨论如何改进优化代码

我的选题是《针对领域知识的中文知识图谱自动化》

源码下载:

https://codeload.github.com/chizhu/KGQA_HLM/zip/master

KGQA_HLM

基于知识图谱的《红楼梦》人物关系可视化及问答系统

文件树:

    1. app.py是整个系统的主入口
    2. templates文件夹是HTML的页面
      |-index.html 欢迎界面
      |-search.html 搜索人物关系页面
      |-all_relation.html 所有人物关系页面
      |-KGQA.html 人物关系问答页面
    3. static文件夹存放css和js,是页面的样式和效果的文件
    4. raw_data文件夹是存在数据处理后的三元组文件
    5. neo_db文件夹是知识图谱构建模块
      |-config.py 配置参数
      |-create_graph.py 创建知识图谱,图数据库的建立
      |-query_graph.py 知识图谱的查询
    6. KGQA文件夹是问答系统模块
      |-ltp.py 分词、词性标注、命名实体识别
    7. spider文件夹是爬虫模块
      |- get_*.py 是之前爬取人物资料的代码,已经产生好images和json 可以不用再执行
      |-show_profile.py 是调用人物资料和图谱展示在前端的代码
原文地址:https://www.cnblogs.com/tianjiazhen/p/11667083.html