Daily Srum 10.26

Daily Scrum Meeting

虽然TFS的相关使用已经在上面贴出来一段时间,但是要运用TFS还是有些困难的,特别是TFS的代码管理机制,所以我们让部分人先弄清楚,然后再教授给其他人。终于大家都进入了状态,弄懂了TFS的运用方式。


这两天时间完成的任务:

  1. 完成了分词器的选择,初步决定:在处理中文文档是用中科院张华平博士NLPIR/ICTCLAS2015分词系统下载包;英文文档和中英文混合文档选用的是Apache Lucene分词器
  2. 完成数据库实体关系间的联系:用E-R模型来表示。初步完成数据库的连接操作。
  3. 简单的UI设计(可能进度有点慢)
  4. 百度翻译api完成了英汉翻译。(我们会对多种api进行测试,攫取其中最好的)
  5. 已经明白了TF-IDF的含义,能够初步完成提取关键词的步骤;当然如果用自己分词器来完成分词的效果的话,速度会更快,效果可能也会更好。后面我们将在这两种方案中进行选择。
  6. 初步学习了asp.net

当然我们也遇到了一些困难,在处理这些问题的时候,我们会一起讨论、搜集资料,然后运用相对而言让自己满意的算法的完成这些问题。

明天的任务:

Members Tomorrow's Task
陈谋 完成分词器的相应运用,特别是分词
李剑锋 完成翻译api的选择
潘成鼎 完成E-R模型的数据库建设
卢惠明 对比分词器的提取关键词效果和自己TF-IDF的提取关键词的效果
刘夕霆 完成简单的asp.net运行架构
仉伯龙 了解客户需求,拟定相关的技术文档

我们的进度情况(燃尽图):

原文地址:https://www.cnblogs.com/cheneygroup/p/4915963.html