Daily Srum 10.28

这两天我们和其他两组进行了一次会议,主要讨论的是用什么框架来搭建这个平台。在线系统的那一组希望我们用nutch、solr、hbase这一套工具,这对于我们两组来说是一次挑战,毕竟我们一开始用的是关系型数据库,而王鹿鸣、李云涛他们一组却希望我们用NoSQL来做,这毕竟是需要学习成本的,所以我们的进度可能有所停滞,虽然我们前面两组采用的他们的方法,但是为了以防万一,我们还会在以前的基础上进行开发,也就是我们将会进行双线程的工作,任务量十分大,但是我们坚信我们一定可以做完。


这两天时间完成的任务:

  1. 我们才发现这次的所有文章都是英文的,所以我们用lucene这个分词,分词效果还不错。
  2. 数据库的原本关系已经建立好了,原来的进度我们不会落下,现在新的方面我们也会进行拓展。
  3. 初步在平台上搭建了一些简单的界面
  4. 翻译已经完成,就是用的百度的翻译api
  5. 为了更为符合软件工程中敏捷编程的思想,我打算直接用分词器中的提取关键词这个功能。
  6. 建立一些简单的asp.net搭建的界面

当然我们也遇到了一些困难,在处理这些问题的时候,我们会一起讨论、搜集资料,然后运用相对而言让自己满意的算法的完成这些问题。对于nutch、solr、hbase这一套工具,我们搭建平台上确实遇到了或多或少的障碍,但是这不会停滞我们前进的脚步。

明天的任务:

Members Tomorrow's Task
陈谋 去重、去噪
李剑锋 学习NoSQL的相关知识,掌握如何搭建相关平台
潘成鼎 完成E-R模型的数据库建设
卢惠明 用lucene工具进行关键词的提取
刘夕霆 asp.net搭建HTML网页
仉伯龙 完成网页内容构建

我们的进度情况(燃尽图):

原文地址:https://www.cnblogs.com/cheneygroup/p/4925048.html