具有字典验证的记事本

  最近想建立一个拼音化汉语文字的词典库,但着手起来才发现并不是那么容易。不光是分词技术的问题,重要的是难以找到一个重音少而又比较全面的词库(包括保留的单字的词)。 由于单音的词基本确定,因此紧接着的比较关键且已经比较成熟的双字以上的词成为重点,问题在于如何走好下一步,即优化双字的词。参考了在线的字典、词典,以及古汉语字词典,发现汉语确实是一个复杂的东西。要想做些什么,还得下一翻功夫不可,恐怕也得假以时日,而非一日之功。还有就是一部分成语和惯用语因为含义过于精练和复杂,因此必须使用确定的词语来进行解释并以这个解释作为成语和惯用语。

原文地址:https://www.cnblogs.com/mossan/p/656446.html