训练语料库

GolVe 训练 语料库

  1. 将语料库进行分词

    英文天然的已经以空格分好词。 只需要再对 don't 等词处理成 do n't即可

  2. 获取GolVe代码

    git clone https://github.com/stanfordnlp/GloVe.git
    
  3. 将分好词的语料库移动到GolVe文件夹下

    mv sentence2.csv GloVe/
    
  4. cd GloVe/
    
  5. 将demo.sh中make之后CORPUS之前的代码注释。然后将CORPUS的值替换成自己的语料库文件名

  6. make && bash demo.sh
    
原文地址:https://www.cnblogs.com/TianU-4049/p/13638469.html