果断同意小姜老师的来信以及通讯作者的要求,同时,莫浩波装作纯真的二逼青年,很中二地来了句:我一定会成为最牛的计算机科学家的!
回了邮件,还不等小姜老师回邮件,莫浩波又投入了文本生成词向量的另一个工具,Glove方法的实验以及论文的编写。
数据集是有了的,上次论文的数据就好,方便快捷,而且好比较。
代码也是现成的,前世,菜鸟如莫浩波,对于各种算法等,都要好好看看,简单的就是自己用python实现,复杂的呢,就是clone开源实现了。
好习惯呀,便宜了现在的莫浩波,换换数据集,调调参数,优秀的实验数据就出来了,果然,模仿才是最省力的。
三个小时过去了,五个中小规模的数据集也跑完了,在现有的公开的算法上,词语相似度,分类,命名实体提取等任务上,都优秀于初版的词向量工具word2vec,部分比莫浩波提出的负采样方法等差些罢了。
忽略这个小缺点,Glove仍然不失为一种好方法,尤其是对于机器学习、以及急于和美国竞争的中国人来说,中国,确实需要一些引领世界的大牛了!
修改了一下斯坦福大学教授在14年发表的Glove论文,莫浩波删删改改,使之符合自己的语言习惯和理解,晚上六点,他便将这篇论文,邮件发了出去,给小姜老师。
这段时间,一直忙于莫浩波上一篇负采样的word2vec论文的小姜老师,这时候格外注意邮件的信息,或许,还会有什么灵光一闪的学生会邮件她吧!
毕竟,教授什么的,那也是语言高质量论文的呢。
斗罗书:(www.douluoshu.com)