斗罗小说网

第238章 紧追热点,第一篇深度学习论文开工

2021-09-02 作者: 暗影飞羽

作为深度学习时代自然语言处理的最广泛传播的词嵌入工具word2dec,也就是把文本转化为向量,在今年,13年初,就已经由谷歌发布了的一篇。

另外一篇,更为迅速的方法,涉及到负采样和NCE-Loss的技术要点的论文,是谷歌到今年10分份才发表的,莫浩波有足够的时间,去完成这篇论文。

事实上,跟着莫浩波穿越而来的笔记本电脑,上面就有谷歌的这篇论文。

不过,如果原封不动地照抄上去,显然是不行的,因为数据集啊,有的数据集是谷歌新公开的,不能用。只能用一些公开的测试集,英文的中文的。

不过即便是冲突了,莫浩波也丝毫不担心,因为,莫浩波手里还有另外一篇论文呢,就是证明啦。

没错,就是证明。

实际上,为什么能够使用负采样以及NCE,谷歌这时候也是没有证明的,是要17年还是18年来着,才证明的,所以,即便慢了点撞车了,莫浩波也相信,他才是发明者。

能证明,对比不能证明的东西,成果归谁那还不是显而易见的么?要是谷歌再配合炒一炒,让莫浩波混到个天才少年的称号,那就更有意思了。

不过,想想莫浩波还是放弃了,果然闷骚如他,这时候是不会挑衅的。

现在莫浩波人微言轻,能避免纠纷什么的,还是避免的好,不要给对手一丝一毫的机会,已经把自己看成中国乃至世界的,人工智能领导者的莫浩波,心中暗自计较。

果然还是我们这些历史虚无主义有战斗力啊。

工科类、学术类专业需要写的论文,果然还是需要做实验的。

虽然莫浩波前世工作时候copy实现过word2vec的两种方式,CBOW模型和Skip-Gram模型,不过那是python3.5实现的,现在不知道python3出来了没有。

不过能够抄抄抄也是很好的,现在在笔记本的windows系统D盘下,保存着他前世工作后学习和编写的所有代码,也是很爽的一件事情。

不就是把py3转为py2嘛,那真是小菜一碟,不过就是训练数据,测试数据集麻烦了一点,就这手机的网速这流量,一个数据集都下不完就GG了,看来还是要跑一趟网吧或者同学家啊。

网吧什么的还是太危险了,莫浩波可是不敢上去的,尤其是这种地方。

记得小时候去游戏厅都让人抢过,现在如此瘦小的他,一个人可是不敢去的。

网瘾少年小学生什么的,想想还是很可怕的。记得他的几个同学,就是因为网瘾了,读不进去书,落到了连初中没毕业就外出务工的境地,真是太恐怖了。

再说小学生砍了人估计还能被原谅,从头再来,莫浩波可不能给他们送经验,也不能引诱他们犯罪。

网吧不去那就只好去镇上或者县里的同学家里了,那些有电脑的同学。

不过,这个时候,13年,即便偏远地区如我们,镇上的同学,也是大都装了宽带的了,莫浩波也不愁找不到电脑。

心中一动,果然大好机会。

需要电脑下载工具学习+约会任思思,这不是一件很有意思的事情吗?莫浩波突然就想通了这么一件事。

我果然是个天才,莫浩波拍拍脑门,很是得意。

现在6月底,思思家大人什么的,肯定会出门的啦,他妹妹什么的,也在寄宿读书啊;姐姐啥的,也在医院工作啦。

关闭