“还没有。老师给了我一本关于情感分析的中文书,我准备先学习一下。”
情感分析啊,凌志有所了解。
早年的情感分析基本上是将文本分为积极、消极以及中性三类。
早在十几年前,相关的论文就已经不计其数。大家争先恐后地在各大会议上发表,并声称自己在公开数据集上取得了最优的效果,尽管分类准确率可能只是零点几个百分点的提升。
如今,这个任务的情感分析准确率早已被刷到了97%以上,再也没人在这个任务上浪费时间了。
如今大家做的情感分析会更细粒化。如将一句话的情感分为喜怒哀惧等多个类别,看看在哪一种类别上的得分最高,那么这句话就更偏向于哪类情感。
而多分类任务一般的准确率相对较低,在以前可能也就将将过50%。如今这个任务已经有人做到了80%以上,所以更多的,人们开始进一步将任务细粒化。
比如开始分析一句话中的情感到底是喜悦,还是假装喜悦,是恐惧,还是装作恐惧。由此带来了一串相关研究任务,如情感方面词提取,情感原因匹配对抽取等等。
凌志虽然不做这个研究方向,但是在入学时也有看过这类的书籍。
想要做情感分析的话,确实比较容易上手,不过想做出好成果,并不容易。
跑模型大家都会,但想要做出新意,效果超过其他所有人,可能付出的努力并不一定会比自己小。“哦,挺好的,这个方向挺好上手的。有什么问题我们也可以交流,我以前也了解过一些情感分析的知识。”
“好啊,谢谢师兄。那师兄做的是什么研究方向呢?”
“哦,我呀,我做的是用户身份识别算法,就是根据用户的文本写作风格来判断两个账户是不是属于同一个人。……”
凌志简单介绍了一下自己的研究方向,只不过没有赘述自己遇到的困难,只是简单说了声自己没有什么重要进展。
“总之现在还是在调模型,大概就是这样。”
韩轻悦在整个过程中都仔细听着,没有发出一丝声音,哪怕是“嗯”的赞同声都没有。
“嗯,师兄做得很好啊。这个课题应该很难拿到真实数据集的吧,据说现在的水军账号识别率,也只有0.19%,远远低于预估,更别说账号关联了。”
凌志感觉有些异样,不过他先压下心中的疑惑,感谢道:
“嗯,谢谢你能这么说。数据集虽然拿不到真实的,但是还是可以模拟一份数据集做下去。目前的实验状态已经渐渐好转了,坚持做下去肯定会更好。”
凌志稍微犹豫了一下,补充道:
“不过,你刚刚说的水军账号识别率,是从哪里得到的消息?这么准确的数字,我都不知道。”
韩轻悦脸上的微笑消失了一瞬,但随即又恢复成了原来的样子,说道:
“哦,那个啊,我也忘了,不知道以前从网上哪个角落读取到的信息,师兄不用在意。”
“这样啊。不过不管怎么说,好歹你又帮我增加了一个知识点,谢谢你。”
“没事的,倒是我要谢谢师兄。”
“嗯,还有什么想问的吗?”
“嗯……暂时没有了,那师兄,以后有机会再聊。”
“好。”
韩轻悦站了起来,慢慢走向其他人的座位,甚至3个男生新生都没有错过。但无论是谁,她的只言片语中都会有几个字飘向凌志的耳中:
“你好……轻盈的轻,喜悦的悦。……”
真是少见的求知欲如此旺盛又如此礼貌的姑娘啊。凌志想道。
3个男生新生也在跟附近的师兄师姐交流,但并不是每个人都有聊到,这一下子就显得韩轻悦与众不同。
而因为她的谦逊礼貌,不多时便赢得了不少人的好感。凌志远远地听见周敏师兄开始跟韩轻悦开玩笑了:
“哎,师妹,你看你要是做情感分析做不下去,就转到我们这边来吧。我们跟老王深耕多年,还算有不少经验,到时候罩着你啊,哈哈。”
韩轻悦依然不卑不亢地微笑着说道:
“谢谢师兄,我会考虑的。”
凌志无奈地笑着摇了摇头,他想起自己去年刚到实验室的时候那份局促不安的样子:只敢待在自己的座位上,连倒杯水都要蹑手蹑脚的,更别说主动去了解其他师兄师姐做的方向,他怕暴露自己的无知。所以眼前韩轻悦的举动让他很是羡慕。
“哎,轻悦,中午跟我们一起去吃饭吧,怎么样?”
张小欣师姐已经开始认姐妹了。不过也是,长期以来实验室一直是阳盛阴衰,好不容易来了个姑娘,当然要把她拉过来站在统一战线。
“哦,师姐,不好意思,我还有别的事,就不跟你们一起去了。”
“这样啊,没事没事,你忙你的。”
张小欣似乎有些遗憾,但还是表示理解。
过了一会儿,韩轻悦被拉到了实验室微信群里。不久,凌志收到了韩轻悦的微信好友验证消息:
“你好,师兄,我是韩轻悦,以后请多指教啊。”