Huayu2Vec

欢迎来到华育知识图谱企划。该项目发起于校群,由21159同学构思,21159与23564同学共同实现,旨在构建华育的信息网络,并收集数据为之后进一步的分析做准备。

本版本基于21159同学构思并制作的基于原版Huayu2Vec极简包,经过23564修改并集成在H2KG项目中,方便没有Python环境的同学使用。运行本项目服务器开销较大,请不要连续多次使用。

*以下是来自21159本人的备注

什么是H2V?

H2V是Huayu2Vec的简称,意味将华育校群中的人物简化为向量进行表达,它是H2KG的姊妹篇。H2V是根据第三校群的完整消息记录计算的,其核心思想如下:两个人的发言越经常共现(相接),表明两者这两个人之间经常发生交流,则他们的向量表示就会越接近;反之,两个人的发言如果几乎从不一起出现,即说明关系比较疏远,则他们的向量差异就会比较大。根据这种设计,在差不多的时代在校群活跃的人,一般会更加接近。这个查询工具就是查找和指定学号最接近的k个人物。注意它会区分小号,对于有小号的人,其第一个小号为学号+a,第二个+b,以此类推。

详细原理请见我在nth博客所写的两篇文章:链接 链接

很遗憾,对于没有在校群出现过的人,无法进行H2V分析。不过随着H2KG研究完善,可以与H2V相结合:可能存在方法使用从H2KG抽取信息来模拟H2V数据。敬请期待!

查询学号


请先点击此处,然后