本项目的基础就是同学们贡献的海量数据。快去为我们的数据库添砖加瓦吧!
欢迎来到华育知识图谱企划。该项目发起于校群,由21159同学构思,21159与23564同学共同实现,旨在构建华育的信息网络,并收集数据为之后进一步的分析做准备。
知识图谱是一种很高效的表征常识的方式。它的最基础形式就是三元组:主词、谓词、宾词。
主词和宾词称之为“实体”,谓词描述两者之间的单向关系。
如果这种关系天然是对称的,那么必须写正反两种,反之如果不是,则不用把对应的反向标出。
如果某种关系具有程度的差别(比如“很讨厌”),则必须把对应的,但是较弱的关系也单独列出(有点讨厌,讨厌)等。
和前人在用词上保持一致,同一个意思用相同的词语表示,否则下游算法可能处理不了
尽量用简单的关系,将复杂关系解构为简单关系
当前还无法直接对实体进行标记,任何标签,属性也只能用谓词表述
谓词关系不具有时态性,“曾喜欢”和“喜欢”默认一样,“参与“包括””“曾参与“。不过如果你一定想标注一个“曾”版本,请与不带“曾”的并行
标记人物必须首先使用学号。
目前该企划还在试验阶段,希望大家踊跃参加,且贡献自己的意见!
注意:涉及到“喜欢”等争议性话题的,务必征求当事人同意才可录入。如果只是绯闻,都不是真信息的话那就拉倒吧。
可参考 【腾讯文档】H2KG-华育知识图谱企划 https://docs.qq.com/sheet/DVnV2SndDR3VseWtr 填写。本企划现已进入公测阶段,若有疑问,欢迎在QQ华育校友营/QQ天气群/QQ华育知识图谱权限组/微信华育学生联盟反馈。
沪ICP备2020025694号
版权所有© 2022 Ericnth