字面层(Surface Level)
字面层关注的是概念在文本中的直接表现形式,主要处理”看得见”
它包括从语料中抽取命名实体(人名、地名、术语等)、
它的局限在于:容易产生冗余节点、遗漏隐含关系,且粒度不一致—
底层逻辑层(Underlying Logic Level)
这一层处理的是概念背后的结构性问题,
本体设计(Ontology)——在抽取任何实体之前,先回答”
粒度决策——“中国经济”和”2024年中国GDP增速”
关系的语义类型——字面层只能捕捉”A和B有关”,
隐含知识的显化——很多关键概念从不出现在文本中,
两层的关系
两者不是先后关系,而是迭代关系。好的实践是: