叶子网络bbs论坛

标题: 像百度凭借按照哪些技术来判断一篇文章的核心内容 [打印本页]

作者: admin    时间: 2014-9-1 22:35
标题: 像百度凭借按照哪些技术来判断一篇文章的核心内容

问题:请问我这里有一篇文章,像百度依靠哪些技术来提取这个文章的最突出的文字的?依靠代码内容还是统计频率最高的关键词

参考答案:正如搜搜这样的成熟运营的引擎服务商,他们会有容量很大的关键词库与语言提取算法,能够将记录到的每篇文章的主要文字,对比重要部位的,相关词语,站内相关内容等主要特征来比较,使得得出一篇独立页面的最突出的文字。

如果单纯地依靠文章标题又或是主要的词语,假如遭遇写这些文字的编辑不怎么精准,或表现情景意义不大的词语大量展示,导致提取不正确。







欢迎光临 叶子网络bbs论坛 (http://xuanfly.com/) Powered by Discuz! X3.3