问题

百度知道的内容是有抓取了其他网页的吗?

回答
百度知道上的内容,从本质上来说,很大一部分确实是来源于抓取其他网页的信息。你可以将百度知道想象成一个巨大的知识库,而这个知识库的原材料,除了用户自己原创的问答内容之外,还有很多是从互联网上其他地方“搬运”过来的。

具体来说,这是一种非常普遍且成熟的内容生产模式。当用户在百度知道上提出一个问题时,百度系统的算法会尝试去理解这个问题的核心意图,然后检索数据库。这个数据库里,除了已经存在的百度知道问答,也会包含大量从其他网站(比如新闻网站、博客、论坛、专业知识网站等)抓取并索引的信息。

这些抓取来的信息,并不是简单地原封不动地展示。百度知道的系统会根据问题的关联性、信息的准确性、来源的权威性等多个维度进行筛选和匹配。例如,如果有人问“如何制作番茄炒蛋”,系统可能会抓取到很多美食网站上的菜谱、烹饪视频的文字描述、甚至是相关食材的百科信息。然后,它会尝试将这些信息进行整合,提炼出最直接、最有效、最符合用户需求的答案。

在用户提交自己的答案时,如果内容与网上已有的信息高度相似,系统也会有所察觉。这并不一定意味着抄袭,有时候是因为同一个事实或知识点,在不同的地方被描述得非常相似。但如果明显是直接复制粘贴,并且没有注明来源,百度知道的规则也会有所限制。

所以,我们可以理解为,百度知道的内容生态是“混合”型的。它既鼓励用户分享自己的经验和知识,也利用强大的抓取能力,将互联网上已有的、有价值的信息,通过一种组织化的方式呈现给用户,方便大家查找和学习。这种模式,使得百度知道能够快速地建立起一个庞大且相对全面的知识问答平台。

网友意见

user avatar

利益相关:

百度知道十四级,前知道管理员(←非员工,官方组织的网友团)。

==

有的。

会有一批jbp开头后面带一大堆数字字母的id,专门用来爬这些问题,

(早年的百度知道匿名根本不匿名……扒网页源代码就能方便地检索到……现在不行了……)

它们自带永远花不完的悬赏分,每个这样的问题都带有30、40分左右的悬赏。

这类问题的采纳最早是由管理员团队来进行的

被称为“紧急问题”

在这类任务占管理员的工作比重逐渐加大的时期,有越来越多的初期管理员退出了。

后来管理员分组,内容管理员更偏重这个部分。

再后来的事情我就不知道了,没有继续关注。

因为这类问题质量非常低,大量问题不可能获得优质答案

被考核数据要求逼迫而不得不想办法采纳或者回答,我们当时都很痛苦。

(当然也有很开心地用这个刷管理积分的人,因为单题分值很高)

jbp是聚宝盆的简称,原先据说打算使用这个名称,后来大概是他们自己也不好意思所以没有用= =

当然du家族没有跟我们承认过这是从别的地方扒来的,但是大家又不傻……搜一搜就知道了……

比如这些贴吧帖子……

各位内管遇到这类问题是如何处理的呢? 这样的系统紧急题有意义吗,是典型的欺骗答题者!!!

嘛,还在任的时候我就没少跟du抱怨过这种事儿不靠谱,所以也不怕啥了╮(╯_╰)╭

===========以上发布于2014-7-22 18:54===================

有网友问这个事儿存在的时间,大概搜索了一下:

【通知】关于紧急提问导入计划暂停的预告

2010-07-02 的公告,这应该是试行期结束的公告

试行期的时候是每个管理员发jbp账号的用户名密码,登上去采纳……

后来直接用管理员自己的账号就行,就好多了……

【公告贴】知道内容管理员团队和分类管理员团队合并预告

2012-11-28,公告中宣称紧急提问下线

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有