搜狗全搜索技术揭开暗网参与计划研究.蹭飞

浏阳历史网 2021-03-21 05:59:12

搜狗全搜索技术揭开“暗” 参与863计划研究

近日获悉,在国家高技术研究发展计划(863计划)云计算关键技术与系统(一期)重大项目中承担了以公众汉语服务为主的搜索引擎研制的搜狗取得重大技术突破,其所研制的全搜索技术将能从根本上解决暗数据的搜索问题,从而使搜索引擎能够搜索到的数据量增加几个量级。有关专家认为,搜狗全搜索技术通过云和端相结合的方式解决暗搜索问题。这在全球范围内属于重大创新,并将搜索引擎的发展引领到一个新的高度。

沉睡的暗

在互联发展初期,站相对较少,信息查找比较容易。然而伴随互联信息爆炸性的发展,普通络用户想找到所需的资料简直如同大海捞针。传统搜索引擎应运而生,为大部分用户解决了信息获取的难题。但是随着互联进一步发展,海量的信息不断累积,并且逐渐由络表面渐渐下沉。这类信息往往很难被传统搜索引擎抓取,因此形成了业内人称之为暗的概念。

大多数来自1000所左右的高中(美国有3万多所高中)。学区房这个词也不是中国人发明的据估计,暗隐藏的信息要比表面络内容大好几个数量级。如果把表面络比作水面上漂浮的冰山,暗数据就是冰山下那庞大冰体,露出水面的体积往往只占其下冰体的百分之一甚至更少,如何监测并利用这些沉睡的内容成了目前搜索引擎行业亟待解决的问题。

为解决暗问题,各大搜索引擎厂商都提出了各自的解决方案,Google采用暗表层化的方式来处理,百度提出了阿拉丁计划,但是结果仍然不理想。暗表层化只能解决暗搜索1%左右的问题,离真正解决暗搜索问题尚有差距。而阿拉丁也遭遇技术瓶颈,需要通过手工方式补充大量暗中的信息,主要采用通过商务洽谈的方式获取第三方内容提供商的基础数据,之后再通过建立各种垂直搜索的方式整合到通用搜索中,其搜索结果取决于百度与其他公司商务谈判结果以及各种垂直搜索领域的技术研发进展。

针对暗问题,搜狗公司以搜狗搜索和搜狗浏览器两方面的技术和用户平台为基础,应用云计算的原理,在云-端架构下对搜索技术和架构进行革新。首先,借助针对用户行为和站特点的分析,对互联暗的海量入口进行自动化的挖掘和组织,并通过语言模型、用户行为反馈实现对用户查询意图及强度的智能理解,最终在云-端架构环境下,实现互联暗数据及服务资源的按需分配,为用户提供所需的暗搜索结果。

搜狗全搜索揭开暗

何先生最近想买一只新的iPad2送给女友做生日礼物,令他惊奇的是,当他在搜狗搜索iPad2的时候,在结果页面竟然直接看到了京东、淘宝、新蛋、亚马逊中国等站有关iPad2的情况,包括图片,价格,库存数量,内容丰富,一目了然。这就是搜狗全搜索给用户带来的良好体验。

关注ITBear科技资讯公众号(itbear365 ),每天推送你感兴趣的科技内容。

特别提醒:本内容转载自其他媒体,目的在于传递更多信息,并不代表本赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接及连带。如若本有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

南宁早泄治疗多少钱
阿尔茨海默病无法治愈吗
重庆男性功能障碍治疗费用
友情链接