深圳SEO设为首页收藏本站

深圳SEO|网站优化|网络推广|网络营销|网站排名-第六维网络

 找回密码
 立即注册

QQ登录

只需一步,快速开始

第六维SEO博主简介

第六维网络科技博主5年SEO大型网站优化经验,毕业于SEO搜外课堂,SEO研究协会网总群管理员,接手几十个装修,搬家,婚纱摄影,培训网站优化经验,

研究web超链分析算法、PageRank算法、HITS算法、SALSA算法、PHITS算法、贝叶斯算法、Reputation算法。基于随机漫游模型的,比如PageRank,Repution算法。精通数据统计、数据分析、产品分析、用户心理,数据挖掘,长尾关键字全覆盖战略,

优化过大型网站权重6的留学网站,权重4的教育网站,拥有大批外链资源,高权重友情链接资源,新闻源媒体资源,SEO排名的核心是用户需求点的挖掘,精通搜索引擎原理、链接策略、蜘蛛抓取规则、tf/idf、向量空间模型、关键词挖掘、关键词定位、关键词布局、用户需求、文本处理、数据分析、流量统计、工具使用、竞争对手分析,

主要业务有:为深圳中小企业提供SEO顾问,网站排名,网络推广,网络营销,SEO整站优化。电话:15173140967 联系QQ:784828177QQ咨询

搜索
热搜: 活动 交友 discuz
查看: 3522|回复: 0

布尔模型(Boolean Model)

[复制链接]

690

主题

713

帖子

3468

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3468

最佳新人活跃会员热心会员推广达人宣传达人灌水之王突出贡献优秀版主荣誉管理论坛元老

发表于 2015-2-22 21:23:03 | 显示全部楼层 |阅读模式
长沙SEO了解到,布尔模型(Boolean Model)最早的IR模型,也是应用最广泛的模型;目前仍然应用于商业系统中;Lucene是基于布尔(Boolean)模型的。
布尔模型描述
文档D表示
一个文档被表示为关键词的集合
查询式Q表示
查询式(Queries)被表示为关键词的布尔组合,用“与、或、非”连接起来,并用括弧指示优先次序
匹配F
一个文档当且仅当它能够满足布尔查询式时,才将其检索出来
检索策略基于二值判定标准
算法R
根据匹配框架F判定相关
查询表示
    在布尔模型中,所有索引项的权值变量和文档dj与查询q的相关度都是二值的,查询q被表述成一个常规的布尔表达式,为方便计算查询q和文档d的相关度,一般将查询q的布尔表达式转换成析取范式qDNF。
示例
文档集包含两个文档:
文档1:a b c f g h
文档2:a f b x y z
用户查询:文档中出现a或者b,但一定要出现z。
将查询表示为布尔表达式  ,并转换成析取范式
文档1和文档2的三元组对应值分别为(1,1,0)和(1,1,1)
经过匹配 ,将文档2返回
优点
到目前为止,布尔模型是最常用的检索模型,因为:
由于查询简单,因此容易理解
通过使用复杂的布尔表达式,可以很方便地控制查询结果
相当有效的实现方法
相当于识别包含了一个某个特定term的文档
经过某种训练的用户可以容易地写出布尔查询式
布尔模型可以通过扩展来包含排序的功能,即“扩展的布尔模型”
问题
布尔模型被认为是功能最弱的方式,其主要问题在于不支持部分匹配,而完全匹配会导致太多或者太少的结果文档被返回
非常刚性: “与”意味着全部; “或”意味着任何一个
很难控制被检索的文档数量
原则上讲,所有被匹配的文档都将被返回
很难对输出进行排序
不考虑索引词的权重,所有文档都以相同的方式和查询相匹配
很难进行自动的相关反馈
如果一篇文档被用户确认为相关或者不相关,怎样相应地修改查询式呢?

本文作者:长沙SEO
本文地址:http://www.albbgo.com/thread-594-1-1.html
回复

使用道具 举报

*验证码:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

深圳SEO|网站优化|网络推广|网络营销|网站排名-第六维网络    

GMT+8, 2018-1-17 01:15 , Processed in 0.067945 second(s), 33 queries .

Powered by 长沙网站优化 X3.2

© 2001-2013 百度关键字排名优化 Templated By SEO谋士团

快速回复 返回顶部 返回列表