亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

全文索引 排名計(jì)算問題

系統(tǒng) 1674 0

排名計(jì)算問題

計(jì)算排名的過程,取決于一系列因素。不同語言的斷字符對(duì)文本進(jìn)行的詞匯切分也不同。例如,字符串“dog-house”可以被一種斷字符斷為“dog”和“house”而被另一種斷字符斷為“dog-house”。這意味著匹配和排名將根據(jù)所指定語言而有所不同,因?yàn)椴粌H詞不同,而且文檔長(zhǎng)度也不同。文檔長(zhǎng)度的差異可能會(huì)影響所有查詢的排名。

諸如 IndexRowCount 之類的統(tǒng)計(jì)信息可能會(huì)大不相同。例如,如果一個(gè)目錄的主索引有二十億行,那么對(duì)一個(gè)新文檔的索引將被編制為內(nèi)存中的中間索引,而基于該內(nèi)存中索引內(nèi)的文檔數(shù)對(duì)該文檔的排名可能與主索引中的文檔排名不同。因此,建議在完成產(chǎn)生大量要?jiǎng)?chuàng)建索引或重新創(chuàng)建索引的行的任意填充后,使用 ALTER FULLTEXT CATALOG ... REORGANIZE Transact-SQL 語句將這些索引合并為一個(gè)主索引。全文引擎也會(huì)根據(jù)參數(shù)(例如中間索引的數(shù)目和大小)自動(dòng)合并索引。

MaxOccurrence 值被規(guī)范化到 32 個(gè)范圍的其中一個(gè)內(nèi)。這意味著,比方說,50 個(gè)詞長(zhǎng)的文檔與 100 個(gè)詞長(zhǎng)的文檔的處理方式相同。下面是用于規(guī)范化的表。由于這兩個(gè)文檔的長(zhǎng)度位于相鄰表值 32 與 128 之間的范圍內(nèi),因此將認(rèn)為它們具有相同的有效長(zhǎng)度 128 (32 < docLength <= 128)。

復(fù)制代碼
                    { 16, 32, 128, 256, 512, 725, 1024, 1450, 2048, 2896, 4096, 5792, 8192, 11585, 

16384, 23170, 28000, 32768, 39554, 46340, 55938, 65536, 92681, 131072, 185363, 

262144, 370727, 524288, 741455, 1048576, 2097152, 4194304 };


                  

CONTAINSTABLE 排名

CONTAINSTABLE 排名使用以下算法:

復(fù)制代碼
                    StatisticalWeight = Log2( ( 2 + IndexedRowCount ) / KeyRowCount )

Rank = min( MaxQueryRank, HitCount * 16 * StatisticalWeight / MaxOccurrence )
                  

短語匹配項(xiàng)的排名方式與各個(gè)鍵類似,只不過要估計(jì) KeyRowCount (包含該短語的行數(shù)),并且此值可能會(huì)比實(shí)際值大。

ISABOUT 排名

CONTAINSTABLE 使用 ISABOUT 選項(xiàng)支持查詢加權(quán)詞。按照傳統(tǒng)信息檢索系統(tǒng)的說法,ISABOUT 表示向量空間查詢。所使用的默認(rèn)排名算法為廣為人知的公式 Jaccard。將根據(jù)查詢中的每個(gè)詞計(jì)算排名,然后按如下描述將這些排名相結(jié)合。

復(fù)制代碼
                        ContainsRank = same formula used for CONTAINSTABLE ranking of a single term (above).

Weight = the weight specified in the query for each term. Default weight is 1.

WeightedSum = Σ[key=1 to n] ContainsRankKey * WeightKey

Rank = ?( MaxQueryRank * WeightedSum ) / ( ( Σ[key=1 to n] ContainsRankKey^2 ) 

      + ( Σ[key=1 to n] WeightKey^2 ) - ( WeightedSum ) )


                      

FREETEXTTABLE 排名

FREETEXTTABLE 排名基于 OKAPI BM25 排名公式計(jì)算。FREETEXTTABLE 查詢將通過派生詞(原始查詢?cè)~的變形)向查詢中添加詞,這些詞將被作為單獨(dú)的、與派生出它們的詞沒有特殊聯(lián)系的詞來處理。同義詞庫功能派生出的同義詞將被當(dāng)作單獨(dú)的、具有同等加權(quán)值的詞來處理。查詢中的每個(gè)詞都會(huì)對(duì)排名產(chǎn)生影響。

復(fù)制代碼
                    Rank = Σ[Terms in Query] w ( ( ( k1 + 1 ) tf ) / ( K + tf ) ) * ( ( k3 + 1 ) qtf / ( k3 + qtf ) ) )

Where: 

w is the Robertson-Sparck Jones weight. 

In simplified form, w is defined as: 

w = log10 ( ( ( r + 0.5 ) * ( N – R + r + 0.5 ) ) / ( ( R – r + 0.5 ) * ( n – r + 0.5 ) )

N is the number of indexed rows for the property being queried. 

n is the number of rows containing the word. 

K is ( k1 * ( ( 1 – b ) + ( b * dl / avdl ) ) ). 

dl is the property length, in word occurrences. 

avdl is the average length of the property being queried, in word occurrences. 

k1, b, and k3 are the constants 1.2, 0.75, and 8.0, respectively. 

tf is the frequency of the word in the queried property in a specific row. 

qtf is the frequency of the term in the query. 
                  

全文索引 排名計(jì)算問題


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 91在线网站 | 99国产精品一区二区 | 神马影院我不卡手机版 | 久久99国产亚洲精品观看 | 在线精品国精品国产不卡 | 国产一区二区久久久 | 国产精品四虎在线观看免费 | 深夜福利网站在线观看 | 国产系列欧美系列日韩系列在线 | 视频一区国产精戏刘婷 | 亚洲欧美成人综合久久久 | 香蕉久人久人青草青草 | 亚洲黄色在线观看视频 | 伊人天伊人天天网综合视频 | 四虎影院免费在线播放 | 欧美亚洲国产日韩一区二区三区 | 五月婷婷综合激情 | 国产亚洲精品福利片 | xxx中国www免费 | 香蕉久久夜色精品国产小说 | 九九热视频在线免费观看 | 中文字幕在线视频一区 | 91在线视频免费看 | 成人99国产精品一级毛片 | 好好的日com欧美 | 快射影院| 亚洲成人伊人网 | 久久久久久人精品免费费看 | 亚洲欧美精品久久 | 91成人午夜性a一级毛片 | 亚洲欧美精品日韩欧美 | 日本人的色道www免费一区 | 婷婷久| www.黄网站| 久久精品免费全国观看国产 | 亚洲综合第一欧美日韩中文 | 视频一区欧美 | 欧美大尺度 边吃奶边做 | 99爱视频99爱在线观看免费 | 97久久精品国产成人影院 | 神马影院午夜剧场 |