MySQL下全文索引
一種特殊的索引,它會把某個數據表的某個數據列出現過的所有單詞生成一份清單。
alter table tablename add fulltext(column1,column2)只能在MyISAM數據表中創建
少于3個字符的單詞不會被包含在全文索引里,可以通過修改my.cnf修改選項
ft_min_word_len=3
重新啟動MySQL服務器,用
repair table tablename quick 為有關數據表重新生成全文索引
select * from tablename where match(column1,column2) against('word1 word2 word3')>0.001match … against 把column1,column2數據列中至少包含word1,word2,word3三個單詞之一的數據記錄查找到,在關鍵字match后的數據列必須跟創建全文索引的數據列相同,檢索詞不區分大小寫和先后順序,少于3個字符的單詞通常被忽略。match… against …表達式返回一個浮點數作為它本身的求值結果,這個數字反映了結果記錄與被檢索單詞的匹配程度。如果沒有匹配到任何記錄,或者匹配到的結果記錄太多反而被忽略,表達式將返回0,表達式>0.001的作用是排除match的返回值太小的結果記錄。
select *,match(column1,column2) against ('word1 word2 word3') as mtch from tablename having mtch>0.01 order by mtch desc limit 5找出最匹配的5條記錄,在where字句中不能使用假名,所以用having
?
布爾全文搜索的性能支持以下操作符:
- +word:一個前導的加號表示該單詞必須 出現在返回的每一行的開頭位置。
- -word: 一個前導的減號表示該單詞一定不能出現在任何返回的行中。
- (無操作符):在默認狀態下(當沒有指定 + 或–的情況下),該單詞可有可無,但含有該單詞的行等級較高。這和MATCH() … AGAINST()不使用IN BOOLEAN MODE修改程序時的運作很類似。
- > <這兩個操作符用來改變一個單詞對賦予某一行的相關值的影響。 > 操作符增強其影響,而 <操作符則減弱其影響。請參見下面的例子。
- ( )括號用來將單詞分成子表達式。括入括號的部分可以被嵌套。
- ~word:一個前導的代字號用作否定符, 用來否定單詞對該行相關性的影響。 這對于標記“noise(無用信息)”的單詞很有用。包含這類單詞的行較其它行等級低。
- word* :搜索以word開頭的單詞,只允許出現在單詞的末尾
- “word1 word” :給定單詞必須出現在數據記錄中,先后順序也必須匹配,區分字母大小寫
select * from tablename where match(column1,column2) against ('+word1 +word2 -word3' in boolean mode')布爾檢索只能返回1或者0,不再返回表示匹配程度的浮點數
全文索引的缺陷:
- 數據表越大,全文索引效果好,比較小的數據表會返回一些難以理解的結果。
- 全文檢索以整個單詞作為匹配對象,單詞變形(加上后綴,復數形式),就被認為另一個單詞。
- 只有由字母,數字,單引號,下劃線構成的字符串被認為是單詞,帶注音符號的字母仍是字母,像C++不再認為是單詞
- 不區分大小寫
- 只能在MyISAM上使用
- 全文索引創建速度慢,而且對有全文索引的各種數據修改操作也慢
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
