正排索引与倒排索引 女爷i 2022-11-03 10:53 243阅读 0赞 <table> <tbody> <tr> <td> <p>(1)</p> </td> <td> <p>Java是世界上最好的编程语言</p> </td> </tr> <tr> <td> <p>(2)</p> </td> <td> <p>学好Java 走遍世界都不怕</p> </td> </tr> <tr> <td> <p>(3)</p> </td> <td> <p>一入Java深似海</p> </td> </tr> </tbody> </table> 对于上面的三行记录,分别建立正排索引与倒排索引。 * **正排索引** 将一行记录叫做ducument,记录中的词语叫word。即ducument是由多个word组成。 正排索引是通过ducument查找到word,也就是可以查找某一行的ducument存在哪些word。 若将索引结构使用Map来表示,则Map中的key就是每一行ducument,使用编号代替。Map中的value则是对应的ducument中的word。 <table> <tbody> <tr> <td style="width:321px;"> <p>key</p> </td> <td> <p>value</p> </td> </tr> <tr> <td colspan="1" style="width:321px;"> <p>(1) Java是世界上最好的编程语言</p> </td> <td> <p>Java</p> </td> </tr> <tr> <td> <p>是</p> </td> </tr> <tr> <td> <p>世界上</p> </td> </tr> <tr> <td> <p>最好的</p> </td> </tr> <tr> <td> <p>编程</p> </td> </tr> <tr> <td> <p>语言</p> </td> </tr> </tbody> </table> <table> <tbody> <tr> <td style="width:320px;"> <p>key</p> </td> <td> <p>value</p> </td> </tr> <tr> <td colspan="1" style="width:320px;"> <p>(2) 学好Java 走遍世界都不怕</p> </td> <td> <p>学好</p> </td> </tr> <tr> <td> <p>Java</p> </td> </tr> <tr> <td> <p>走遍</p> </td> </tr> <tr> <td> <p>世界</p> </td> </tr> <tr> <td> <p>都</p> </td> </tr> <tr> <td> <p>不怕</p> </td> </tr> </tbody> </table> * **倒排索引** 与正排索引相反,倒排索引是根据word,找到含有该word的ducument。继续用Map来表示索引结构,则key是word,value记录该word在第几个ducument中第几个位置出现。 <table> <tbody> <tr> <td> <p>key</p> </td> <td> <p>value</p> </td> </tr> <tr> <td colspan="1"> <p>Java</p> </td> <td> <p>(1)1 (表示Java在编号(1)的 document在第1个位置)</p> </td> </tr> <tr> <td> <p>(2)2</p> </td> </tr> <tr> <td> <p>(3)3</p> </td> </tr> </tbody> </table> <table> <tbody> <tr> <td style="width:202px;"> <p>key</p> </td> <td> <p>value</p> </td> </tr> <tr> <td colspan="1" style="width:202px;"> <p>世界</p> </td> <td> <p>(1)3</p> </td> </tr> <tr> <td> <p>(2)4</p> </td> </tr> </tbody> </table>
相关 倒排索引 倒排索引的核心组成:(包含两个部分) 单词词典(Term Dictionary):记录所有文档的单词,记录单词到倒排列表的关联关系 单词词 Myth丶恋晨/ 2023年07月03日 03:21/ 0 赞/ 26 阅读
相关 深入理解正排索引与倒排索引(设计思想和数据结构) 在了解倒排索引之前,我们需要先了解下正排索引 正排索引(foward index): 正排索引也称为"前向索引"。它是创建倒排索引的基础,通过文档到关键字(doc->w た 入场券/ 2023年02月13日 11:54/ 0 赞/ 123 阅读
相关 正排索引和倒排索引理解详解 正排索引和倒排索引理解详解 一、正排索引 二、 倒排索引 三、为什么搜索引擎选用倒排索引? 四、倒排索引优点 古城微笑少年丶/ 2022年12月08日 05:17/ 0 赞/ 182 阅读
相关 正排索引与倒排索引 <table> <tbody> <tr> <td> <p>(1)</p> </td> <td> <p>Java是世界上最好的编程语言</p> </td 女爷i/ 2022年11月03日 10:53/ 0 赞/ 244 阅读
相关 倒排索引 倒排索引是 es 中非常重要的索引结构,是从文档词项到文档 ID 的一个映射过程。 8.1 "正排索引" 我们在关系型数据库中见到的索引,就是“正排索引”。 8.2 灰太狼/ 2022年10月31日 14:59/ 0 赞/ 221 阅读
相关 倒排索引 1.什么是倒排索引 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是 ╰半夏微凉°/ 2022年08月27日 11:42/ 0 赞/ 289 阅读
相关 倒排索引 倒排索引简单地就是:根据单词,返回它在哪个文件中出现过,而且频率是多少的结果。这就像百度里的搜索,你输入一个关键字,那么百度引擎就迅速的在它的服务器里找到有该关键字的文件,并根 我不是女神ヾ/ 2022年07月30日 13:25/ 0 赞/ 259 阅读
相关 倒排索引 创建两个文件数据,并上传到hdfs data file edit file file view search data2 abc - 日理万妓/ 2022年06月06日 04:41/ 0 赞/ 347 阅读
相关 倒排索引 1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾 我不是女神ヾ/ 2022年05月22日 06:47/ 0 赞/ 319 阅读
相关 倒排索引 倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的... 小灰灰/ 2020年05月01日 19:45/ 0 赞/ 922 阅读
还没有评论,来说两句吧...