Lucene的Field类型

    技术2022-05-11  95

    1.       2.0 以前的版本 Keyword: Field的值将被保存到索引文件,为Field的值建立索引,建立索引时不需要分词。 UnIndexed: Field的值将被保存到索引文件,不为Field的值建立索引,因此不能通过该Field搜索文档。 UnStored: Field的值不被保存到索引文件,将Field的值分词后建立索引 Text: Field的值分词后建立索引。如果参数为String值将被保存,为Reader值不被保存 2.       2.0 版本  用几个内部类的组合来区分Field的具体类型。 Store ²        COMPRESS: 压缩保存。用于长文本或二进制数据 ²        YES :保存 ²        NO :不保存 Index ²        NO :不 建索引 ²        TOKENIZED :分词, 建索引 ²        UN_TOKENIZED :不分词, 建索引 ²        NO_NORMS :不分词,建索引。但是 Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间 TermVector ²        NO 不保存term vectors ²        YES 保存term vectors。 ²        WITH_POSITIONS 保存term vectors。(保存值和token位置信息) ²        WITH_OFFSETS 保存term vectors。(保存值和Token的offset)WITH_POSITIONS_OFFSETS:保存term vectors。(保存值和token位置信息和Token的offset)  

    最新回复(0)