Lucene的Field类型

技术2022-05-11 124

1. 2.0 以前的版本 Keyword: Field的值将被保存到索引文件，为Field的值建立索引，建立索引时不需要分词。 UnIndexed: Field的值将被保存到索引文件，不为Field的值建立索引，因此不能通过该Field搜索文档。 UnStored: Field的值不被保存到索引文件，将Field的值分词后建立索引 Text: Field的值分词后建立索引。如果参数为String值将被保存，为Reader值不被保存 2. 2.0 版本用几个内部类的组合来区分Field的具体类型。 Store ² COMPRESS: 压缩保存。用于长文本或二进制数据 ² YES ：保存 ² NO ：不保存 Index ² NO ：不建索引 ² TOKENIZED ：分词，建索引 ² UN_TOKENIZED ：不分词，建索引 ² NO_NORMS ：不分词，建索引。但是 Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间 TermVector ² NO ：不保存term vectors ² YES ：保存term vectors。 ² WITH_POSITIONS ：保存term vectors。（保存值和token位置信息） ² WITH_OFFSETS ：保存term vectors。（保存值和Token的offset）WITH_POSITIONS_OFFSETS：保存term vectors。（保存值和token位置信息和Token的offset）

专利

最新回复(0)