PostgreSQL 文本搜索功能的当前限制为
每个词元的长度小于 2 KB
tsvector
的长度(词元 + 位置)必须小于 1 兆字节
词元的数量必须小于 2 ^ 64
tsvector
中的位置值必须大于 0,不大于 16383
<
(紧跟)N
>tsquery
算符在匹配距离中不大于 16384
每个词元最多有 256 个位置
tsquery
中节点(词元 + 算符)的数量必须小于 32768
PostgreSQL 8.1 文档包含 10441 个唯一单词,总计 335420 个单词,其中出现频率最高的单词 “postgresql” 在 655 个文档中被提及 6127 次。
另一个例子——PostgreSQL 邮件列表存档包含 910989 个唯一单词,在 461020 条消息中包含 57491343 个词元。