抱歉,评论被关闭
Sphinx 配置文件说明
一. 创建sphinx.conf文件
其结构组成主要如下:
Source 源名称1{ //指定数据源
一些配置
}
Index 索引名称1{
Source=源名称1
}
Source 源名称2{
一些配置
}
Index 索引名称2{
Source=源名称2
}
Indexer{
mem_limit = 32M
}
Searchd{ //配置 searchd 守护程序本身
}
二. Source 源名称 相关配置说明
Type=数据库类型(Mysql 或SQL);
Sql_host= 数据库主机地址(如果是外网,请确保防火墙允许链接)
Sql_user= 数据库用户名
Sql_pass= 数据库密码
Sql_db= 数据库名称
Sql_port= 数据库端口
Sql_query_pre= 执行SQL前设置的编码 (SET NAMES UTF8)
Sql_query= 全文检索要显示的内容,据官方说法:尽可能不要使用WHERE或GROUPBY ,将其交给SPHINX效率会更高;select 出来的字段必须包含至少一个唯一主键,以及全文检索的字段 sphinx 会对SELECT 中的 字段1 ,字段2 建立sphinx自己的索引 及 在查询的字段中查找关键字
Sql_query_info=
SELECT * FROM Inventory WHERE id=$id 来查找匹配记录 在查询中,$id
被替换为 searchd 返回的每个主键 (调试是使用 建议注释此项)
Strip_html= 0/1 是否去掉HTML标签
Sql_attr_uint= 无符号整数属性,可以设置多个,设置数据库字段,设置哪个能显示出哪个字段数据的整形来.
三. Index中配置说明
Source= 数据源名称
Path = 索引记录存放目录,注:d:/sphinx/data/cg 这个的意思是 在data目录下创建一个名为cg的文件
min_word_len= 索引的词的最小长度 设为1 既可以搜索单个字节搜索,越小 索引越精确,但建立索引花费的时间越长
charset_type= utf-8/gbk 设置数据编码
charset_table= 字符表和大小写转换规则 .频繁应用于sphinx的分词过程
min_prefix_len = 最小前缀(0)
min_infix_len = 最小中缀(1)
ngram_len = 对于非字母型数据的长度切割(默认已字符和数字切割,设置1为按没个字母切割)
四. searchd配置说明
port= sphinx的端口(9312 与 searchd.exe监听结果一致)
log= 服务进程日志存放路径,一旦sphinx出现异常,基本上可以从这里查询有效信息
query_log= 客户端查询日志 尤为有用 它将在运行时显示每次搜索并显示结果
read_timeout= 请求超时(5)
max_children= 同时可执行的最大searchd 进程数(30)
pid_file= 进程ID文件
max_matches= 查询结果的最大返回数
seamless_rotate= 是否支持无缝切换,做增量索引时通常需要(0/1)
# 在启动运行时是否提前加载所有索引文件
preopen_indexes = 0
# 是否释放旧的索引文件
unlink_old = 1
# MVA跟新池大小(默认为1M)
mva_updates_pool = 1M
# 最大允许的网络包大小(默认8M)
max_packet_size = 8M
# 每个查询最大允许的过滤器数量(默认256)
max_filters = 256
#每个过滤器最大允许的值的个数(默认4096)
max_filter_values = 4096
# 每个组的最大查询数(默认为32)
max_batch_queries = 32
至此 spninx.conf 配置文件结束;注意:如果有换行 必须用反斜杠 \ 链接
参考文章:http://baobeituping.javaeye.com/blog/870354