Sphinx 配置文件说明

分类：Sphinx ｜作者：凹凸曼｜发表于2011/03/14 已关闭评论

一. 创建sphinx.conf文件

其结构组成主要如下:

Source 源名称1{ //指定数据源

一些配置

}

Index 索引名称1{

Source=源名称1

}

Source 源名称2{

一些配置

}

Index 索引名称2{

Source=源名称2

}

Indexer{

mem_limit = 32M

}

Searchd{ //配置 searchd 守护程序本身

}

二. Source 源名称相关配置说明

Type=数据库类型(Mysql 或SQL);

Sql_host= 数据库主机地址(如果是外网,请确保防火墙允许链接)

Sql_user= 数据库用户名

Sql_pass= 数据库密码

Sql_db= 数据库名称

Sql_port= 数据库端口

Sql_query_pre= 执行SQL前设置的编码 (SET NAMES UTF8)

Sql_query= 全文检索要显示的内容,据官方说法:尽可能不要使用WHERE或GROUPBY ,将其交给SPHINX效率会更高;select 出来的字段必须包含至少一个唯一主键,以及全文检索的字段 sphinx 会对SELECT 中的字段1 ,字段2 建立sphinx自己的索引及在查询的字段中查找关键字

Sql_query_info= SELECT * FROM Inventory WHERE id=$id  来查找匹配记录 在查询中，$id 被替换为 searchd 返回的每个主键 (调试是使用 建议注释此项)

Strip_html= 0/1 是否去掉HTML标签

Sql_attr_uint= 无符号整数属性,可以设置多个,设置数据库字段,设置哪个能显示出哪个字段数据的整形来.

三. Index中配置说明

Source= 数据源名称

Path = 索引记录存放目录,注:d:/sphinx/data/cg 这个的意思是在data目录下创建一个名为cg的文件

min_word_len= 索引的词的最小长度设为1 既可以搜索单个字节搜索,越小索引越精确,但建立索引花费的时间越长

charset_type= utf-8/gbk 设置数据编码

charset_table= 字符表和大小写转换规则 .频繁应用于sphinx的分词过程

min_prefix_len = 最小前缀(0)

min_infix_len = 最小中缀(1)

ngram_len = 对于非字母型数据的长度切割(默认已字符和数字切割,设置1为按没个字母切割)

四. searchd配置说明

port= sphinx的端口(9312 与 searchd.exe监听结果一致)

log= 服务进程日志存放路径，一旦sphinx出现异常，基本上可以从这里查询有效信息

query_log= 客户端查询日志尤为有用它将在运行时显示每次搜索并显示结果

read_timeout= 请求超时(5)

max_children= 同时可执行的最大searchd 进程数(30)

pid_file= 进程ID文件

max_matches= 查询结果的最大返回数

seamless_rotate= 是否支持无缝切换，做增量索引时通常需要(0/1)

# 在启动运行时是否提前加载所有索引文件
preopen_indexes = 0

# 是否释放旧的索引文件
unlink_old = 1

# MVA跟新池大小(默认为1M)
mva_updates_pool = 1M

# 最大允许的网络包大小(默认8M)
max_packet_size = 8M

# 每个查询最大允许的过滤器数量(默认256)
max_filters = 256

#每个过滤器最大允许的值的个数(默认4096)
max_filter_values = 4096

# 每个组的最大查询数(默认为32)
max_batch_queries = 32

至此 spninx.conf 配置文件结束;注意:如果有换行必须用反斜杠 \ 链接

参考文章：http://baobeituping.javaeye.com/blog/870354

Tag： Sphinx 配置

日志信息 »

该日志于2011-03-14 03:32由凹凸曼发表在Sphinx分类下，评论已关闭。

目前盖楼

抱歉，评论被关闭

« Sphinx配置过程及使用 Sphinx 编译的问题及解决办法（sphinxclient.c:1358: error: ‘SO_NOSIGPIPE’ undeclared） »

Sphinx 配置文件说明

日志信息 »

搜索文章

日志分类

最新发布