Lucene保存了从Index到Segment到Document到Filed到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他Lucene特有的信息。
1.正向信息
Index->Segments(segments.gen,segments_N) ->Field(fnm,fdx,fdt)->Term(tvx,tvd,tvf)
详情...
2011-12-30
我都项目是webform和mvc混合的,首页是根目录下的Default.aspx,但是在配置路由的时候有个默认路由,那个不知道怎么指向Default.asx,所以暂时就用Controller里的Index action来处理的了。
public ActionResult Index()
{
Server.Transfer("Default.aspx");
return View();
}
这样就可以用Default.aspx这个webform页面了
详情...
2011-12-30
运行 inetmgr,打开iis管理器,mark一下,要不又忘了
详情...
2011-12-28
1.前缀后缀规则(Prefix+Suffix):即当某个词和前一个词有共同的前缀时候,后面的词仅保存前缀在词中的偏移(offset)及前缀后面的词(Suffix)。
详情...
2011-12-28
Lucene索引文件中的基本数据类型:
Byte:最基本的类型,长8位(bit)。
UInt32:由四个Byte组成。
UInt64:由8个Byte组成。
VInt:
可变长度的整数类型,可能包含多个Byte,对于每个Byte的8位,其中后7位表示数值,最高一位表示是否还有另一个Byte,0表示没有,1表示有。
越前面的Byte表示数值的低位,越后面的Byte表示数值的高位。
例如130的二进制是1000,0010,总共需要8位,一个Byte表示不了,需要两个Byte来表示,第一个Byte表示后7位,并且在最高位置1来表示后面还有一个Byte,所以第一个Byte为10000010,第二个Byte表示第8位,并且最高位置0来表示后面没有其他的Byte了,第二个Byte为00000001,所以130的表示为10000010,00000001。
Chars:是UTF-8编码的一系列Byte。
String:一个字符串首先是通过VInt来表示此字符串中包含的字符的个数,接着便是UTF-8编码的字符序列Chars。
详情...
2011-12-27
windows 2003 PowerShell 2.0 安装地址
详情...
2011-12-26
索引过程:将倒排序的表写成文件格式的过程
搜索过程:读出索引信息,然后计算每篇文章的搜索权重过程
详情...