<?xml version="1.0"?>
<rss version="2.0">
<channel>
  <title>午夜咖啡 - 搜索引擎 category</title>
  <link>http://jolestar.com/categories/search-engine/</link>
  <description>jolestar&#039;s blog, 放羊娃王老五的博客</description>
  <language>zh</language>
  <copyright>jolestar</copyright>
  <lastBuildDate>Mon, 30 Nov 2009 05:17:00 GMT</lastBuildDate>
  <generator>Pebble (http://pebble.sourceforge.net)</generator>
  <docs>http://backend.userland.com/rss</docs>
  
  
  <item>
    <title>搜索引擎URI编码的处理</title>
    <link>http://jolestar.com/2009/04/13/1239564120000.html</link>
    
      
      
        <description>
          &lt;p&gt;做一个站内搜索遇到一个问题:&lt;/p&gt;
&lt;p&gt;网站全站使用的是UTF-8编码，所以get请求的URL也用UTF-8编码，服务器端用UTF-8解码。这种情况下，用户直接在表单里输入提交过 来搜索，是没有问题的。但如果用户直接在浏览器地址栏里把关键词给改了，提交过来，或者从浏览器地址栏的下拉提示列表里点击过来，URL编码就不确定了。 这个和操作系统语言以及浏览器相关。&lt;/p&gt;
&lt;p&gt;本文研究了一下google.cn是如何做到同时兼容gb2312和utf-8两种url编码的。虽然解决方法不是很巧妙，但也能完成一般需求。&lt;/p&gt;&lt;p&gt;&lt;a href=&#034;http://jolestar.com/2009/04/13/1239564120000.html&#034;&gt;阅读全文...&lt;/a&gt;&lt;/p&gt;
        </description>
      
    
    
    
    <category>搜索引擎</category>
    
    <comments>http://jolestar.com/2009/04/13/1239564120000.html#comments</comments>
    <guid isPermaLink="true">http://jolestar.com/2009/04/13/1239564120000.html</guid>
    <pubDate>Sun, 12 Apr 2009 19:22:00 GMT</pubDate>
  </item>
  
  <item>
    <title>Lucene范围查询(RangeQuery)的几个问题</title>
    <link>http://jolestar.com/2008/12/04/1228331400000.html</link>
    
      
        <description>
          &lt;p&gt;对要进行范围查询(RangeQuery)的字段 创建索引的时候要按照 储存 不分词 的方式创建索引。&lt;/p&gt;
&lt;p&gt;new Field(name, value, Field.Store.YES, Field.Index.UN_TOKENIZED);
&lt;/p&gt;
&lt;p&gt;1.数字的范围查询&lt;/p&gt;
&lt;p&gt;对数字进行范围查询，必须先把数字格式化为一样长度的字符串。位数不够的在前面补零。&lt;/p&gt;
&lt;p&gt;如:
&lt;pre name=&#034;code&#034; class=&#034;brush:java&#034;&gt;NumberFormat format = NumberFormat.getIntegerInstance();
//设置数字的位数 由实际情况的最大数字决定
format.setMinimumIntegerDigits(6);
//是否按每三位隔开,如:1234567 将被格式化为 1,234,567。在这里选择 否
format.setGroupingUsed(false); 

format.format(number);


&lt;/pre&gt;
&amp;nbsp;&lt;/p&gt;
&lt;p&gt;这样 1 将被格式化为 000001&lt;/p&gt;
&lt;p&gt;查询的时候也必须补零。&lt;/p&gt;
&lt;p&gt;查询语法: fieldName:[000001 TO 000100] &lt;/p&gt;
&lt;p&gt;演示:&lt;a href=&#034;http://so.1ting.com/singer.do?q=singerIdRange%3A%5B000001+TO+000100%5D&amp;amp;amp;sort=singerId&#034; target=&#034;_blank&#034;&gt;http://so.1ting.com/singer.do?q=singerIdRange%3A[000001+TO+000100]&amp;amp;sort=singerId&lt;/a&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;2:日期范围查询 &lt;/p&gt;
&lt;p&gt;日期范围查询必须需要用lucene的时间转换工具类(&lt;a href=&#034;http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/document/DateTools.html&#034; target=&#034;_blank&#034;&gt;DateTools&lt;/a&gt;
)的&lt;span&gt;
&lt;/span&gt;
&lt;/p&gt;
&lt;p&gt;&lt;span&gt;&lt;code&gt;static&amp;nbsp;String&lt;/code&gt;
&lt;/span&gt;
&lt;code&gt;&lt;strong&gt;dateToString&lt;/strong&gt;
(Date&amp;nbsp;date,
             DateTools.Resolution&amp;nbsp;resolution)&lt;/code&gt;
方法
，先把时间转换为字符串进行索引。&lt;/p&gt;
&lt;p&gt;查询语法: &lt;tt&gt;date:[6/1/2005 TO 6/4/2005]&lt;/tt&gt;
&lt;/p&gt;
&lt;p&gt;还可以overwrites
 &lt;code&gt;QueryParser类的getRangeQuery(String, String, String, boolean)方法实现自定义的范围搜索。&lt;/code&gt;
&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;
&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;b&gt;Related Posts&lt;/b&gt;&lt;br/&gt;&lt;a href=&#034;http://jolestar.com/2009/06/18/1245332724302.html&#034;&gt;Null Object 模式之我见&lt;/a&gt;&lt;br/&gt;&lt;a href=&#034;http://jolestar.com/2009/05/31/1243752060000.html&#034;&gt;JDK 6 Update 14内置VisualVM 1.1.1&lt;/a&gt;&lt;br/&gt;&lt;a href=&#034;http://jolestar.com/2008/09/22/1222025640000.html&#034;&gt;ActiveMQ的一个问题&lt;/a&gt;&lt;br/&gt;&lt;a href=&#034;http://jolestar.com/2008/07/30/1217358000000.html&#034;&gt;四个有害的java习惯&lt;/a&gt;&lt;br/&gt;&lt;a href=&#034;http://jolestar.com/2008/03/29/1206729180000.html&#034;&gt;一个纯java的H.264播放器--Onavia Video Player&lt;/a&gt;&lt;br/&gt;&lt;a href=&#034;http://jolestar.com/2007/07/14/1184412420000.html&#034;&gt;配置了一下memcached&lt;/a&gt;&lt;br/&gt;&lt;/p&gt;&lt;br/&gt;
        </description>
      
      
    
    
    
    <category>搜索引擎</category>
    
    <comments>http://jolestar.com/2008/12/04/1228331400000.html#comments</comments>
    <guid isPermaLink="true">http://jolestar.com/2008/12/04/1228331400000.html</guid>
    <pubDate>Wed, 03 Dec 2008 19:10:00 GMT</pubDate>
  </item>
  
  <item>
    <title>ThesaurusAnalyzer</title>
    <link>http://jolestar.com/2007/05/10/1178795040000.html</link>
    
      
      
        <description>
          &lt;p&gt;一个基于词库的中文分词程序&lt;/p&gt;&lt;p&gt;&lt;a href=&#034;http://jolestar.com/2007/05/10/1178795040000.html&#034;&gt;阅读全文...&lt;/a&gt;&lt;/p&gt;
        </description>
      
    
    
    
    <category>搜索引擎</category>
    
    <category>java</category>
    
    <comments>http://jolestar.com/2007/05/10/1178795040000.html#comments</comments>
    <guid isPermaLink="true">http://jolestar.com/2007/05/10/1178795040000.html</guid>
    <pubDate>Thu, 10 May 2007 11:04:00 GMT</pubDate>
  </item>
  
  </channel>
</rss>
