Lucene.net是.net环境中比较强的全文检索工具,它是从JAVA中转过来的,.net版本的lucene在功能上也豪不逊色于java版的lucene。今天主要来说一下lucene索引文件在更新时的一些方式。
松北网站制作公司哪家好,找创新互联建站!从网页设计、网站建设、微信开发、APP开发、响应式网站设计等网站项目制作,到程序开发,运营维护。创新互联建站成立与2013年到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联建站。
一、整个索引文件 (cfs文件)覆盖更新;优点:简单,缺点:与服务器没有交互,但在生成索引文件时对IO影响比较大,前台lucene信息显示与数据库不同步。
二、索引文件按需要更新(对document记录进行curd操作),优点:与数据库同步,缺点:与服务器交互多,对于curd的安全性要重视起来,但这样做是必须的。
下面主要说一下第二种索引文件按需要更新的情况:
追加document(记录):当数据库表中有insert操作时,这时lucene也应该进行相应的insert操作,这就是追加,在IndexWriter中有AddDocument方法,它没什么好说的,按着方法签名转值即可,注意操作完成后要对IndexWriter进行Optimize和Close
- [WebMethod]
- public int AppendLuceneDocument(string primaryKey, string id, string name, string info, string categoryName, string propertyName, string module, string passKey)
- {
- int flag = 0;
- try
- {
- dirInfo = Directory.CreateDirectory(this.GetIndexPath(ConfigurationManager.AppSettings[module]));
- directory = LuceneIO.FSDirectory.Open(dirInfo);
- IndexWriter writer = new IndexWriter(directory, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29), false, IndexWriter.MaxFieldLength.UNLIMITED);
- Document doc = new Document();
- doc.Add(new Field("PrimaryKey", primaryKey, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("ID", id, Field.Store.YES, Field.Index.NO));
- doc.Add(new Field("Name", name, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("Info", info, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("CategoryName", categoryName, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("PropertyName", propertyName, Field.Store.YES, Field.Index.ANALYZED));
- writer.AddDocument(doc);
- writer.Optimize();
- writer.Close();
- flag = 1;
- }
- catch (Exception)
- {
- throw;
- }
- return flag;
- }
删除记录(document):这个操作需要我们注意几点:
1、要删除的记录的依据应该具有唯一性,这样删除才有意义,并且这个字段在lucene存储时需要是ANALYZED,即可以被检索到
2、删除时的条件***使用Query,而不要使用Term,我做过很多测试,结果证明Term条件总是不要使。
对于删除的代码如下:
- [WebMethod]
- public int DeleteLuceneDocument(string primaryKey, string module, string passKey)
- {
- int flag = 0;
- try
- {
- dirInfo = Directory.CreateDirectory(this.GetIndexPath(ConfigurationManager.AppSettings[module]));
- directory = LuceneIO.FSDirectory.Open(dirInfo);
- IndexWriter writer = new IndexWriter(directory, standardAnalyzer, false, IndexWriter.MaxFieldLength.UNLIMITED);
- QueryParser parser = new QueryParser(Lucene.Net.Util.Version.LUCENE_29, "PrimaryKey", new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29));
- Query query = parser.Parse(primaryKey);
- writer.DeleteDocuments(query);
- writer.Commit();
- writer.Optimize();
- writer.Close();
- flag = 1;
- }
- catch (Exception)
- {
- throw;
- }
- return flag;
- }
而更新操作事实上就是先把记录删除,再追加一条新的记录即可,而IndexWriter为我们提供的UpdateDocuments感觉更向是在复制一个,所以不建议使用它,
而是手动删除和追加来完成这个update操作。
- [WebMethod]
- public int UpdateLuceneDocument(string primaryKey, string id, string name, string info, string categoryName, string propertyName, string module, string passKey)
- {
- int flag = 0;
- try
- {
- dirInfo = Directory.CreateDirectory(this.GetIndexPath(ConfigurationManager.AppSettings[module]));
- directory = LuceneIO.FSDirectory.Open(dirInfo);
- IndexWriter writer = new IndexWriter(directory, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29), false, IndexWriter.MaxFieldLength.UNLIMITED);
- Document doc = new Document();
- doc.Add(new Field("PrimaryKey", primaryKey, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("ID", id, Field.Store.YES, Field.Index.NO));
- doc.Add(new Field("Name", name, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("Info", info, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("CategoryName", categoryName, Field.Store.YES, Field.Index.ANALYZED));
- doc.Add(new Field("PropertyName", propertyName, Field.Store.YES, Field.Index.ANALYZED));
- QueryParser parser = new QueryParser(Lucene.Net.Util.Version.LUCENE_29, "PrimaryKey", new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29));
- Query query = parser.Parse(primaryKey);
- writer.DeleteDocuments(query);
- writer.Commit();
- writer.AddDocument(doc);
- writer.Optimize();
- writer.Close();
- flag = 1;
- }
- catch (Exception)
- {
- throw;
- }
- return flag;
- }
OK,这就是对索引文件进行按需的操作,以后我会把我的lucene架构整理成文章,供大家讨论。
原文链接:http://www.cnblogs.com/lori/archive/2012/08/24/2654275.html
网页标题:Lucene中对document的CURD操作:为分布式全文检索设计
标题网址:http://www.mswzjz.cn/qtweb/news0/30050.html
攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能