0

2

回答

191 瀏覽

求教,關于Lucene的一些解決方案[已解決]30

最近公司要做全文檢索,選擇了Lucene,研究了下,能夠實現基本的創建索引及檢索功能。不過在學習的過程中運到些問題,求大神指教。主要是求解一些解決思路。 1.是不是要將文章內容存儲起來?如果將文章內容存儲了,是不是影響效率 2.如果要做高亮顯示,是不是必須將文章內容存儲 3.有好的分頁查詢思路嗎,看到網上提供的方案都是先把符合條件的數據都查詢出來,然后只返回查詢出的部分數據,以此來實現分頁功能 4. ...

2014年12月04日 16:40
0

0

回答

348 瀏覽

有搜索引擎和非結構化數據挖掘的同行嗎?[已解決]5

我有個朋友,現在國外的石油行業工作,他想做一個基于文件的企業搜索引擎,同時還想對大量有關鉆井的非結構化數據進行數據挖掘。不知有沒有高手愿意合作?他想找的是技術合伙人,全職兼職均可。如果您有興趣和時間,請和我聯系。我將我將提供更多的技術細節。多謝!

2014年11月18日 13:34
0

0

回答

246 瀏覽

solr3.5整合mmseg4j報錯,等求大神幫忙![已解決]5

java.lang.ClassNotFundException:org.apache.solr.util.plugin.solr ResourceLoaderAware solr-core.jar是在solr.war里面的。整合mmseg4j中文分詞報錯。 配置是按照網上的文章配的,沒整前solr可以啟動,整后卻一直報這個錯誤,但是mmseg4j的jar和配置應該都沒問題。搞不明白,大家指指路!謝謝 ...

2014年11月12日 15:36
0

1

回答

1685 瀏覽

lucene 實例創建及實時索引[已解決]0

public class LuceneFactory { // song索引 private static IndexReader songReader = null; private static IndexSearcher songSearcher = null; private static Directory songDirectory = null; private static ...

2014年10月23日 10:08
0

1

回答

1095 瀏覽

請教一下lucene4.x下精確與模糊組合查詢怎么寫?[已解決]5

剛剛接觸lucene,用的是最新版的4.10.我現在有個這樣的需求。 人員總共有兩組,A、B組。 在設計索引時將A、B組的ID也保存了。 我現在想A組的人只能搜A組的內容。 實現思路是: 通過組ID精確定位到某個組,然后使用關鍵字模糊搜素這個組內的所有內容。 lucene小白一個,還請大家多多指教。

2014年10月19日 12:24
0

3

回答

3442 瀏覽

solr分頁查詢很慢,不知道什么原因[已解決]5

項目中使用solr做列表頁分頁搜索 數據量大概在二十幾萬數據,應該不算大 但不知道什么原因 前面頁碼的時候還挺快,但越往后速度越慢,翻到二十萬數據的時候非常慢,大概二十多秒才能出結果,甚至更慢,不帶條件查詢也是這樣 現在沒有頭緒,請問這可能是什么原因導致的呢? INFO - 2014-08-22 17:59:41.747; org.apache.solr.core.SolrCore; [proper ...

2014年8月22日 18:16
0

0

回答

187 瀏覽

solr中schema.xml中定義fieldType 中的docValuesFormat和postingsFormat屬性怎么用[已解決]3

最近剛接觸solr,看到在solr中schema.xml中定義fieldType 中的docValuesFormat和postingsFormat屬性,通過查看也不知道具體怎么用,該用在什么場景下,有了解的給解釋一下這兩個屬性,最好給舉一個例子或代碼示例。

2014年7月07日 11:12
0

0

回答

345 瀏覽

Lucene2.4.1 + compass2.2.0 + spring3mvc + jpa compassGps索引不同步[已解決]10

1.persistence.xml <persistence-unit name="test" transaction-type="RESOURCE_LOCAL"> <provider>org.hibernate.ejb.HibernatePersistence</provider> <properties> ...

2014年7月05日 11:24
0

1

回答

3377 瀏覽

通過solrj查詢solr 如何取消默認查詢總數10條的限制[已解決]10

如題。。。

2014年6月24日 17:22
1

3

回答

1366 瀏覽

Lucene4.0索引的效率問題[已解決]10

最近用Lucene4.0做全文檢索:公司大約有700GB左右的文件,格式有PDF、word、ppt、圖片及其它等等,文件數量大約在70萬個左右。我用多線程調用Tika來解析文件,解析后的文本文件寫入本地磁盤,耗時大概1-2天的樣子;然后用Lucene4.0對做索引,索引代碼如下: Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_40); ...

2014年6月16日 16:33
0

3

回答

1083 瀏覽

如何向solr服務器提交大日志文件[已解決]5

現在公司有個項目對日志文件進行全文檢索,準備用solr完成。現在遇到一個問題,由于日志的文件比較大,一般10幾兆,大的已經達到幾百兆了。我們將日志的內容設置為content字段,類型為string,但是當我們將documnet提交到server的時候,就報OOM的錯誤,請問如何解決該問題?

2014年6月13日 11:20
0

2

回答

4308 瀏覽

hadoop中hdfs-site.xml配置的問題[已解決]0

我在hdfs-site.xml中是這樣配置的: <configuration> <property> <name>dfs.name.dir</name> <value>/home/hadoop/tamp</value> </property> <property> <name>df ...

2014年5月30日 09:10
0

1

回答

2047 瀏覽

hadoop配置了NodeData,但是管理界面卻顯示0個NodeData[已解決]5

安裝了一臺Master和一臺salve 啟動后的兩臺機器的JPS都是可看到進程的,但是在管理頁面上卻是0個Nodedata 基本配置如下: 1.core-site.xml <configuration> <property> <name>hadoop.tmp.dir</name> <value>/usr/hadoop/tmp</ ...

2014年5月29日 08:43
0

1

回答

571 瀏覽

Solr配置Blob字段報錯[已解決]5

SOLR通過dataimport導入oracle數據庫數據建立索引,表中含有blob類型的字段,在solrconfig.xml中配置了dataimport請求,data-config.xml文件配置見“data-config.zip”附件,啟動solr運行,報“java.lang.RuntimeException: unsupported type : class java.lang.String” ...

2014年5月21日 15:37
0

5

回答

3892 瀏覽

solr4.7數據導入問題[已解決]30

本人剛解除solr,測試從oracle導入數據,總得到如下信息: Indexing completed. Added/Updated: 0 documents. Deleted 0 documents. Requests: 1, Fetched: 4, Skipped: 0, Processed: 0 Started: 6 minutes ago 添加的索引條數總為0,但實際獲取到數據為4條,不知是 ...

2014年5月08日 11:50
0

0

回答

175 瀏覽

elasticsearch[已解決]0

ES里面的將數據分為工作數據和持久化數據兩種,工作數據可以都放在內存中,這樣可以保證非常好的性能,es默認是先把索引存放到內存中,當內存滿了時再持久化到本地硬盤,ES節點間的數據會定時刷新和同步,那這個時間點在何時回執行?可以更改這個時間點嗎?

2014年5月07日 11:40
0

3

回答

1102 瀏覽

Lucene如何索引巨大的PDF文件?[已解決]5

我想用Lucene對一個529G大小的PDF文件進行索引,開始使用Tika1.5,異常為: TIKA-198: Illegal IOException from [email protected] org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:248) org. ...

2014年5月06日 14:41
0

2

回答

1279 瀏覽

學習lucene建立檢索和搜索過程中遇到的錯誤[已解決]30

使用lucene4.6.0版本建立的索引和搜索,在創建索引后會產生如下索引文件 [img] [/img] 但是在搜索時 ScoreDoc[] sds = tds.scoreDocs; 中的sds總為空。求大神幫忙解決!!!!!!! 代碼如下: package nhky.bs.lucene.test.hellolucene; import java.io.File; import java.io.F ...

2014年4月24日 17:52
0

2

回答

330 瀏覽

關于先在Lucene搜索電影對象,然后用in在數據庫中查找喜歡電影的人,分頁該怎么辦?[已解決]5

查詢是這樣的 首先先在Lucene中查找相關電影的信息,得到電影的記錄id, 然后再到數據庫中用in(1,2,3,...n),查找喜歡這些電影的用戶,得到用戶的記錄 現在我要做分頁,該以什么標準來分呢?由于2個查詢的總記錄數不一樣,我是把pageNum傳給lucene還是數據庫呢,有沒有高手遇到了這類問題,謝謝

2014年3月19日 22:24
0

0

回答

210 瀏覽

lucene分布式搜索[已解決]10

想將lucene和hadoop結合,新手入門有點茫然,不知哪位可以提供點學習資料,萬分感謝!!!!

2014年3月19日 15:26

本周活躍投票用戶

最新評論

Global site tag (gtag.js) - Google Analytics 开心农场种蔬菜赚钱 新牛人配资 理财平台关闭后储户的钱怎么办 谁有加拿大28的网址 江苏十一选五预测 重庆幸运农场免费计划网址 广东十一选五遗漏 龙江p62开奖结果 pk10大小预测软件下载 吉林十一选五任六多少钱 自行车赛车图片和价钱 真钱在线手机棋牌 股票推荐3只黑马 河北快三技巧 体彩大乐透预测下一期 快乐十分 22选5最新开奖结果查询