MongoDB - 按字符串搜索GridFS文件内容

我打算使用GridFS在MongoDB中上传用户的word文档。 我必须实现以下功能。</ p>

当管理员输入字符串并在管理应用程序中点击搜索时,我必须列出内容包含搜索字符串的所有word文档。 我必须搜索所有用户的文档。 </ p>

有没有办法在MongoDB中实现这一目标? 如果没有,实现这一目标的最佳方法是什么?</ p>
</ div>

展开原文

原文

I am planning to upload user's word documents in MongoDB using GridFS. I have to implement following functionality.

When admin type a string and hit search in administration app, i have to list all word documents where the contents contain the search string. I have to search across all user's documents.

Is there a way to achieve this in MongoDB? If not, what is the best way to achieve this?

dongyuelian9602
dongyuelian9602 我认为使用搜索工具会更好-例如弹性搜索,而不是直接使用mongo。
大约 7 年之前 回复
dousha1873
dousha1873 您是否可以提取文本并将其保留在引用GridFS文档的文本搜索索引属性中?
大约 7 年之前 回复
duaiwo9093
duaiwo9093 是。我想搜索文件内容。如果它的内容匹配,我必须列出该文件名。
大约 7 年之前 回复

1个回答



在MongoDB中,您可以做的最好的是搜索短语与GridFS中的内容的二进制匹配,但在Word文档中,您可能会 找不到这个短语,因为它很可能被压缩了。</ p>

我认为使用像Solr这样的专用搜索解决方案会好得多。 Solr甚至允许您从Word文档中提取文本,并允许您使用完全相同的搜索语言搜索任何类型的短语。 有关处理Word的 http://wiki.apache.org/solr/ExtractingRequestHandler ,请参阅 文件fe </ p>
</ div>

展开原文

原文

In MongoDB the best you can do is a binary match of your search phrase against the contents in GridFS, but in Word documents you will probably not find this phrase as it's likely compressed.

I think you would be much better off using a dedicated search solution such as Solr. Solr even allows you to extract text from Word documents and allows you to search for any sort of phrase in a quite complete search language. Have a look at http://wiki.apache.org/solr/ExtractingRequestHandler for dealing with Word documents f.e.

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐