全文检索产品主要面向客户和应用领域:
主要面向客户: 系统集成商、档案管理、知识库、协同办公平台及其生产厂商;图书馆、金融、通信、专利行业等大数据量客户;大型企业搜索用户;大中型门户网站、电子商务网站客户
应用领域: 网站、网站群的站内搜索;企业应用系统及企业门户的数据集成;企业内部ERP、MIS系统的数据整合;档案、图书馆、专利平台的数据检索;在金融、通信、公安行业的大数据量下的相关应用。
产品描述
XDFullsearch是线点科技于2005年即开始研发的一个强大的,高性能的JAVA企业级搜索引擎产品,在线点的企业级搜索平台上,你可以搜索出你企业所有相关的内容包括网站、邮箱、ECM, CRM。XDFullsearch使用一种新的模式来实现分布式和集群功能,通过扩展计算能力,能够支持上千G文档,完成复杂的并行运算,提高系统的可用性。它支持超过15种语言的多语言搜索,能够集成文档自动分类和聚类功能。可以通过采集器为索引库定制数据来源,采集器通过插件的方式扩展。默认提供数据库、邮件、本地文件系统、网络文件系统、FTP、Domino、各类数据库、Access的采集器。XDFullsearch通过作业调度系统实现了任务的自动化采集、能够增量索引,支持数据更新,能够通过可视化的方式对索引字段进行管理。XDFullsearch能够很容易的集成Hadoop和HBase。此外它还开发多种编程语言的API包括:JSP、PHP、Java、Python、C#等等。
在六年的产品销售和完善过程中,XDFullsearch可以在各种复杂的网络和应用环境中工作,当前,XDFullsearch在国内的装机量已经达到了5000台服务器以上,总数据量在20PB(1PB=1000T)以上,有20家以上世界五百强客户,有2000家以上企业/政府客户选择使用线点的XDFullsearch产品。
相关链接: 产品概述 产品架构 功能介绍
功能及特点:
1. 多操作系统、多平台、多数据库支持
本产品支持的操作系统、应用服务器、数据库如下:
操作系统 Windows
Linux
Unix
应用服务器 Tomcat
Weblogic
Websphere
Resin
Apache
IIS
数据库 Mysql、Sql Server、Oracle、DB2、达梦数据库、人大金仓、其它……
其它必备环境 JDK1.5 以上版本
2. 支持多数据源检索
除了基于数据库的搜索以外,线点科技全文检索产品还支持文件检索方式,可以通过指定文件所在目录进行高效检索,并内置文件解析器,可对PDF、WORD、HTML、TXT多种文件格式自动解析。同时根据用户需要产品也支持从其它各类数据源获取要检索的数据内容,例如:XML文件、其它数据池等等。即使在同一个应用中,也可以通过配置同时从多个数据源获取数据并提供检索服务。
3. 智能化的检索服务
线点科技全文检索产品在全文检索过程中采用相关智能技术以达到迅速、准确、全面定位目标信息。例如采用相关度分析技术,使相关度较高的结果排在结果列表的前面,相关度较低的结果排在后面,并屏蔽无用和错误的信息;构造强大的语义规则库,使系统能够正确地判断与检索词相关的同义词、近似词、上位词、下位词,帮助用户判断结果的相关度,并进行进一步的查询;支持完善的信息分类体系,对检索结果自动分类或者信息聚类;提供智能化的概念扩展查询等。通过这些技术,能够满足大多数智能化搜索需求。
4. 海量数据高效处理
线点科技全文检索产品不仅提供了快速检索功能(在千万级数据下,全文检索能在1秒钟之内完成),同时也有着高效的海量数据处理能力。每小时能处理百万的数据库数据,或是几十万篇的文档。包括中文的分词和建立数据索引。我们的产品在多个大型项目中经过了实际的检验,成功实施过多个超过5千万数据规模的项目。
5. 中文分词技术
中文分词是搜索引擎必须具备的技术之一,应用中文分词技术才能使搜索结果更加符合用户习惯,更加接近用户的期望结果,线点科技全文检索产品集成了中文分词技术,并有着40万词库的支持,用户也可以根据自己的需要和行业特色来添加和维护词库。中文分词技术的准确率和召回率都达到96%以上。
6. 搜索结果多样化展现方式
无论是数据来源于数据库中,或者是各类文件,对于搜索的展示结果,用户可以通过接口或委托线点科技开发进行个性化、多样化的展现,也可以类似数据库那样,对于数据字段进行自由调用查询和展现。
7. 支持多种语言开发接口,与业务系统无缝集成
线点科技全文检索产品以标准的WebService方式提供多种语言开发接口,支持的语言包括.NET,JAVA,PHP等。可与各类WEB应用进行无缝集成。同时提供完善的二次开发API手册帮助及应用示例。
8. 提供丰富检索语法
结合搜索业务的需要,线点科技全文检索产品提供丰富的检索语法支持,包括多字段组合查询、多字段组合排序、支持模糊匹配查询、支持大于,等于,小于,不等于操作符、支持*?等模式匹配,支持位置运算符,字符串的先后顺序、字符的后方截词、中间截词等等。也可以根据用户需要定制开发特殊检索规则。
9. 分布式系统支持
当信息数量超过一台计算机的负载能力,而无法达到要求的查询效率,或是系统需要承受更大的访问压力时,分布式系系统无疑是最好的解决方案。通过分布式系统的支持,系统的数据负载能力可以从300万提高到8000万,甚至更多。
10. 操作简易、维护方便
线点科技全文检索产品提供完整的后台界面,所有配置和操作都可以通过IE访问产品后台进行,操作简易,维护方便,同时也不影响服务器的安全性。
备注:产品描述以产品购买合同的产品白皮书为准,线点科技并不保证不会因为需求或营销的需要对于产品功能进行增减,同时本公司也提供定制开发服务,具体价格根据需求协商。
|