公司产品
  解决方案
 

中文自然语言信息处理全文检索基础件

基础件功能:
  全文检索基础件实现根据用户输入检索条件,从知识数据库中筛选出与检索条件相匹配(命中)内容的功能,检索结果通常按照相关度由高到低的顺序排序。全文检索基础件广泛应用于搜索引擎门户、数字图书馆、电子政务系统等方面。

基础件概述:
  全文检索基础件是在多项中文智能计算技术基础上,针对信息处理和多种应用系统的需要,面向相关领域软件开发商与系统集成商开发的一套特色鲜明、性能卓越、接口标准灵活、便于二次开发的软件包,以及为使软件包在目标系统中实现最优品质而提供的特定服务。其服务包括:目标系统架构咨询、辅助开发、技术培训、售后支持等。
  我们开发的全文检索基础件采用了专有智能检索技术以及索引检索并行技术,使得全文检索的智能化程序高、索引维护方便,技术性能指标处于行业领先水平。

基础件技术特点:
  1)智能检索技术:
  a.支持表达式检索:可以表达式方式进行多个词的与、或、非检索。例如:“北京+城区+天气”;
  b.支持整句检索:也可以检索整个句子。例如“北京是中国首都”;
  c.支持数字检索:可以对文本中的数字进行检索;
  d.支持站点内检索:可以限定一个站点的域名,在指定站点内检索指定的内容。
  例如:检索:SITE: Beijing.gov.cn 居民生活
  检索结果可命中:站点Beijing.gov.cn 中的与居民生活内容相关的文章
  e.支持同义词检索:对给定的检索串进行分词,得到字典词和非字典词,对于字典词,可以通过同义词词库查找出其相应的近义词,将近义词作为基本单元检索,最后结果进行"或"操作。(同义词检索通过同义检索基础件实现)。
  例如:检索:计算机
  检索结果可命中:计算机、电脑
  f.支持检索结果按照相关度排序输出:检索时可以计算检索词与命中文章的相关度,并在输出检索结果时根据相关度排序。
  g.支持多种数据库:SQL-Server,Oracle等。
  2)索引检索并行技术
  索引检索并行是指在索引库用于检索的同时,可以追加索引记录(即索引间索同时进行)。全文检索基础件采用精确的同步技术,内部屏蔽了数据的互斥操作,让用户对索引库的维护更加方便。

基础件封装形式:
  全文检索基础件采用DLL封装形式,将全文检索函数全部集成在其中,并提供了外部程序API调用接口,以供外部程序调用全文检索函数。

基础件调用方法:
  在外部程序中编写API程序段,声明一个全文检索基础件实例,需要使用全文检索功能时,编写全文检索函数调用语句,指定待检索文本输入参数,并将函数返回值赋值给全文检索结果记录集变量。当程序执行到函数调用语句后,全文检索函数返回值(检索结果记录集)被赋值到全文检索结果记录集变量中,全文检索调用完成。

基础件应用领域:
  a.搜索引擎门户;
  b.数字图书馆建设;
  c.信息中心建设;
  d.电子政务系统;
  e.企业信息门户。

阅读:3929 Top↑ 
【关闭窗口】
 
Copyright © 2005-2020 版权所有 北京网讯博通信息技术有限责任公司  ICP备案号:京ICP备12002193号