公司产品
  解决方案
 

中文自然语言信息处理自动摘要基础件

基础件功能:
  自动摘要基础件实现从指定的文档中提取出纯文本内容的功能。自动摘要基础件广泛应用于搜索引擎门户、数据图书馆、文献数据库建设等方面。

基础件概述:
  “摘要”指从html网页或其它格式文档中提取出文本内容的过程。自动内容摘要是搜索引擎必不可少的功能之一,常见的搜索引擎如Google、百度等都提供了内容摘要功能,这个功能为搜索引擎使用者带来极大便利,使用者不必点击页面进入,即可初步了解检索结果中的页面内容,这在很大程度上提升了搜索引擎的易用性,提高了使用者的满意度。然而对数以千万计、实时更新的页面内容通过人工进行摘要根本是不可能的。
  为了解决这个问题,我们采用中文智能分词技术、文本过滤筛选技术,开发出自动摘要基础件。该基础件以卓越的性能、全自动的工作方式为搜索引擎及文献数据库系统等提供自动摘要功能。

基础件技术特点:
  a.摘要过程效率高;
  b.摘要准确度高;
  c.支持html、asp、php、cgi、txt等多种文件格式。

基础件封装形式:
  自动摘要基础件采用DLL封装形式,将自动摘要函数全部集成在其中,并提供了外部程序API调用接口,以供外部程序调用自动摘要函数。

基础件调用方法:
  在外部程序中编写API程序段,声明一个自动摘要基础件实例,需要使用自动摘要功能时,编写自动摘要函数调用语句,指定待进行自动摘要文件内容输入参数,并将函数返回值赋值给自动摘要结果变量。当程序执行到函数调用语句后,自动摘要函数返回值(自动摘要结果)被赋值到自动摘要结果变量中,自动摘要调用完成。

基础件应用领域:
  a.搜索引擎门户;
  b.数字图书馆;
  c.文献数据库。

阅读:4067 Top↑ 
【关闭窗口】
 
Copyright © 2005-2020 版权所有 北京网讯博通信息技术有限责任公司  ICP备案号:京ICP备12002193号