国家知识产权局门户网站升级改造
来源:IT社区 更新时间:2014-05-30

随着经济全球化和知识经济发展的进程加快,知识和智力资源的创造、占有、运用和保护已经成为企业和国家取得竞争优势的重要因素,成为国家经济发展和社会进步越来越重要的推动力量。进一步完善现代知识产权制度,鼓励知识的创造和运用,尊重和保护知识产权,从而持续有力地推动经济社会的全面发展,现今成为世界各国政府追求的目标。

伴随着知识产权越来越受到公众、企业、政府的重视,国家知识产权局政府门户网站系统建设要求不断提升,政府门户网站访问量、专利检索量不断攀升,专利信息数据库数据量不断加大,因此需要进一步提升国家知识产权局政府门户网站的建设水平和设计水平,为公众、企业、政府提供快速、全面的信息服务。因此,国家知识产权局在综合分析目前国家知识产权局政府门户网站现状下,决定进行升级改造。

TRS公司凭借着多年来服务于国家各大部委、省市政府门户网站建设的经验,以及可满足专利搜索特性的,成熟、稳定及可集群扩展的搜索产品,顺利中标此项目,并成功实施完成。

用户需求
整合资源,建立统一的内容发布平台
      国家知识产权局下设多个部门和直属单位,同时管理协调着各个地方知识产权局的工作。为了更好的为公众、企业、政府提供服务,需要建设以国家知识产权局机关为核心的网站群,建立统一的内容发布平台,形成“一个主站+多个子站”的服务模式,从而提供一站式的信息检索和导航服务。

建立专利信息搜索服务平台
      专利的合理利用对国家和企业的发展有着不可估量的作用。在浩如烟海的科技信息中,有80%的信息首先是在专利文献中出现的,而善于利用专利文献可以减少60%的研发时间和40%的科研经费。

在我国,由于缺乏对专利信息的深度加工和具有专业化搜索功能的软件,因此在如何有效利用专利信息的问题上,还存在很大的缺憾,并由此造成了巨大损失。据统计,我国的科研项目重复率达到40%。其中,以新药研发为例,我国药物研发重复率达70%—90%,不仅是人力、物资、资金和时间的浪费,还使我国创新药物研究水平远远落后于发达国家。

目前,我国的专利分析需要借助国外的专利搜索系统,每年要支付巨额的信息服务费用。所以提供专利信息搜索服务是国家知识局信息服务中最重要的项目之一,建立具有自有知识产权的专利信息搜索平台是该系统中最重要的一部分。

专利搜索与传统搜索引擎异同点:

相同点

       海量数据高并发环境下的搜索

近几年,专利信息正在以惊人的速度增长,从前G级的数据,目前已经发展到

几十个G,并有向T级数据发展的趋势。另外,随着国家、企业、社会对专利信息的分析挖掘工作越来越重视,用户访问量越来越大,因此专利搜索需要在海量数据高并发环境下进行搜索。   

         多语言,多语种的搜索

全球经济一体化步伐,使得专利分析和专利保护走向世界,所以专利搜索必须满

足多语言、多语种的搜索需求,提供多语种专利信息的统一存储,索引和检索手段。     

不同点:

        结构化信息和非结构化信息的联合搜索

专利信息中不但包含对全文内容的搜索,而且包含对名称、分类号、代理人等属

性结构化信息进行检索,及对属性和全文内容进行组合检索。但目前,大部分互联网搜索引擎和部分企业搜索软件只实现了全文内容搜索,不能够提供结构化信息和非结构化信息的联合搜索手段。

        专利搜索对查全率和查准率要求很高

专利搜索是专利分析、专利查重的重要手段,因为专利搜索结果直接影响到专利

受理、科研经费投入等,所以专利搜索对查全率和查准率的要求很高。提高查全率和查准率需要系统在索引策略、词表支持、自然语言检索方面有着很好的应用功能。   

        检索手段多样化、专业化

相对于互联网搜索来讲,专利搜索的检索入口多样化,不但包括简单的关键词检

索,而且融入了布尔检索、二次检索、位置检索等专业化检索手段。检索结果处理多样化主要包括:检索词反显、检索结果分类、按需排序等。

TRS解决方案

以 TRS WCM为核心,建立统一的内容协作平台
TRS 内容协作平台 (TRS WCM )是一套完全基于Java和浏览器技术的信息发布平台,TRS WCM集中了浏览器信息创建和写作、信息交付、信息交互等功能,并集基于模板的信息发布、强大的多站点管理于一身,提供灵活的团队协作能力

TRS全文数据库搭建专利信息搜索平台

     十几年来TRS专注于中文信息处理和信息检索技术的研究,核心产品TRS全文检索系统在政府、媒体、企业、教育、科研等许多领域得到广泛的应用,拥有了2000多家企业级客户,国内市场占有率达到了70%以上,是国内最为成熟、稳定、可靠的信息检索软件产品。

     从产品功能和优势角度分析,TRS全文数据库系统能够较好的满足专利检索的需求,这主要表现在:

        不但可以存储和管理网页、Office文档等,而且具备关系数据库的基本特性,支持多种数据类型的字段,从而支持结构化数据和非结构化数据的统一管理和联合检索。

        针对于中文特性,提供按字索引、按词索引、字词混合索引。按字索引保证了查全,按词索引保证了查准,而通过对分词词典的维护,更可逐步提高查准率。TRS全文数据库系统保证一定查准率的同时能够提供100%查全的手段。

        不但提供基于文章内容与检索表达式相关度计算的相关性排序,而且提供基于一个或多个特征属性的字段排序,支持检索结果的分类统计和检索词反显,满足专利检索结果处理的个性化需求,方便适用。

         提供按字、词、句的简单检索方式,同时支持48种检索运算符,提供位置检索、二次检索、渐进检索、词根检索等多种检索方式,满足专利、情报、科研领域专业人士的需求。

       TRS 全文数据库系统集群架构,解决了海量数据高并发环境下的检索。

采用TRS全文数据库系统集群应用模式,将两份中文专利库部署在两个TRS全文数据库服务器组中,每个服务器组配置一台服务器。发往全文数据库服务器的请求由TRS集群服务器统一调度,集群服务器根据后台数据库服务器组的状态,来确定请求发往哪个数据服务器组,从而保证在高并发环境下的检索速度。

扩展性方面的优势和特点:

        两个服务器组采用不同的索引策略,按字索引保证查全,按词索引保证查准,从而保证了专利检索查全和查准的统一。

         随着专利数据的近一步增长,通过同组服务器的扩展,实现分布式存储和检索,保证海量数据的无限扩展。

       随着用户访问量的近一步增长,通过扩展TRS数据库服务器组,保证检索速度。

项目效果和建设意义
有效提升了国家知识产权局的服务质量和服务水平


     新建成的国家知识产权局政府门户网站,形成了以局机关为核心,整合直属机关、单位、省级知识产权局的网站群(子网站由所属单位负责分布维护)。新门户网站不但提供各种来源的动态信息,同时提供包括专利检索服务在内的多种信息资源查询检索服务,提供专利申请等在线服务导航,门户界面美观,信息丰富,有效提升了服务质量和服务水平。   

对国家科研投入和企业产品研发起着积极的引导作用
     国家知识产权局专利搜索平台的投入使用,提高了专利搜索的查全率和查准率和专利数据库的挖掘潜力。多样的专利检索入口和分析手段、分布式集群架构支持,实现了数据和性能的无忧扩展。另外,国家可以通过专利检索分析,确定科研投资策略,规划科研投入,企业可以通过专利查重查新,决策产品研发方向。