阐述了Web数据挖掘的概念,介绍了Web数据挖掘在农业电子商务中的应用:制定个性化电子商务网活动;改进农业电子商务网站的设计;提高农业电子商务信息检索效率。
电子商务的迅猛发展给农业的发展注入了活力和生机,电子商务技术为农业信息应用平台的搭建提供了技术保障,因此越来越多的农业电子商务门户实现网上农产品销售,越来越多的农民通过商务网站发布农产品信息,电子商务的发展带动了农产品市场的繁荣,大量的商品、信息在现有的网络平台上得以交易,简化了交易方式,节约了时间,提高了效率。但另一方面,农业电子商务的实施带来了繁杂的数据信息,如何有效利用信息成为制约农业电子商务发展的瓶颈。同时,商务网站相对杂乱无章,无法获得每个模块的效率,无法提供个性化服务设置,无法保障交易安全性,这些都影响着农业电子商务的开展。
Web数据挖掘可以抽取潜在的知识,通过数据挖掘技术分析大量用户的使用记录,使服务商更好地理解用户的购物特征和消费需求,从而识别潜在用户客群、实施客户关系管理。在智能电子商务、商业决策支持、客户关系管理、获得高质量的企业竞争情报信息,已成功应用于定制个性化服务、系统改进、站点修改、商业智能以及浏览推荐等方面,因此如果将Web数据挖掘应用于农业中,可以很好地解决以上问题。笔者介绍了Web数据挖掘方法在农业电子商务客户关系管理、网站设计、信息检索等方面的应用。
1 Web数据挖掘概述
Web数据挖掘是指从Web文档中和Web活动中发现和抽取潜在的、用户感兴趣的有用模式和隐藏的知识。Web数据挖掘方法主要有统计分析、关联规则、聚类、分类、序列模式以及依赖性建模等。Web数据挖掘主要包括Web内容挖掘(Web Content Mining)、Web结构挖掘(Web Structure Mining)和Web使用挖掘(web Usage Mining)。
其中Web使用挖掘在电子商务领域应用最为广泛,是指从用户与Web服务器的交互数据中,发现有用、感兴趣的模式,是Web挖掘技术的重要分支。WWW承载了动态、异质、复杂的海量信息,但用户在任何一个站点的访问痕迹都会记录在Web服务器上的日志文件,包括用户IP地址、访问时间、访问方式(GET/POST)、URL资源、协议、用户代理(User-Agent)、Cookie、参考页面(Referer)等信息,对这些信息进行收集、加工、处理可以挖掘出用户访问模式,调整网络营销策略,提高信息应用质量,因此Web使用挖掘在电子商务中扮演着越来越重要的角色。
2 Web数据挖掘在农业电子商务中的应用
2.1 制定个性化电子商务活动
CRM、ERP、SCM三者一起已经成为现代企业提高竞争力的法宝。INTERNET的发展激发了CRM,使企业可全面观察其外部的客户,CRM是推动企业腾飞的真正动力。电子商务领域,通过Web数据挖掘,不仅可以从大量多种多样信息的Web页面中提取需要的有用的知识,还可以得到关于群体用户访问行为和方式的普遍知识,用以改进Web服务设计。更重要的是,通过对用户特征,如对用户访问行为、频度、内容等的理解和分析,提取出用户的特征,从而为用户定制个性化界面,有助于开展有针对性的电子商务活动。
通过Web数据挖掘分类方法可以找到潜在客户。分类技术主要是根据用户群的特征挖掘用户群的访问特征。使用者可以先对已经存在的访问者根据其行为进行分类,并依此分析老客户的一些公共属性,决定其分类的关键属性及相互间关系,在Web数据挖掘中,分类规则的发现即给出识别一个特殊群体的公共属性的描述,这个描述可以用来分类新的项,如在某农业商务网站进行过在线定购的顾客中有78%是30~40岁生活在安徽省的年轻人。得到这一分类后,可以进行适合这一类客户的商务活动,如推荐特色产品等。同时,通过Web数据挖掘关联规则、序列模式技术可以提高客户的忠诚度。关联规则是寻找在同一个事件中出现的不同项的相关性;序列模式寻找的是事件之间时间上的相关性。
在电子商务中,如何挽留客户至关重要,电子商务环境下的促销活动不是单纯追求产品质量,而是追求产品及服务满足客户的程度。传统客户与销售商之间的空间距离已经不存在,知道客户的兴趣及需求,同时根据挖掘发现的用户使用习惯、个人喜好及浏览模式给不同的用户提供不同的服务策略,并根据这种需求针对性的提供个性化推荐,从而延长客户对产品的好感,提高客户的忠诚度。如农业电子商务网站中可以采用个性推荐的方式,根据用户近期的访问行为发现客户在购买A的同时,经常会购买B,即A=>B(关联规则)或者客户在购买A后,隔一段时间,会购买B(序列分析),则可以把这2种产品的推荐放在一起推荐给相关客户。
2.2 改进农业电子商务网站的设计
Web数据挖掘技术可提高站点的效率,可以根据访问者的信息特征修改和设计网站结构和外观,从而进行站点结构优化。将挖掘出的用户使用模式作为调整网站的参照,宏观上把握站点的总体布局,重新组织页面顺序,如根据挖掘结果可以把用户比较关注的页面提前,局部上,可以将用户频繁访问路径上的超链接更加醒目,或者修改页面内容,提高用户使用信息的质量与效率。Web数据挖掘可以让用户的操作流程更加顺畅,如缩短搜索、等待的时间,减少无效信息数量等,或彻底改变互动过程,让用户能够更加个性化地配置自己的门户。
另外,Web数据挖掘可以改进系统整体性能。提高Web站点的整体服务性能,主要体现在保证站点安全性与解决系统性能瓶颈2个方面,如可以通过分析用户的拥塞记录,提示站点管理者改进web缓存策略减轻主服务器负担或采用流量负载平衡机制减少用户等待时间等。对予网络安全方面,Web数据挖掘可以通过收集大量关键点数据,分析探测是否有非法入侵等现象,保证站点安全性。
2.3 提高农业电子商务信息检索效率
电子商务网站作为营销的第一个窗口,已经成为提供网络服务和商务服务的基础,然而最近几年农业信息资源逐渐出现“信息过载”、“信息迷航”状态,如何从鱼龙混杂的信息中找到有用的信息成为制约农业电子商务发展的障碍之一。传统的综合搜索引擎都是面对大众的检索,而不是面对某个领域的专业检索,大众化检索容易出现查准率和查全率低下的问题,而农业类的检索是特定区域的检索,查询返回的查询结果需更直接、更快捷、更专业。
通过对网页内容的挖掘,可以实现对网页的聚类和分类,实现网络信息的分类浏览与检索;通过用户使用的提问式历史记录分析,可以有效地进行提问扩展,提高用户的检索效果(查全率、查准率);通过运用Web挖掘技术改进关键词加权算法,可以提高网络信息的标引准确度,改善检索效果。谢圣献等提出了一个基于本体的数据挖掘方法,增加了语义制导,实现了基于知识的语义检索,在此基础上利用数据挖掘方法实现了语义层面上的对农产品数据的挖掘,达到了农产品数据的高效率和高精度挖掘,并根据挖掘结果进行决策分析,根据分析结果为用户提供基于RSS聚合的个性化服务。
3 结语
电子商务使得网络交易在农业商务中占据越来越多的份额,Web数据挖掘可以挖掘客户的潜在信息,提供个性化推荐,为农业企业及分销商、供应商等提供高效决策;可以使农业电子商务门户网站更美观,更高效;可以让搜索引擎更容易搜索到各地农产品信息,便于电子商务开展。Web数据挖掘作为电子商务成功的重要因素,势必会促进农业电子商务进一步发展。