分享到:
档案管理论文 最近更新
浅论铁路火车票退票制度改革 退票改革论文
深化我国事业单位管理体制改革研究
关于社区基层行政管理的调查报告
公共部门人力资源管理激励机制的现状与对策研究
深圳建设节约型社会的政府管理研究
我国医疗改革中的政府职能研究
我国公务员激励机制存在的问题与对策
我国公务员职业道德建设研究
构建和谐社会与我国服务型政府的建设
我国公共政策制定中的公民参与问题研究
浅谈房产税改革
我国非营利组织的政府监管现状、问题及对策
中国非政府组织的发展现状与困境
行政执法人员职务犯罪的成因及对策
社区卫生服务机构绩效考核的调查报告
论公共部门人力资源与建设服务型政府的关系
中国房地产行业存在的问题及对策
现代化建设中的惠州乡镇区域发展浅析
公务员录用制度研究
论地方政府竞争
客户档案管理及客户知识挖掘概述

客户档案管理及客户知识挖掘概述
 

一、客户档案概述
1.客户档案的定义
人类社会最早的原始客户档案出现于剩余劳动产品出现时期,因有了剩余产品,
才出现了最原始的物物交换,交换双方都是作为对方的客户而存在,那么有交换活动
就会有客户记录,就会留下客户资料,这些客户资料就是最初的客户档案。早在 1621
年,“客户”这一词汇在世界范围内首次形诸文字。之后伴随着西方客户理论的发展
以及社会实践领域的不断拓展,有关客户的一些资料不断的建立并趋于完善。尤其是
在市场经济环境下,客户是企业生存和发展的基础,是企业的生命线。企业通过为客
户提供优质的产品和服务得以生存和发展。虽然在西方客户管理理论中,没有“客户
档案”这一词汇,但是在现实的商业环境中,它是作为一项重要的企业资源而存在着,
并随着计算机技术、网络技术的出现和冲击,越来越受到业界的高度关注。
目前关于客户档案的定义,业界还未形成一个统一的、规范的认识。笔者认为,
客户档案是在与客户交往活动中形成的、有保存价值的、应归档的客户信息。这里之
所以用“应归档”而不是像传统档案定义中的“已归档”,是有其一定的意义的。根
据文件生命周期理论,文件是一个广义的概念,文件运动现象如同生命现象一样,从
其最初产生到最终归宿是一个完整的运动过程,而且这一发展过程是连续统一的。在
客户档案的管理全程中,客户信息是客户档案的前身,客户档案是由客户信息转化而
来的,二者是同一事物的不同运动阶段。因此,客户信息管理自然地向后延伸与扩张,
客户档案管理在网络时代的提前介入,可以促成客户管理与客户档案的交叉叠加、鸿
沟淡化与重新整合,进而使两者相互渗透,以至融为一体。从这个意义上看,文件生
命周期理论为客户信息——客户档案的一体化管理和档案管理的前端控制提供了理
论依据。随着高新技术的应用,企业与客户接触点的实时沟通,使得客户信息可以实
现实时归档。档案工作在企业中的“先天不足”需要企业档案人员突破常规的档案工
作思路,为客户档案管理创造一条快捷可行的途径。这里的关键是对“客户档案”概
念的突破:一是突破客户信息与客户档案之间的纵向界限,二是突破客户档案与其他9
信息源之间的横向隔阂。客户档案的外延比传统意义上的客户档案广泛得多。因此,
本文要讨论的客户档案,它的外延已经向前延伸到客户信息阶段,是一个广义的客户
档案。它既包括有保存价值、已经归档的客户信息,也包括有保存价值尚未归档的客
户信息。
2.客户档案的特征描述
客户档案产生于商业经营活动之中,是企业从事经营活动的重要依据和凭证。它
既具有一般档案的基本属性,又具有区别与其它有关专门或专业档案的特殊性质。
(1)动态性
如果按照传统档案的静态管理思维,不能根据变化的市场及客户需求对客户档案
进行适时的更新和维护,客户档案则形同虚设。在当今的商业环境中,合格的客户档
案管理应在动态的、富有竞争性的环境中去维护企业的忠诚客户,并挖掘竞争市场上
最有价值的潜在客户,而不是脱离企业的生存环境,仅仅去关注那些已记录存档的老
客户。企业应该充分利用现代信息技术,为自己营造更多的与客户实时动态的接触点,
增强企业与客户的互动性,使企业能够及时跟踪并掌握客户不断变化的需求。只有基
于“动态”的客户档案管理,企业才能不断的变革,在渐变的过程中使得企业的交易
与客户的需求相协调,逐步趋于一致,用以带来客户积极的愉悦及最终更高的客户忠
诚度。
(2)专门性
客户档案形成于特定的领域,是相关专业活动的产物。客户档案主要是企业在与
客户交往活动中形成的,是企业与客户互动过程的真实记录和伴生物。对其进行收集、
整理和加工后,又用于指导本企业的各项经营管理工作。例如,客户调查报告是对客
户类型、分布,客户需求,销售动态等进行全面、系统地调查后写成的。对不同类型
的客户调查进行统计和分析后,可以做出市场预测,把握目标客户群,了解客户的需
求趋势、销售变化规律及用户心理和行为状况等。在这种认识和分析的基础上,制定
本企业经营的战略和策略,开展有效的营销活动。因此,客户档案是专指企业在与客
户交往活动中形成的,并用来指导本企业经营活动及其管理的各类客户资料。
(3)现实性
客户档案具有较强的现实实用性。传统意义上的各类档案在归档后,主要是凭证11
季度或半年变化一次。通常把客户分为个人客户和团体客户两类。
① 个人客户信息:客户的基本情况、信用情况、家庭生活、行为偏好等。基本
情况主要指姓名、地址、性别、出生年月、工作单位、联系方式、户籍、教育背景、
性格特征、收入水平等;信用情况指信用卡号和信贷限额、忠诚度指数(与公司交易
占总花费的比例)、潜在消费指数、客户类型(现有客户、潜在客户、流失客户)等;
家庭生活指婚姻状况、家庭的结构、重要的纪念日、配偶及子女的情况等。行为爱好
主要指生活方式、饮食及休闲习惯、特殊爱好、对企业产品和服务的偏好、对问卷和
促销活动的反应、其他产品偏好、试用新产品的倾向。
了解上述资料相当重要,企业应以对待朋友之心来运用这些资料,与客户进行沟
通。例如,全球饭店优质服务顶级品牌的里兹.卡尔顿酒店以为客户提供细心体贴的
“一对一”服务而著称,但其成本并没有提高多少,原因是该酒店将资金投入到客户
数据库的建立上,数据库里有几十万客人的怪癖和爱好的信息。无论旅客提出什么特
殊要求,该公司都会记下来,如酒店集团的员工基本守则就写得很明确。第 10 条:
“授权于每位员工。例如,当客人有问题或有特殊需求时,即使需要暂时停止您的正
常工作,也要全力解决客人的问题。”第 13 条:“不可失去一位客人。每位员工都有
责任确保客人得到及时安抚。任何员工接到客人投诉都需负责,妥善解决并做好记
录。”在他们的数据库中存有每一客户的喜欢:房间大小、楼层、是否吸烟,房间是
否要有鲜花或水果、是否要加枕头等。客房服务员和前台工作人员甚至能知道你是不
是对羽毛过敏,喜欢什么报纸,要多少条额外的毛巾等。酒店正是通过积累的客户资
料建立起客户档案,为旅客提供个性化服务。
② 企业客户信息:企业的基本情况、行为情况、业务状况等。基本情况主要有
公司总称、总部及相应机构营业地址、电话、传真、主要联系人姓名、经营管理者、
法人代表、行业标准分类代码及所处行业、注册资本、员工数、主要经营项目、收入
及利润等;行为情况主要有公司银行帐号、信贷限额及付款情况、购买过程、每年交
易金额、与其他竞争对手的联系情况、忠诚度指数、潜在消费指数、对新产品的倾向
等;业务状况主要有包括服务区域、销售能力、发展潜力、经营特点、与本公司的业
务关系及合作态度等。
(2)市场促销性信息
市场促销性信息表示对每个客户进行了哪些促销活动,主要包括促销活动的类12
型、促销媒体、促销时间、市场促销活动的意图等。
① 促销活动的类型:降价销售、电话促销、业务推广活动、纸煤广告、广播型
广告和 WEB 广告。
② 促销媒体:电视、报纸、广播、网络等。
③ 促销时间:进行促销活动的日期,包括年、月、日,有时甚至要细致到时刻。
④ 市场促销活动的意图:对该活动的目标客户的简单说明,以及为什么采取这
样的促销活动。
⑤ 成本信息:包括促销活动的固定成本和变动成本。
(3)客户交易型信息
描述企业与客户相互作用的所有信息都属于客户交易信息。从与客户的通话到服
务中心所得的信息以及客户所购商品的描述都包括在内。主要分为购买商品类数据和
商品售后类数据两大类。
① 购买商品类信息:过去购买记录、购买频率、每次交易时间、购买数量、购
买金额及金额累计价格、交货要求、产品名称、商品购买过程及付款方式。
② 商品售后类信息:售后服务内容、使用后对产品的评价、对服务的评价、曾
有的问题和不满、投诉记录、要求退货记录。
4.客户档案管理的现状分析
(1)现行客户档案管理模式存在的问题
现在虽然许多企业已经认识到客户资源的重要性,把客户资源管理视为企业获取
更高利润和建立自身竞争优势不可或缺的经营战略,并且结合企业实际初步建立了客
户档案管理体制,但是存在的问题仍然不少,主要有以下几个方面:
① 对客户档案的重视程度不够。首先,企业缺乏那种以客户为中心的正确发展
理念和文化氛围。企业实现客户档案科学管理的最大挑战必须要使企业从产品文化向
客户文化转变。企业只有实现了向客户文化的转变才能唤醒依旧沉睡的强大的客户信
息,充分发挥客户信息的宝贵价值。其次,好多企业的客户档案仅仅作为一种储存和
管理信息的方式,形式主义过于严重,而并没有成为他们创造赢利性价值的工具。企
业过多强调静态信息,只是对客户的一些基本资料的记录,没有多大的意义。如果再
依据那些静态信息,生硬的制造出一个分析结果,便会发现,分析得到的结果并没有13
多大用处。过多的注重静态信息,正是许多企业建立客户档案的一个普遍的弊端。很
多企业客户档案是建立起来了,但客户档案管理并没有根据自身的实际情况来进行设
计,客户资料收集不全、资料过于陈旧、实际应用不多等现象极为普遍。应该注意到,
建立客户档案只是手段,其最终目的是运用其提供的相关信息和知识来促进企业的经
营管理,从而实现企业利益目标。
② 客户信息私有化现象严重。现有的企业组织结构和业务流程不能适应客户信
息管理的需要。企业现有的组织结构还是一种以产品为中心的内部导向型组织,各个
业务部门相互独立,不能形成客户信息的共享。企业的客户资源往往掌握在不同部门
不同区域的人员手里。这样会形成两个重大的弊端:一是作为企业整体资源的客户信
息无法共享,发挥最大效益;二是于人员的变动而容易造成公司客户资源的流失。在
传统的客户档案应用方面,各类客户信息被深锁在各种文件或文件柜中,在不同部门,
不同人员之间无法交流。美国某投资银行的高级经理曾评论说,他们企业的员工是在
没有掌握真正有用信息情况下与客户打交道的:“我们一线部门的运作完全是在一个
黑洞里。一线人员缺乏用以增强竞争力所需的客户信息,同时也缺乏为客户提供售后
服务所需的信息。”
[1]
(2)加强客户档案管理的现实意义
随着互联网的迅猛发展,市场的不断成熟,世界经济进入了电子商务时代。产品
和服务的差异越来越小,以生产为中心,以销售为目的的市场战略逐渐被以客户为中
心的战略所取代。谁能掌握客户的需求,加强与客户的关系,有效地挖掘和管理客户
资源,谁就能获得市场优势,在激烈的竞争中立于不败之地。现在许多企业已经认识
到客户资源的重要性,明白谁拥有更多的客户资源,即意味着企业拥有更多的商业机
会,拥有高于竞争对手的竞争优势。如何抓住现有客户、挖掘潜在客户,直接决定企
业能否持续、健康发展。客户档案是客户数据的重要和主要载体,而客户数据是企业
客户资源的灵魂,所以客户档案的管理诚然对于客户资源的开发和维持有着极其重要
的意义和地位。客户档案既提供客户的历史信息和实时信息,又注重超前性、预测性
客户信息的采集、筛选、提供,为领导的战略决策和各业务部门的科学管理提供了极
大的帮助。所以基于上述现行客户档案管理中存在的弊端,企业客户档案管理急需变
革原有的管理思维和方式,以适应当今时代“以客户为中心”的商业模式的需求。
[1]
约翰.麦凯恩著,姚志明等译.信息大师:客户关系管理的秘密[M].上海:上海交通大学出版社,2001,4910
功能,用它进行历史查考。而客户档案则不同。从客户档案的最初形成到归档以后,
大部分客户档案不仅没有退出现行使用过程,相反正是它们发挥现行效用的活跃时
期。客户档案的现实性要求对客户档案进行及时的更改、补充,使得客户档案能够真
实反映客户的变动情况。
(4)集成性
客户档案中的数据来自于企业的不同系统和不同层面。客户档案系统正是一个从
数据准备做起,建立一个来自跨组织和部门的集成的客户数据环境。在集成的客户数
据环境基础上,利用科学的决策分析工具,通过数据挖掘,知识发现等过程,发现有
价值的客户信息,然后解释、执行分析和发现结果,为战略制订和决策提供支持。因
此,集成的客户档案资源环境必不可少,集成的数据必须是一致的,并且面向企业所
有部门提供统一的客户视图。
(5)共享性
共享是指将企业内外部的客户信息和知识尽可能公开,通过集成的客户视图使每
个员工能更有效地接触和使用企业的知识和信息。过去由于知识积累过程通常以某个
部门为单位进行,因此其结果只能扩展某个部门的知识储备,而不足以提高企业整体
的知识储备。比如有些具有多年营销经验的员工积累了大量的客户知识,然而其中很
多客户知识不能为他人所知,一旦这些员工离开,这些知识便处于封闭隔绝的状态,
其他人再也难以接触,其利用率也就大打折扣。而客户档案集成了各个应用系统的数
据,是面向整个企业所有部门的,解决了客户信息不能共享的问题。
3.客户档案的内容
客户档案里的数据是整个企业数据库的灵魂。在客户档案数据库中,收集和管理
了包括商品、客户和潜在客户等表示客户“基本状态”的信息,帮助企业完成消费者
分析,确定目标市场,进行销售管理,并跟踪市场产品销售状况。因此,客户档案的
建立可以更好地记录客户资料,详细地了解客户。比较规范的客户档案,主要内容可
以分为以下三类:
(1)客户描述性信息
此类信息是指描述客户或消费者的基本资料。由于是客户的基本信息,变动不是
很快,可在较长一段时间使用。当年,档案数据库中的地址或者电话号码信息可能每16
(3)统计方法
统计方法是从事物的外在数量上的表现去推断该事物可能的规律性最初总是从
其数量表现上通过统计分析看出一些线索,然后提出一定的假说,作进一步深入的理
论研究。当理论研究提出一定结论时,往往还需要在实践中加以验证。也就是说,观
测一些自然现象或专门实验所得资料,是否与理论相符、在多大程度上相符、可能是
朝哪个方向偏离等问题,都需要用统计方法加以处理。与统计学有关的知识发现方法
主要有四种:传统方法、模糊集、支持向量集和粗糙集。
(4)遗传算法
遗传算法是基于进化理论,并采用遗传结合、遗传变异及自然选择等设计方法的
优化技术。它按照一定的规则生成经过基因编码的初始群体,然后从这些代表问题的
可能潜在解的初始群体出发,挑选适应度强的个体进行交叉和变异,以期发现适应度
更佳的个体,将其经过解码,该最佳个体编码则为对应问题的最优或近似最优解。遗
传算法可以起到产生优良后代的作用,最终得到最优化的知识集。
(5)联机分析处理技术(OLAP)
用具体图形将信息模式、数据的关联或趋势呈现给决策者,使客户能交互式地分
析数据的关系,而 OLAP 技术将人的观察力和智力融入挖掘系统中,极大地改善了系
统挖掘的速度和深度。“联机分析处理系统”是以多维数据库为基础。多维数据库是
数据的典型代表,它使得用户能深入数据内涵,了解重要的结论,它对数据转化成信
息或知识非常有帮助。
三、客户知识概述
1.客户知识概念
客户知识是企业最重要的智力资本之一,可以增进企业的知识基础,促进企业的
创新。客户数据是客户信息的基础,客户信息是分散的、不连续的、具有完全的转移
性;而客户知识是针对特定用户的需求和问题,在信息分析基础上提供的解决方案。
客户信息的积累是获取客户知识的第一步,是客户知识的原材料。只有把客户信息以
一种有意义的形式组织在一起,客户信息才会变成客户知识。那到底什么是客户知识
呢?申明(1998)认为“客户知识就是在客户关系方面投资的成果”。
[1]
郭欣、蔡新
[1]
申明,知识资本运营论[M].北京:企业管理出版社,1998,817
春(2002)等人认为“客户知识是关于客户的有组织的经验、价值观、相关信息和洞
察力的动态组合,它所构成的框架可以不断的评价和吸收新的经验和信息。”
[1]
而美
国学者 Alan Copper 对客户知识做了详细的定义,即“客户知识是关于产品和服务满
足客户需求的情况、客户具体的需求和欲望、客户与企业的互动难易程度甚至客户是
怎样应对人生压力的知识。”
[2]
经过多年的研究,Gebert 及 Blosch 等人对客户知识做
出了经典的定义:客户知识就是客户与企业在交易及交流过程中,需要、产生或拥有
的一种经验、价值、情境信息和专家洞察力的动态组合,它所构成的框架能够提供评
价和吸收新的经验与信息。
[3]
总结前人研究的结论,本文认为,客户知识就是对企业在与客户沟通和交易过程
中积累的大量有关数据、信息等进行归类、分析、验证后而形成的加工产品。客户知
识能够描述客户界定、客户需求及其行为以及相应的客户联系技术。
2.客户知识的类型
(1)客户需要的知识
这类知识指的是企业为满足客户的知识需要而准备的知识。包括企业的产品、服
务及市场情况等。这类知识是由企业传递给客户,帮助客户更好地理解企业的产品和
服务,从而使客户的需求与企业的产品有效地匹配。如何使这类知识既能被普遍的客
户所接受,又能有针对性地为每个客户提供相应的知识,即广泛性与精确性之间的平
衡是管理这类知识的重点。
(2)关于客户的知识
这类知识描述的是客户的基本情况。包括客户的人文统计信息,客户的历史购买
信息等。这类知识是企业进行客户分析的重要基础,它能帮助企业准确地分析和定位
客户资源了解客户需求,并据此为客户制定相应的个性化或一对一营销策略。这类知
识也是目前研究和应用最广泛的一类客户知识,主要涉及以下几个方面:
① 客户界定。在客户知识体系中,首先面临的问题就是谁是企业的客户,对客
户进行界定是客户知识的基础。
② 与客户的沟通渠道。认识客户的沟通渠道,是获取其他客户知识的前提,只
[1]
郭欣.客户知识的管理及其在营销决策中的应用[D].暨南大学硕士论文,2002,5
[2]
Alan Cooper. Customer Knowledge Management[J].Pool Business and Marketing Strategy,1998,3-4
[3]
Marcus Blosch.Customer Knowledge[J].Knowledge and Process Management,2000,7(4),265-26814
二、知识挖掘概述
1.知识挖掘概念
在讨论知识挖掘之前,首先要分清三个概念——数据、信息、知识。数据是指离
散孤立、互不关联的事实、文字、数据和符号,这些资料之间缺乏相关性。人们凭借
认知能力和以往的经验在推断其内在含义时有比较大的困难。数据管理的主要目的是
监控整个数据搜集过程的有效性并确保其可靠和完整;信息是凭借人的认识能力和经
验对数据进行选择、评价、组织和分析的结果。将数据提升为信息,实际上是对数据
进行识别和归纳并挖掘其内在联系的过程,并使孤立和无序数据变成系统、有序的资
源。信息管理主要是解决数据的相关性、系统化和规范化的问题;知识是在人们对信
息进行分析的基础上提供的解决方案。根据迈克尔.波特的看法,知识比数据和信息
更有价值是因为它贴近行动。知识是结构性的经验、价值观念、关联信息及专家识的
流动组合。野中郁次郎和竹内隆二认为:信息是源源不断的消息,而知识正是扎根于
信息持有者的信念和承诺的信息流而创造出来的。这些观点强调了知识本质上同人类
的活动相关性。
[1]
从技术角度来看,知识挖掘就是对大量不完全的、模糊的、随机的实际应用数据,
提取隐含在其中的潜在有用的知识,以最终可以理解的模式显示的一系列处理过程。
这个定义包括以下几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用
户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆
准的知识,仅支持特定的发现问题。知识挖掘是一种比“数据挖掘”更广义的说法,
对挖掘技术本身和挖掘的结果要求也更高一些。因为知识挖掘不仅仅要求所得的知识
有用,而且要有新颖性,有潜在价值,并能被客户理解。知识挖掘是一门交叉学科,
它把人们对数据的应用从低层的简单查询,提升到从数据中挖掘知识,支持决策。在
这种需求牵引下,它汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、
数理统计、可视化技术、并行计算机等方面的学者和工程技术人员,投身到这一新兴
的研究领域,目前它已形成为一个新的技术热点。
从商业角度来看,知识挖掘是一种新的商业信息处理技术,其主要特点是对商业
数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商
[1]
李宁,李秉严.知识挖掘技术及应用[J].情报技术,2003(6),34-66有知道并有效利用好客户沟通渠道,企业才能动态地与客户沟通,以达到全面掌握客
户知识的目的。
③ 客户需求。客户需求是关于客户的知识的重要部分,掌握客户需求是为了影
响客户行为。
④ 客户购买行为。大多数购买行为是一种反复的产品选择和购买决策过程。
⑤ 客户为企业创造的价值。关于客户的知识的核心部分是辨别客户在什么时候
以何种方式为企业创造了多大的价值。
(3)来自客户的知识
这类知识描述的是客户对于企业或竞争对手的产品和服务使用情况的反馈信息。
包括与产品、服务相关的客户评价、反馈、抱怨、期望,和高价值客户的与产品、服
务相关不大的想法、感受、期望以及客户接触人员感受到的客户习惯、性格特点、心
智模式、预见性、信仰、价值体系、团队默契、组织文化和风俗等。这类知识能够使
企业及时响应客户需求的变化,并相应地调整营销策略。同时这类知识也是企业革新
的动力和源泉,相关的研究表明,企业技术创新的动力通常来源于客户而不是企业本
身,合理利用来自客户的知识能够使企业适应激烈变化的市场环境。
此外,按照客户知识存在的方式,还可将客户知识分为:显性客户知识和隐性客
户知识。具体地讲,显性客户知识是经过人的整理和组织,可以以文字、公式、计算
机程序等形式表现出来,并可以通过正式、系统的方式(如书本、计算机网络)加以
传播,便于其他人学习。而隐性客户知识是与人结合在一起的经验性的知识,很难将
其文字化或公式化,它们在本质上以人为载体,因此难于通过常规的方法收集到,也
很难通过常规的信息工具进行传播。客户需要的知识和关于客户的知识都属于显性客
户知识,主要是应用信息技术尤其是知识挖掘技术提取出来。而来自客户的知识是属
于隐性客户知识,主要是通过与客户建立联系并实现沟通,从而有效地获取相关知识
以及将其显性化。15
业决策的关键性知识。数据分析本身已经有很多年的历史,只不过在过去数据收集和
分析的目的是用于科学研究。另外,由于当时计算能力的限制,对大数据量进行分析
的方法受到很大的限制。现在由于各行业业务自动化的实现,商业领域产生了大量的
业务数据,这些数据不再是为了分析的目的而收集的,而是为商业运作而产生。分析
这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的信息,
进而获得利润。但所有企业所面临的一个共同问题是:企业数据量非常大,而其中真
正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作,
提高竞争力的信息和知识,就像从矿石中淘金一样,知识挖掘也因此而得名。所以,
知识挖掘也可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,
揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。
2.知识挖掘的主要方法
知识挖掘借助了统计学、人工智能和数据库等领域的研究成果,因此它的方法也
来自这些相关学科,常用方法如下:
(1)决策树方法
决策树方法,即利用信息论中的信息增益寻找数据库中具有最大信息量的字段,
建立决策树的一个结点,再根据字段的不同取值建立树的分支;在每个分支子集中重
复建立树的下层结点和分支,直到完成数据库中数据的分类。决策树的建立过程可以
看成是数据规则的生成过程。利用建好的决策树,我们可以对数据进行预测。决策树
擅长处理非数据值型数据,精度较高,结果容易理解,效率也较高,因而比较常用。
(2)神经网络方法
神经网络方法适应比较强、并行速度比较快,为解决高度复杂的问题提供了一种
比较有效的简单方法,因此倍受人们关注。该系统由一系列类似于人脑神经元一样的
处理单元组成,我们称之为节点。这些节点通过网络彼此互连,如果有数据输入,它
们便可以进行确定数据模式的工作。从结构上看,可以把一个神经网络划分为输入层、
中间层和输出层。其中,中间层由多个节点组成,完成大部分网络工作。输出层输出
数据分析的执行结果。神经网络很适合处理非线性数据和含噪声数据,并且能够精确
地对复杂问题进行处预测。故神经网络是预测、信用评分、响应模型评分和信用分析
等商业应用的有力工具。

随机推荐
将数据挖掘技术应用在客户关系管理中
档案工作服务职能的目标定位
论我国档案学研究的发展趋势与对策
论析库存管理决策需求分析及设计
业绩考评与综合素质考评的透视分析
浅谈Web2.0对知识管理的影响
供应商管理库存(VMI)的理论概述
国内大学档案馆上网引发的思考
论析投资回报率管制模式下电网企业资产管理
关于在高校档案馆建立专题馆员制度的探讨

设为首页 | 关于我们 | 广告联系 | 友情链接 | 版权申明

Copyright 2009-2014 All Right Reserved [粤ICP备05100058号-11]