1 引言
建筑业是一项复杂的生产活动,涉及几十多个工业部门,一栋建筑的建造过程需要众多原材料及设备供应商的产品支持。建筑产业发展到现在,产品的内涵已经大大延伸,各类预制件、模块等不同的中间产品都有可能通过外包的方式进行。各类供应商提供的产品质量、价格和交付时间,以及供应商本身的生产能力、规模和信用,都是制约建筑企业产品质量、成本、进度和效率的关键因素,选择可靠的供应商是建筑企业的关键问题。建立合理、公平的供应商评价方法和机制,不仅可为建筑企业提供选择供应商的主要手段,也可为行业管理提供决策基础。
目前,供应商评价方法种类较多。近年来,数据挖掘算法在企业及个人信用评价方面取得了较为成功的应用,这为发展建筑材料供应商评价方法提供了启示。本文的主要工作是根据现代建筑模式的特点,分析建筑材料供应链的核心要素,建立基于决策树C5.0算法的建筑材料供应商评价模型。
2 建筑材料供应商评价的必要性
常规的供应链由供应商、制造商、配送商、销售商组成。但由于建筑业的特点,建筑材料供应链管理还需要考虑设计方、建筑企业和业主的参与和功能,而且要实现对信息流、物流、资金流的控制。
建筑企业与建筑材料供应商的关系非常密切。建筑材料是建筑的基本物质,它决定着建筑的特征、风格、效果等。建筑材料的特点是分类广泛,除了砖、瓦、土、沙、木、石等传统建筑材料之外,还包括钢材、水泥、混凝土、玻璃、塑料等现代建筑材料。而发展到现在,建筑材料的内涵已经大大扩展,一般包括:建筑防火材料、建筑防水材料、建筑隔热材料、建筑降噪材料、建筑光学材料、建筑功能砂浆和建筑节能材料。这些材料的形态、计价方式、包装形式、交货形式都不尽相同。对原材料和设备的采购必须与建筑工程进度紧密关联,所采购建筑材料不仅涉及建筑性能、建筑成本、建筑工期、建筑质量等重要指标,而且与建筑施工环节中各种系统的布置和安装等活动密切相关。这就要求建筑企业与供应商之间建立良好的互动反馈。此外,在建筑过程中,业主有可能会指定一些设备、材料的供应商,这也是供应商评价在建筑企业生产活动中的一个反映。
随着建筑材料内涵的扩展,建筑材料供应商的范畴也在不断拓宽,越来越多的建筑配套产品需要外购,甚至部分预制件也都可外包给其他企业生产。这使建筑材料供应商的数量和种类进一步增加。
合理的供应商评价方法是选择供应商的前提。供应商评价的一般步骤为:分析市场竞争环境-建立选择的目标-建立供应商评价标准-建立评价小组-供应商参与-评价供应商。
3 数据挖掘
3.1 决策树方法
通过特定的算法,数据挖掘可以在已有的数据集中发现或生成特定的模式,而这些模式可能是人工难以识别的。当前,数据挖掘技术已经在很多行业得到了成功应用,并且正在向深度学习方向发展,将发挥更大的作用。
决策树方法是指在分析问题时,把所有的决策动作或事件的结果都展开,形成树状图,并利用该图反映出思考、预测、决策的全过程。当前最有影响力的决策树算法是C4.5算法是ID3算法的升级版,不仅可以处理离散型变量,还能处理连续型变量。C4.5算法采用了信息增益比作为选择测试属性的标准,从而使选择范围更加合理,弥补了ID3算法的不足。
C5.0算法则是C4.5算法的修订版,C5.0算法的最大特点是可生成多节点多分支的决策树。C5.0算法根据最大信息增益的属性进行样本拆分,并且可以进行循环拆分,从而保证耦合性降到最低。
3.2 C5.0算法
将训练样本集合作为决策树的根节点,然后分别计算每个特征属性的信息增益率,选择信息增益率最大的属性,把在
处取值相近的样本归于同一子集,对每种取值情况下的子集递归调用此计算过程,若子集只含有一个属性,则可建立一个叶节点作为分支,从而建立决策树。
4 方法研究
4.1 样本集建立
建筑材料供应商的特点是专业性强,一个供应商可能仅涉足一个领域,生产若干种产品,受到自身技术实力、生产规模、工艺方法等因素的制约,不同产品的质量、性能、交货周期也不尽相同。供应商评价则应以供应商的产品为主体进行。利用公开资料中收集到的各类建筑材料供应商的资料,收集了477个样本,样本从产品质保能力、技术能力、供应能力、售后服务能力几个指标来表达,由14个属性字段和评价字段组成,包括:质量管理水平、废品率、返修率、可靠度、失效率、产品开发能力、技术水平、自主知识产权程度、价格、合作态度、交货提前量、交货周期、准时交货率、服务及时率、交流反馈率、评价结果。表1为这些样本字段属性的分类情况。评价结果共分为两个类别:“好产品”和“差产品”。定义为:“好产品”就是建筑企业愿意在供应商处采购的产品;“坏产品”则是建筑企业不愿意采购的产品。
表1 样本字段属性分类
项目 | 编号 | 字段 | 定义 | 计算公式 |
质保能力 | C1 | 质量管理水平 | 产品质量认证/质量管理体系 | 定性分析 |
C2 | 废品率 | 某种产品的废品数量占该产品总采购量的百分比 | (废品产品数量/产品采购总量)×100% | |
C3 | 返修率 | 一种产品在规定的使用时间内,因失效而修理的时间与总工作时间之比 | (修理时间/总工作时间)×100% | |
C4 | 可靠度 | 产品在设计条件下和规定的工作时间内,实现设计功能的概率 | 观测统计数据 | |
C5 | 失效率 | 产品工作到某个时刻尚未出现故障,在该时刻之后一定时间∆t内出现故障的概率 | | |
技术能力 | C6 | 产品开发能力 | 反映供应商在满足客户对产品性能要求做出响应的能力 | 定性分析 |
C7 | 技术水平 | 反映供应商保证产品在标定技术状态的能力 | 定性分析 | |
C8 | 自主知识产权程度 | 反映供应商对技术的掌握程度 | 定性分析 | |
供应能力 | C9 | 价格 | 产品采购价格 | 单位:元 |
C10 | 合作态度 | 反映供应商对供求合作关系的投入程度 | 定性分析 | |
C11 | 交货提前量 | 实际交货时间与合同约定时间的差值,反映供应商应对市场波动的能力 | 实际交货时间-合同约定时间,单位:天 | |
C12 | 交货周期 | 从接受订单之日到交付产品之日的时间 | 实际交货时间-合同签署时间,单位:天 | |
C13 | 准时交货率 | 供应商准时交货次数与总交货次数之比 | (准时交货次数/总交货次数)×100% | |
售后服务能力 | C14 | 服务及时率 | 及时服务的次数与企业要求供应商提供的总服务次数之比 | (及时服务次数/服务总次数)×100% |
C15 | 交流反馈率 | 供应商对企业的回访次数与总交易次数之比 | (回访次数/总交易次数)×100% | |
评价结果 | C16 | 评价结果 | 好产品;差产品 |
|
4.2 决策树构建
在477个样本中随机抽取约80%作为训练样本集合,剩余的20%作为测试样本。样本集合中好、差产品的分布如表2所示。
表2 样本集合数量分布
| 数量 | 好产品 | 差产品 |
总样本集合 | 477 | 372 | 105 |
训练样本集合 | 382 | 293 | 89 |
测试样本集合 | 95 | 79 | 16 |
以类别C1为例,其信息增益率计算步骤如下:
类似地,按照上述步骤可以计算出其他14个决策属性的信息增益率。再对每个节点重复以上步骤,则可生成最终决策树模型。建筑材料供应商评价的决策树模型如图1所示。
图1 决策树模型分类结果
4.3 算例验证
基于本文建立的决策树模型,对训练样本集合和测试样本集合进行分类,分别观察预测正确率,结果如表4所示。在此模型中,正确率有两类,即将好产品误判为差产品的概率和差产品误判为好产品的概率。
表4 预测结果
训练样本集合 | 预测结果 | ||||
| 好产品 | 差产品 | 合计 | 正确率 | 错误率 |
好产品 | 277 | 16 | 293 | 94.54% | 5.46% |
差产品 | 17 | 72 | 89 | 80.9% | 19.1% |
测试样本集合 | 预测结果 | ||||
| 好产品 | 差产品 | 合计 | 正确率 | 错误率 |
好产品 | 62 | 17 | 79 | 78.48% | 21.52% |
差产品 | 5 | 11 | 16 | 68.75% | 31.25% |
从表4可以看出,预测结果总体是可行的,表明此决策树模型对筑材料供应商评价及选择具有一定的参考价值。
5 结论
针对建筑材料供应商管理问题,提出了一种基于决策树C5.0算法的建筑材料供应商评价模型。根据477个建筑材料供应商样本,分析了评价指标,建立了样本集合,并用样本集进行了算例验证,结果表明该方法是有效可行的。基于决策树的方法计算简单,可读性强,具有描述性,有助于人工分析。本文的研究只是一个开端,还应进一步研究人工智能算法在供应商评价方法中的应用,以提高预测精度。
参考文献
[1]杜利珍,余利琪,陶德馨.汽车零部件供应商的评价与选择方法及软件实现[J].物流科技,2006,29(126).
[2]湛述勇,陈荣秋.论JIT环境下制造商与供应商之间的关系——中国汽车工业中的JIT采购与供应[J].管理工程学报,1998,12(3).
[3]奚慧杰.浅论精益生产模式下供应商战略伙伴关系的建立[J].昌河科技,2005,(1).
[4]Han J,Kamber M.Data Mining:Concepts and Techniques[M].北京:高等教育出版社,2001.
[5]Fayyad U M,Piatetsky-Shapiro G,Smyth P,et al.Advances in Knowledge Discovery and Data Mining[M].MIT Press,1996.
[6]Hunt,E B,Krivanek,J.The effects of pentylenetetrazol and methyl-phenoxypropane on discrimination learning[J].Psychopharmacologia,1966,(9).
[7]Quinlan J R.Induction of Decision Trees[J].Machine Learning,1986,(4).
[8]Quinlan J R.C4.5:programs for machine learning[M].Morgan Kaufmann,1993.
[9]王学群.基于网络层次分析法的供应链核心企业供应商评价研究[D].合肥:合肥工业大学,2007.
[10]覃广深.基于供应链的供应商评价指标体系及方法的研究[D].镇江:江苏大学,2005.
(作者系大连育明高级中学学生)