商務智能(business intelligence,BI)是1989年由Gartner Group的Howard Dresner提出,但目前對商務智能還沒有統(tǒng)一的定義。一般地,商務智能被認為是將存儲于各種商業(yè)信息系統(tǒng)中的數(shù)據(jù)通過智能手段轉換成有用信息以幫助企業(yè)提高決策能力解決商業(yè)問題的概念、方法和技術的集合。商務智能引起了國內外企業(yè)界和軟件開發(fā)界的廣泛關注,并成為當前一個熱點研究問題。作為商務智能的重要組成部分之一的數(shù)據(jù)挖掘(dataining,DM)的研究提高到了一個新的高度,在分布式商務智能環(huán)境下,采取合適的數(shù)據(jù)挖掘系統(tǒng)模型和數(shù)據(jù)挖掘算法尤為重要。
Agent技術是人工智能的新興研究課題,是有效解決復雜分布式問題的計算模式之一。基于Agent技術的應用系統(tǒng)不僅具有一般分布式系統(tǒng)所具有易于擴張、靈活性強等特點,而且系統(tǒng)具有很強的智能性和組織能力。本文在分析商務智能分布式環(huán)境基礎上,介紹了面向商務智能的分布式數(shù)據(jù)挖掘系統(tǒng)應具有的基本特點,提出了一種面向商務智能應用基于Agent技術的分布式數(shù)據(jù)挖掘系統(tǒng),并討論了系統(tǒng)各組成部分功能特點。
1 商務智能的分布式環(huán)境
商務智能的發(fā)展,先后經歷了事務處理系統(tǒng)、高級管理員信息系統(tǒng)、管理信息系統(tǒng)、決策支持系統(tǒng)和專家系統(tǒng)等階段,最終演變成今天的商務智能。商務智能系統(tǒng),與這些信息系統(tǒng)相比,主要區(qū)別之一是用戶不再僅僅局限于企業(yè)的領導和決策分析人員,而是擴展到企業(yè)組織內外各類人員,即商務智能系統(tǒng)是面向多層次各類用戶的應用需要。這些用戶往往分布在不同部門或地區(qū),從而使商務智能系統(tǒng)面向分布式應用環(huán)境。
同時,商務智能面向分布式數(shù)據(jù)環(huán)境。商務智能有效地集成企業(yè)內外部各種商業(yè)數(shù)據(jù),并轉換成易于理解的商業(yè)知識,幫助企業(yè)內外部用戶進行科學決策,更好地實現(xiàn)商業(yè)目的。企業(yè)內部數(shù)據(jù)是指通過企業(yè)各種業(yè)務信息系統(tǒng)收集到的數(shù)據(jù)。這些數(shù)據(jù)可能分布在不同的硬件、數(shù)據(jù)庫、網絡環(huán)境中,為不同的業(yè)務部門服務。外部數(shù)據(jù)主要是市場信息和外部競爭對手信息,這些數(shù)據(jù)可以通過網絡或市場調研等手段獲得。因此,商務智能將肯定面向分布式的應用環(huán)境和數(shù)據(jù)環(huán)境。
2 面向商務智能應用的數(shù)據(jù)挖掘系統(tǒng)特點
為了充分利用企業(yè)內外流動的大量商業(yè)數(shù)據(jù),企業(yè)商業(yè)智能系統(tǒng)必須采用數(shù)據(jù)挖掘技術實現(xiàn)商務知識的發(fā)現(xiàn)。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘出隱含的、未知的、用戶可能感興趣的和對決策有價值的知識和規(guī)則。傳統(tǒng)的商務智能數(shù)據(jù)挖掘是采用一種集中式思想,即要求將這些分布存儲的數(shù)據(jù)收集到一個集中的地方,然后才進行知識發(fā)現(xiàn)、管理和決策,這樣的商務智能要求企業(yè)有高速的數(shù)據(jù)通信網絡。商務智能往往需要用戶交互以獲取參數(shù)信息,這無疑增加了集中式商務智能系統(tǒng)的負荷。同時,這種方式也破壞了數(shù)據(jù)的私有性和安全性。因此,數(shù)據(jù)的分布式存儲、數(shù)據(jù)的私有性和安全性、用戶頻繁的信息交互和商務智能的及時性要求等迫切需要深入研究分布式環(huán)境下的分布式數(shù)據(jù)挖掘技術。
分布式數(shù)據(jù)挖掘(distributed data mining,DDM)主要涉及到分布式數(shù)據(jù)挖掘系統(tǒng)模型和分布式數(shù)據(jù)挖掘算法。一個分布式數(shù)據(jù)挖掘系統(tǒng)是一個復雜的實體,整個系統(tǒng)必須提供有效的訪問分布式數(shù)據(jù)和計算資源、監(jiān)控整個挖掘過程和以一定格式將挖掘結果呈現(xiàn)給用戶的功能。而且,一個成功的DDM系統(tǒng)應該具有靈活的結構,提供一個簡單的更新其組件的方式以適應變化的環(huán)境。由此可見,面向商務智能的分布式數(shù)據(jù)挖掘系統(tǒng)模型應該具有以下特點:①采用模塊化設計,保證系統(tǒng)中不同模塊可以根據(jù)需要進行靈活地增減和配置以及分布式數(shù)據(jù)挖掘系統(tǒng)的持續(xù)可用;②實現(xiàn)分布式移動數(shù)據(jù)挖掘,滿足商務智能系統(tǒng)中多層次用戶的多種數(shù)據(jù)挖掘需要,保證商業(yè)數(shù)據(jù)安全;③采用商務本體知識模型和通用數(shù)據(jù)描述格式實現(xiàn)各個站點上的分布式數(shù)據(jù)挖掘以及數(shù)據(jù)挖掘系統(tǒng)與其他系統(tǒng)的信息交互;④集成多種安全保障技術,滿足業(yè)務系統(tǒng)安全以及分布式數(shù)據(jù)挖掘系統(tǒng)自身安全需要。
3 基于Agent技術的分布式數(shù)據(jù)挖掘系統(tǒng)
為了滿足分布式數(shù)據(jù)挖掘的需要,三層客戶/服務器結構被應用到系統(tǒng)設計中,如Kensington系統(tǒng)和Intelliminer系統(tǒng)。然而,這些系統(tǒng)采用的體系結構本質上仍沒有改變集中式數(shù)據(jù)挖掘系統(tǒng)的模式,系統(tǒng)缺乏開放性、自主性和智能性。為了提高系統(tǒng)的智能性和開放性,融合不同的數(shù)據(jù)挖掘技術,許多學者將數(shù)據(jù)挖掘過程進行功能抽象,并分別由不同的Agent來完成。對于大量分散數(shù)據(jù)的數(shù)據(jù)挖掘,更多系統(tǒng)采用基于Agent的分布式結構模型,其中典型的應用系統(tǒng)如JAM系統(tǒng)和BODHI系統(tǒng)。本文充分利用移動Agent的移動性并以Agent為主要組件構造滿足商務智能需要的分布式數(shù)據(jù)挖掘系統(tǒng)。同時,系統(tǒng)中Agent按照FIPA標準設計,這樣只要增加消息轉換和服務描述注冊轉換器等部件就可以實現(xiàn)Agent與web services的集成,從而使得系統(tǒng)支持web功能。因此,整個系統(tǒng)具有更大的靈活性、智能性和開放性。
3.1 分布式數(shù)據(jù)挖掘系統(tǒng)整體結構
如圖1所示,整個商務智能系統(tǒng)可以整合為4個部分:用戶群、用戶接口、數(shù)據(jù)挖掘系統(tǒng)和企業(yè)數(shù)據(jù)庫系統(tǒng)。用戶通過用戶接口提交數(shù)據(jù)挖掘請求,數(shù)據(jù)挖掘系統(tǒng)規(guī)劃數(shù)據(jù)挖掘任務并創(chuàng)建裝配數(shù)據(jù)挖掘Agent。依據(jù)要求,數(shù)據(jù)挖掘Agent遷移到企業(yè)業(yè)務數(shù)據(jù)庫系統(tǒng)中進行數(shù)據(jù)挖掘,并提交結果給協(xié)調Agent進行綜合且按照用戶要求返回結果。
1)用戶接口 是用戶與數(shù)據(jù)挖掘系統(tǒng)互操作的渠道,完成用戶參數(shù)的輸入和數(shù)據(jù)挖掘結果的顯示。例如,用戶可以選擇挖掘模型(挖掘算法)、數(shù)據(jù)源、挖掘的預設流程等;用戶可以完成系統(tǒng)中Agent的知識和規(guī)則的更新,彌補系統(tǒng)知識的不足;用戶還可以選擇最終的挖掘結果的可視化形式等。
2)數(shù)據(jù)挖掘系統(tǒng) 是基于Agent的分布式數(shù)挖掘系統(tǒng)的工作流程大致為:①用戶Agent將用戶通過用戶接口提交的數(shù)據(jù)挖掘任務轉變成協(xié)調Agent可接受的挖掘任務;②協(xié)調Agent綜合環(huán)境信息規(guī)劃數(shù)據(jù)挖掘任務,創(chuàng)建多個裝載合適挖掘模型的移動數(shù)據(jù)挖掘Agent,并將這些移動Agent打包和序列化為數(shù)據(jù)流進行數(shù)據(jù)的網絡移動。
圖1 基于Agent技術的分布式數(shù)據(jù)挖掘系統(tǒng)結構
3)企業(yè)數(shù)據(jù)庫系統(tǒng)主要由移動Agent服務器、業(yè)務子系統(tǒng)和數(shù)據(jù)庫等3部分組成。這里,移動Agent服務器作為windows服務而在系統(tǒng)啟動時自動啟動。
3.2 數(shù)據(jù)挖掘系統(tǒng)
如圖1所示,數(shù)據(jù)挖掘系統(tǒng)由協(xié)調Agent、數(shù)據(jù)挖掘Agent、數(shù)據(jù)挖掘Agent管理器、用戶Agent、挖掘算法Agent和數(shù)據(jù)站點管理Agent組成。其中,數(shù)據(jù)挖掘Agent是移動Agent,其他功能Agent
為靜態(tài)Agent。這些Agem協(xié)調一致地工作,共同完成數(shù)據(jù)挖掘任務。
1)用戶Agent代表用戶向數(shù)據(jù)挖掘系統(tǒng)提出數(shù)據(jù)挖掘請求。只需要用戶提出相應的要求或者做一系列的選擇,用戶Agent就可以將用戶要求轉化為協(xié)調Agent能夠識別的命令并提交給協(xié)調Agent進行任務的計劃分配;用戶Agent還負責處理通過用戶接口輸入的系統(tǒng)更新信息等,如數(shù)據(jù)挖掘特定算法參數(shù)、Agent知識和規(guī)則等。該Agent除了處理用戶輸入的信息外,還需要能夠保存數(shù)據(jù)挖掘結果等輸出信息以待用戶查詢或直接提交這些信息給用戶擁有的用戶接口。
2)協(xié)調Agent主要完成下列3項任務:①任務規(guī)劃優(yōu)化,主要完成數(shù)據(jù)挖掘任務的規(guī)劃,并選擇最優(yōu)的規(guī)劃方案。與數(shù)據(jù)挖掘算法Agent、數(shù)據(jù)挖掘Agent管理器和數(shù)據(jù)站點管理Agent交互,得到數(shù)據(jù)挖掘算法效率功能特點、系統(tǒng)中挖掘Agent的功能狀態(tài)等信息來確定相應的數(shù)據(jù)挖掘方案以盡可能滿足用戶需要。該Agent還具有實時規(guī)劃能力以滿足因某個移動Agent失效而進行任務的重新規(guī)劃。②依據(jù)規(guī)劃結果,協(xié)調Agent創(chuàng)建并命名多個并行協(xié)同工作的裝載有挖掘模型的移動數(shù)據(jù)挖掘Agent,并將這些移動Agent的基本信息注冊到挖掘Agent管理器中。③數(shù)據(jù)挖掘整個過程的協(xié)作協(xié)調,主要協(xié)調數(shù)據(jù)挖掘過程的各個Agent以及維護系統(tǒng)當前的運行狀態(tài)信息等。同時,協(xié)調Agent也是系統(tǒng)中Agent信息交換中心,負責維護Agent之間信息的交互傳遞等。
3)數(shù)據(jù)挖掘Agent是移動Agent,由協(xié)調Agent創(chuàng)建,并移動到相應的數(shù)據(jù)庫系統(tǒng)主機上進行數(shù)據(jù)挖掘,并將自身的,其他功能Agent
為靜態(tài)Agent。這些Agem協(xié)調一致地工作,共同完成數(shù)據(jù)挖掘任務。
1)用戶Agent代表用戶向數(shù)據(jù)挖掘系統(tǒng)提出數(shù)據(jù)挖掘請求。只需要用戶提出相應的要求或者做一系列的選擇,用戶Agent就可以將用戶要求轉化為協(xié)調 Agent能夠識別的命令并提交給協(xié)調Agent進行任務的計劃分配;用戶Agent還負責處理通過用戶接口輸入的系統(tǒng)更新信息等,如數(shù)據(jù)挖掘特定算法參 數(shù)、Agent知識和規(guī)則等。該Agent除了處理用戶輸入的信息外,還需要能夠保存數(shù)據(jù)挖掘結果等輸出信息以待用戶查詢或直接提交這些信息給用戶擁有的 用戶接口。
2)協(xié)調Agent主要完成下列3項任務:①任務規(guī)劃優(yōu)化,主要完成數(shù)據(jù)挖掘任務的規(guī)劃,并選擇最優(yōu)的規(guī)劃方案。與數(shù)據(jù)挖掘算法Agent、數(shù)據(jù)挖掘 Agent管理器和數(shù)據(jù)站點管理Agent交互,得到數(shù)據(jù)挖掘算法效率功能特點、系統(tǒng)中挖掘Agent的功能狀態(tài)等信息來確定相應的數(shù)據(jù)挖掘方案以盡可能 滿足用戶需要。該Agent還具有實時規(guī)劃能力以滿足因某個移動Agent失效而進行任務的重新規(guī)劃。②依據(jù)規(guī)劃結果,協(xié)調Agent創(chuàng)建并命名多個并行 協(xié)同工作的裝載有挖掘模型的移動數(shù)據(jù)挖掘Agent,并將這些移動Agent的基本信息注冊到挖掘Agent管理器中。③數(shù)據(jù)挖掘整個過程的協(xié)作協(xié)調,主 要協(xié)調數(shù)據(jù)挖掘過程的各個Agent以及維護系統(tǒng)當前的運行狀態(tài)信息等。同時,協(xié)調Agent也是系統(tǒng)中Agent信息交換中心,負責維護Agent之間 信息的交互傳遞等。
3)數(shù)據(jù)挖掘Agent是移動Agent,由協(xié)調Agent創(chuàng)建,并移動到相應的數(shù)據(jù)庫系統(tǒng)主機上進行數(shù)據(jù)挖掘,并將自身的位置信息和狀態(tài)信息傳遞給挖掘 Agent管理器,將數(shù)據(jù)挖掘結果反饋給協(xié)調器以進行數(shù)據(jù)結果的融合。數(shù)據(jù)挖掘Agent運用自身攜帶的算法模型或請求協(xié)調Agent得到的算法等完成具 體的數(shù)據(jù)挖掘任務。
4)數(shù)據(jù)挖掘Agent管理器主要負責管理所有數(shù)據(jù)挖掘Agent的相關信息,這樣各種Agent通過與管理Agent交互便可以動態(tài)獲取其他Agent 的屬性信息(位置、功能等),從而與其他Agent進行交互,以獲取所需要的信息。是實現(xiàn)系統(tǒng)分布式透明性的關鍵,主要用于收集、管理、統(tǒng)計、查詢各種 Agent信息資源,按其功能分類或建立Agent聯(lián)盟。同時,也擔當可信任的安全認證中心,保證各Agent之間的安全通信機制。
5)數(shù)據(jù)挖掘算法Agent主要負責維護數(shù)據(jù)挖掘算法。用戶可以注冊數(shù)據(jù)挖掘算法。當算法注冊到系統(tǒng)中,算法Agent登記算法的元知識信息及其特點(比 如,名字、版本、輸入?yún)?shù)、操作環(huán)境描述和輸出格式等)。同時,算法Agent將這些信息反饋給協(xié)調Agent以便協(xié)調Agent根據(jù)數(shù)據(jù)挖掘任務選擇最 佳的算法。
6)數(shù)據(jù)站點管理Agent 主要負責企業(yè)數(shù)據(jù)庫系統(tǒng)Agent服務器的基本信息,如Agent服務器的啟動、停止狀態(tài)信息、位置信息以及數(shù)據(jù)源信息等。Agent服務器及時將其啟 動、停止信息注冊到數(shù)據(jù)站點管理器以便協(xié)調器合理規(guī)劃任務。為了維護Agent服務器和防止Agent服務器出現(xiàn)故障,往往在企業(yè)提供同步工作的 Agent服務器。
數(shù)據(jù)挖掘系統(tǒng)由6類功能各異協(xié)同工作的Agent組成,當接受到用戶提交的具體數(shù)據(jù)挖掘任務后,系統(tǒng)自動有條不紊地工作。在整個系統(tǒng)中,數(shù)據(jù)挖掘Agent及執(zhí)其執(zhí)行環(huán)境——移動Agent服務器是數(shù)據(jù)挖掘任務執(zhí)行的關鍵部件。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.nttd-wave.com.cn/
本文標題:面向商務智能應用的分布式數(shù)據(jù)挖掘系統(tǒng)設計
本文網址:http://m.nttd-wave.com.cn/html/consultation/1082067382.html