建設工程教育網(wǎng) > 專(zhuān)業(yè)資料 > 工藝工法 > 水利水電 > 正文
2016-06-14 11:34 來(lái)源于網(wǎng)絡(luò ) 【大 中 小】【打印】【我要糾錯】
(1)信息收集。信息收集要在對項目目標和需求的充分理解的基礎上進(jìn)行。也就是先根據數據分析的目標和需求,確定所需要的特征信息,選擇合適的信息收集方法,然后再將收集到的信息存人數據庫。
(2)數據集成。數據集成既為數據共享,對不同來(lái)源、不同格式、不同性質(zhì)特點(diǎn)的數據進(jìn)行邏輯上或物理上整理。
(3)數據規約。數據規約是為提高數據挖掘效率而對數據源所進(jìn)行的預處理。如果不對數據源進(jìn)行規約,那么即使在少量數據上執行多個(gè)數據挖掘算法,也需要很長(cháng)的時(shí)間。而在大量數據上執行多個(gè)數據挖掘算法時(shí)。幾乎就無(wú)效率可言。采用數據規約可以得到數據源的規約表示。數據源規約表示與數據源相比,容量雖然小了得多,數據的完整性卻保持接近。正因如此,數據規約后數據挖掘的結果幾乎相同,但數據挖掘的效率卻有了較大提高。
(4)數據整理。數據庫中有一些數據的屬性值不完整、表示方式不一致。因此,需要對數據進(jìn)行再加工,用科學(xué)方法,填補丟失的數據。處理噪音數據。使數據完整、一致。
(5)數據變換。利用數學(xué)、統計學(xué)手段,將參與分析的數據,轉換成為適合數據挖掘的數據形式。
(6)數據挖掘。選擇合適的數據分析工具,應用規則推理、統計方法、決策樹(shù)、事例推理、模糊集、遺傳算法、神經(jīng)網(wǎng)絡(luò )等方法,對數據倉庫中的數據信息進(jìn)行處理,得出數據處理成果。
(7)模式評估。為了取得更為有效的知識,請專(zhuān)家數據挖掘結果。在評估的基礎上反復提取,進(jìn)而取得更有效的知識。
(8)成果表示。以專(zhuān)業(yè)的方式保存、傳遞、輸出、共享數據挖掘成果。
1、凡本網(wǎng)注明“來(lái)源:建設工程教育網(wǎng)”的所有作品,版權均屬建設工程教育網(wǎng)所有,未經(jīng)本網(wǎng)授權不得轉載、鏈接、轉貼或以其他方式使用;已經(jīng)本網(wǎng)授權的,應在授權范圍內使用,且必須注明“來(lái)源:建設工程教育網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其法律責任。
2、本網(wǎng)部分資料為網(wǎng)上搜集轉載,均盡力標明作者和出處。對于本網(wǎng)刊載作品涉及版權等問(wèn)題的,請作者與本網(wǎng)站聯(lián)系,本網(wǎng)站核實(shí)確認后會(huì )盡快予以處理。
本網(wǎng)轉載之作品,并不意味著(zhù)認同該作品的觀(guān)點(diǎn)或真實(shí)性。如其他媒體、網(wǎng)站或個(gè)人轉載使用,請與著(zhù)作權人聯(lián)系,并自負法律責任。
3、本網(wǎng)站歡迎積極投稿。