日本午夜免费一区二区,亚洲麻豆一区,国产伦精品一区二区三区千人斩,日韩高清电影一区

美林數據
ABOUT US
美林數據技術股份有限公司(簡稱:美林數據,NEEQ:831546)是國內知名的數據治理和數據分析服務提供商。

大話數據挖掘之聚類分析(上篇)

2021-01-28 14:17:45
人物介紹
許教授:國內數據挖掘專家、某985高校智能信息處理學術帶頭人
趙總:某電力公司總經理
萬總:某超市集團營銷副總
姜局長:市衛生局副局長
李部長:某鋼鐵集團生產部部長
 
某985高校管理學院第五屆EMBA班的《數據挖掘及其應用》課程上。
國內數據挖掘專家、智能信息處理學術帶頭人徐教授站在講臺上打開PPT說:“同學們,大家好!今天我們講的是數據挖掘中的聚類分析。”
“在平時的人際交往和私下的生活空間中,大多數人會自覺不自覺地加入到一個個社交圈子中。‘驢友’、‘同學會’、‘高爾夫俱樂部’,林林總總。真可謂‘物以類聚,人以群分’。”徐教授開始了聚類的講解。


聚類算法

“徐老師,是不是說,圈子就是聚類?”一學員問。
徐教授沒有正面回答,繼續說:“大家想一想,生活中的圈子有什么特點?”
李部長說到:“社會學家指出,‘圈子’就是由志向、趣味、地位、年齡、職業、愛好、特長、個性、收入甚至居住地點比較相近的人自發形成的團體。”
“對了,正是因為這些人具有相似的特征,他們才能聚集在一起。聚類就是將數據對象劃分成若干個類,在同一類中的對象具有較高的相似度,而不同類中的對象差異較大。”徐教授趁機給出了聚類的經典定義。
機器學習-聚類算法

剛才提問的那位學員從徐教授話語悟出了聚類的真諦,感慨道:“我有點明白了,我們加入某個‘圈子’,實際上就是聚類的過程,因為這個圈子的成員與我們有著相似的特點。”
這時,徐教授才對這位學員理解的圈子就是聚類作了正面回應:“回答正確,加十分!”
“徐老師,從聚類的定義來看,進行聚類前并不知道所研究的對象有多少個類,聚類的過程就是通過相似性的度量,使對象聚集成若干個類,各個類的成員具有其共同的或相似的特性。”李部長說出了自己對聚類的理解。
徐教授認為李部長的理解已經比較深刻,頻頻點頭。他因勢利導,又提出了一個深刻的問題:“聚類的關鍵是對象相似性的度量,大家想一想,如何度量數據對象的相似性呢?”
李部長搶答道:“兩個對象間的距離越小,說明二者越相似,用距離度量對象的相似性應該是最自然的方法。”
徐教授滿意地點了點頭:“對,基于距離度量對象的相似性的思想,研究者提出了兩類經典的聚類算法:劃分方法和層次聚類方法。”
趙總似乎對這兩種方法有所了解,說道:“聽我們公司數據挖掘算法組經常說Partitioning Method和 Hierarchial Method,原來就是指的這兩類聚類算法。徐老師,昨天晚上我預習時大概了解了一下聚類算法,但理解的不夠深刻,您就給我們講講吧。”
徐教授欣然答應,但沒有立即開始講算法,他先引導學員回顧基本的數學知識,問道:“大家還記得距離怎么計算?”
趙總簡潔地答道:“用歐氏距離唄!”
“對,就是大家在高等數學中經常用到的歐幾里得(Euclid)距離。不過在聚類分析中,還經常用到曼哈坦(Manhattan)距離、切比雪夫(Chebyshev)距離、馬哈拉諾比斯(Mahalanobis)距離等。其實,凡是滿足距離定義的四個條件即唯一性、非負性、對稱性和三角不等式的函數都可以作為距離公式。”
徐教授掃視了一下學員,覺得大家理解了距離的含義,于是說:“好了,我現在就簡單地介紹一下基于距離的聚類算法:劃分方法和層次方法。這兩類方法的典型代表分別為k-Means、k-Medoids和聚集、分裂算法。下面我就分別介紹這些算法。”
徐教授翻動了一下PPT,接著道:“k-Means算法的核心思想是把n個數據對象劃分為k個類,使每個類中的數據點到該類中心的距離平方和最小。”
李部長的腦子是雙核的,徐教授的話音剛落,他便道出了他的理解:“徐老師,k-Means算法本質上是在實現聚類的基本思想:類內數據點越近越好,類間點越遠越好盡可能算法。”
“李部長理解得完全正確,不過k-Means算法的思想只是給出了一個優化目標——距離之和最小,具體實現一般使用如PPT圖示的迭代算法。”
學員們都將注意力集中在k-Means算法框圖上,趙總看出了問題:“徐老師,k-Means算法事先就給定了聚類的個數k,然后通過迭代過程將數據點聚集到k個類中去。但是,一般情況我們并不知道數據點可以聚集成多少個類。”
“趙總說的對,k-Means算法就是要嘗試找出使平方誤差函數值最小的k個劃分,為了找出最合適的聚類個數k,一般要用若干個k去試驗,哪個k最后得到的距離平方和最小,就認為哪個k是最佳的聚類個數。”徐教授回答說。
李部長問道:“徐老師,k-Means算法第(3)步中的聚類中心是怎么計算的?”


聚類算法
 
“很簡單,將已聚集的點的均值作為新的聚類中心。這正是將這種聚類算法成為k-Means算法的原因。如果以各聚類均值點最近的點為聚類中心,其他步驟不變,則k-Means算法就變為k-Medoids算法了。”徐教授回答道。
徐教授突然冒出了個k-Medoids算法,又被李部長的雙核腦筋捕捉到了:“徐老師,k-Medoids算法只是對k-Means算法作了個小小的改變,這樣有什么作用呢?”
徐教授笑了笑,說:“k-Medoids算法用簇中最靠近中心的一個對象來代表該簇,而k-Means算法用質心來代表簇。可見k-Means算法對噪聲和孤立點數據非常敏感,因為一個離群值會對質心的計算帶來很大的影響。而k-Medoids算法通過用中心點來代替質心,可以有效地消除這種影響。”
聽徐教授這么一解釋,李部長又大發感慨:“真是小改變,大作用啊!”
趙總覺得他們電力行業對數據挖掘有迫切的應用需求,非常關注算法的應用效果,又問道:“k-Means算法的應用效果怎么樣?”
徐教授:“當結果簇是密集的,而簇與簇之間區別明顯時,k-Means算法的效果較好。對于大規模數據集,該算法是相對可擴展的,并且具有較高的效率。
李部長不僅腦子轉速高,而且善于從反面思考,他又提出了一個問題:“徐老師,k-Means算法和k-Medoids算法有哪些不足呢?”
徐教授對答如流:“首先,k-Means算法和k-Medoids算法只有在簇的數據點的平均值有定義的情況下才能使用。這可能不適用于某些應用,例如涉及有離散屬性的數據。”
還沒有等徐教授的“其次”出口,一直只聽不說的超市集團的萬總,被徐教授的這句話觸動了,道出了她們數據挖掘時遇到的問題:“k-Means算法和k-Medoids算法一般適用于連續變量,而對于離散屬性的對象,例如兩本書,A=(小說,英文,1/32開本,浙江大學出版社),B=(計算機圖書,中文,1/16開本,浙江大學出版社),就無均值可言,當然無法使用這兩種算法。那么,對于含有離散屬性數據的聚類問題怎么辦呢?”
徐教授:“為了就解決這類問題,人們對k-Means算法進行改進,出現了很多它們的變種,例如,k-模算法用模代替簇的平均值,用新的相異性度量方法來處理分類對象,用基于頻率的方法來修改聚類的模。而k-Means算法和k-模算法相結合,用來處理有數值類型和分類類型屬性的數據,就產生了k-原型算法。”
聽了徐教授的回答,萬總非常高興:”k-模算法和k-原型算法對我們可太有用了。徐老師,您就詳細給我們講講k-模算法和k-原型算法吧!”
徐教授看了看手表,說道:“今天的時間差不多了,關于k-模算法和k-原型算法的更多內容我們下節課再講。同學們,下節課見!”

服務熱線
400-608-2558
咨詢熱線
15502965860-
美林數據
微信掃描二維碼,立即在線咨詢
日本午夜免费一区二区,亚洲麻豆一区,国产伦精品一区二区三区千人斩,日韩高清电影一区
玖玖玖国产精品| 亚洲精品伊人| 午夜电影一区| 国产福利亚洲| 麻豆精品蜜桃| 蜜桃视频一区二区三区| 国产精品美女久久久久久不卡| 成人污污视频| 亚洲欧美日韩国产一区二区| 国产精品密蕾丝视频下载| 成人福利av| 免费在线观看成人| 免费一区二区三区在线视频| 久久久亚洲一区| 国产精品一区二区免费福利视频| 99成人在线视频| 免费日韩av片| 欧美片第1页综合| 美女高潮久久久| 日韩中文在线电影| 黑丝美女一区二区| 亚洲理论在线| 免费看一区二区三区| 成人福利av| 亚洲欧美日本视频在线观看| 日本不卡一二三区黄网| 久久不卡国产精品一区二区| 国产福利片在线观看| 亚洲成av人片一区二区密柚| 欧洲毛片在线视频免费观看| 国产美女一区| 国产亚洲欧美日韩在线观看一区二区 | 久久亚洲电影| 欧美专区一区| 日韩不卡在线| 亚洲精品日本| 久久精品人人| 欧美在线网站| 欧美中文一区| 成人福利av| 亚洲午夜国产成人| 精品五月天堂| 亚洲一区日本| 国产女人18毛片水真多18精品| av在线最新| 蜜臀a∨国产成人精品| 麻豆国产91在线播放| 国产综合欧美| 欧美天堂在线| 999久久久精品国产| 日本成人在线不卡视频| 日韩福利一区| 日韩精品欧美成人高清一区二区| 国产精品伦理久久久久久| 日韩影院精彩在线| 日本一区二区免费高清| 丝袜国产日韩另类美女| 国产精品99一区二区三| 天堂va蜜桃一区二区三区| 国产一区二区三区国产精品| 老司机精品久久| 国产91在线播放精品| 蜜桃av一区| 国产粉嫩在线观看| 日韩在线网址| 亚洲一级黄色| 精品国产黄a∨片高清在线| 久久亚洲美女| 秋霞影视一区二区三区| 国产乱人伦丫前精品视频| 91成人精品| sm久久捆绑调教精品一区| 日韩精品中文字幕一区二区| 国产色播av在线| 欧美亚洲综合视频| 国产精品毛片在线看| 久久电影tv| 国产精品久久久久久久久久齐齐 | 国产激情在线播放| 亚洲aa在线| 国产91精品对白在线播放| 免费日韩成人| 婷婷五月色综合香五月| 伊人精品一区| 成年男女免费视频网站不卡| 国产欧美啪啪| 亚洲最新av| 欧美日韩视频一区二区三区| 首页国产精品| 欧美激情网址| 欧美日韩网址| 日韩欧美在线精品| 99在线观看免费视频精品观看| a日韩av网址| 精品久久美女| 国产精品一区二区三区美女 | 日韩精品一区二区三区免费观看| 久久av影院| 国产精品一区二区中文字幕| 日韩激情网站| 日韩一区二区三区四区五区| 亚洲欧美高清| 性一交一乱一区二区洋洋av| 午夜欧美理论片| 日韩精品一区第一页| 九九久久电影| 久久在线电影| 亚洲四虎影院| 亚洲成av在线| 成人看片网站| 亚洲综合在线电影| sm捆绑调教国产免费网站在线观看 | sm久久捆绑调教精品一区| 六月丁香综合在线视频| 老牛国内精品亚洲成av人片| 国产精品久久久久久久久久白浆| 日韩精品久久理论片| 亚洲制服一区| 视频国产精品| 欧美在线精品一区| 国产亚洲一区| 国产精品久久久久毛片大屁完整版| **爰片久久毛片| 国产欧美另类| 国产福利一区二区三区在线播放| 国产精品嫩模av在线| 国产免费av一区二区三区| 日本午夜精品| 国产精品色在线网站| 欧美1区2区3| 超碰成人av| 久久精品91| 快播电影网址老女人久久| 久久久噜噜噜| 99久久久久国产精品| jiujiure精品视频播放| 亚洲中午字幕| 亚洲aa在线| 91成人在线| 欧美经典一区| а√天堂8资源中文在线| se01亚洲视频| 激情欧美日韩一区| 免费视频一区二区| 国产乱人伦精品一区| 国产一区二区三区日韩精品| 久久激情一区| 2023国产精品久久久精品双| 美日韩精品视频| 欧美亚洲综合视频| 国产一区二区三区四区五区传媒| 在线亚洲人成| 日韩中文字幕区一区有砖一区| 日韩高清不卡一区| 成人日韩av| 在线国产一区| 亚洲精一区二区三区| 国产精品红桃| 日韩精品欧美激情一区二区| 石原莉奈在线亚洲二区| 欧美日韩一区二区国产| 日韩综合在线| 激情五月综合| 日韩高清欧美激情| 91视频久久| 视频一区二区中文字幕| 欧美日本不卡| 97精品视频在线看| 欧美99久久| 欧美一级一区| 久久久久国产精品一区二区| 蜜桃av一区二区在线观看| 国产日韩中文在线中文字幕| 日韩中文字幕高清在线观看| 亚洲一区二区小说| 久久伊人国产| 国产一区导航| 国产精品伊人| 日韩不卡视频在线观看| 午夜精品影视国产一区在线麻豆| 麻豆国产精品一区二区三区| 亚洲激情中文| 国产毛片一区二区三区| 国产精品一页| 欧美日韩国产亚洲一区| 欧美日韩夜夜| 91看片一区| 日韩高清二区| 亚洲国产专区校园欧美| 欧美亚洲人成在线| 国精品一区二区| 久久av网址| 欧美日韩国产免费观看视频| 久久国产麻豆精品| 五月天综合网站| 久久精品国产久精国产爱| 蜜臀va亚洲va欧美va天堂| 日韩一区二区在线免费| 久久精品97| 久久国产精品久久久久久电车|