當前位置：首頁 > 公文處理 > 征文論文 > MapReduce計算社交軟件共同好友_127.doc

MapReduce計算社交軟件共同好友_127.doc

海信翁

舉報
收藏

MapReduce計算社交軟件共同好友_127 裝訂處1MapReduceMapReduce計算社交軟件共同好友計算社交軟件共同好友摘要摘要MapReduce是一個分布式運算程序的編程框架，是開發(fā)“基于Hadoop的數據分析應用”的核心框架。</p>

MapReduce核心功能是將編寫的業(yè)務邏輯代碼和自帶默認組件整合成一個完整的分布式運算程序，并發(fā)運行在一個Hadoop集群上。

本文基于Hadoop平臺，編寫了MapReduce算法，對社交軟件的共同好友進行并行計算分析，在測試集數據上輸出結果符合預期要求。

關鍵字：關鍵字：MapReduce、并行計算、共同好友、Hadoop裝訂處2目錄目錄MapReduce計算社交軟件共同好友...........................................................................1摘要................................................................................................................................1目錄................................................................................................................................2一、引言........................................................................................................................3二、實驗環(huán)境................................................................................................................3三、MapReduce編程規(guī)范..........................................................................................41.Mapper階段.......................................................................................................42.Reducer階段......................................................................................................43.Driver階段.........................................................................................................4四、工作流程................................................................................................................4五、測試數據集............................................................................................................5六、代碼實現................................................................................................................51.第一次Mapper類............................................................................................52.第一次Reduce類實現.......................................................................................73.第一次Driver類................................................................................................84.第二次Mapper類............................................................................................105.第二次Reducer類...........................................................................................116.第二次Driver類..............................................................................................127.輸出結果...........................................................................................................13七、總結...................................................

MapReduce并行聚類優(yōu)化算法研究 (5)_126 1MapReduceMapReduce并行聚類優(yōu)化算法研究并行聚類優(yōu)化算法研究摘要摘要為了有效解決云計算環(huán)境下海量數據的并行聚類問題，以典型的基于距離的K-means聚類算法為例，提出了一種MapReduce并行聚類優(yōu)化算法。

首先將差分進化算法與K-rmeans算法相結合，從而利用差分進化算法的強大全局搜索能力克服典型K-means算法對初始中心較為敏感的缺點，利于增強全局最優(yōu)解的穩(wěn)定性。

然后把優(yōu)化后的算法在Hadoop的MapReduce框架下做了并行化的設計。

實驗結果表明，與其他多種分布式設計相比，提出的并行聚類優(yōu)化算法能夠在保證聚類效果的前提下，大大減少了運算的時間，提高了大規(guī)模數據的聚類效率。

關鍵字：大數據、K-means算法、聚類分析、差分進化算法、數據挖掘、MapＲeduce2目錄目錄MAPREDUCE并行聚類優(yōu)化算法研究并行聚類優(yōu)化算法研究...............................................................................................1摘要摘要...................................................................................................................................................1目錄目錄...................................................................................................................................................2一、一、K-MEANS聚類和差分進化算法分析聚類和差分進化算法分析.........................................................................................3二、基于差分進化的二、基于差分進化的K-MEANS聚類優(yōu)化聚類優(yōu)化........................................................................................3三、基于三、基于MAPＲEDUCE的聚類分布式設計的聚類分布式設計.....................................................................................5四、實驗及結果分析四、實驗及結果分析........................................................................................................................6（一）算法性能驗證..........................................................................................................................6（二）HADOOP平臺的搭建.................................................................................................................7（三）分布式平臺性能驗證..............................................................................................................7五、結論五、結論...........................................................................................................................................8參考文獻參考文獻...........................................................................................................................................9

127 【作業(yè)名稱】【作業(yè)名稱】TimeplannerTimeplanner【單元單元作業(yè)目標】作業(yè)目標】1.通過寫一寫，畫一畫的練習方式。

能聽、說、認讀單詞和詞組:Englishclass,musicclass,PEclass,breakfast,lunch,dinner,over,kid.2.通過采訪和做時間計劃表等訓練。

能熟練運用句型：“Whattimeisit?It’s...o’clock.It’stimefor...”詢問時間并問答，描述某時該做某事。

3.學會合理安排自己的作息時間，并形成良好的生活習慣。

4.能夠借助評價工具，檢查自己的任務語言是否正確并調整，提升自主學習能力。

【教材鏈接】【教材鏈接】PEP四下四下Unit2Whattimeisit?【作業(yè)設計】【作業(yè)設計】光陰如梭，時間很寶貴，我們要在有限的時間里，合理的安排我們的時間，做時間的主人。

Step1DOwell1.時間與我們的生活息息相關，發(fā)生在我們日?；顒又小?/p>

作為小學生的我們現在是祖國的花朵，學習是我們的日常。

我是Lily,下面是我在學校的一天。

完成下面橫線空白，看Lily是怎樣度過學校的一天的。

2.根據前面統(tǒng)計，填寫下面的空白。

Goodmorning!It’s_____.It’stimefor_____.(起床)It’s_____.It’stimefor_____.(早餐)It’s_____.It’stimefor_____.(上學)It’s_____.It’stimefor_____.(英語課)It’s_____.It’stimefor_____.(午餐)It’s_____.It’stimefor_____.(操場上玩耍)It’s_____.It’stimefor_____.It’s_____.It’stimefor_____.(上床睡覺)3.假如你是Lily,用英語描述一下自己在學校的一天。

Step2Doasurvey每個人都是獨一無二的，生活也有不同之處，大人有大人的安排，小朋友有小朋友的學習任務。

做一個小小時間調查員，調查班級的同學周末都在干什么，時間是怎么安排的，并完成下列調查表格。

1.采用對話的形式采訪一下班級同學，做一個采訪調查。

詢問同學周末都在干什么？例：Hello,I’mLily，TodayisMonday.Iwillintroduceadaytoeveryone.It’s6:30,It’stimetogetup.........A:Whatdoyoulikedoingduringtheweekends?B:Iusually......A:Whattimeisit?B:It’s_____.It’stime_____.

然后把優(yōu)化后的算法在Hadoop的MapReduce框架下做了并行化的設計。

基于MapReduce的Apriori算法并行化改進_135 裝訂處1基于基于MapReduceMapReduce的AprioriApriori算法并行化改進算法并行化改進摘要摘要基于MapReduce的并行Apriori算法解決了現有Apriori算法的問題，該算法多次掃描數據庫，但是候選集仍然是通過串行自連接從一組頻繁項中生成的，并且候選數據集很多生成。

在基于MapRe-duce的Apriori算法的基礎上，提高挖掘頻繁項集的Apriori算法的效率，并行化并改善連接階段，并提出了一種在大數據環(huán)境中挖掘頻繁項集的新算法-CApriori算法。

新算法使用Map和Reduce流程從頻繁的k個項目中并行獲取一組k+1個候選對象。

Apriori算法使生成頻繁項集的整個過程并行化，并在迭代過程中節(jié)省并減少了候選集的數量。

儲存空間和時間。

通過分析和比較時間復雜度，改進的算法可顯著減少處理大量數據時連接階段的時間消耗。

CApriori算法已經在Hadoop平臺上進行了測試，結果表明改進算法具有更高的效率，在大數據和小支持環(huán)境下都可以實現良好的加速能力。

關鍵詞關鍵詞:關聯(lián)規(guī)則;數據挖掘;MapReduce;Apriori裝訂處2目錄目錄摘要................................................................................................................................1目錄................................................................................................................................2引言................................................................................................................................3一、基本概念................................................................................................................3（一）Apriori算法...............................................................................................4（二）MapReduce編程模型...............................................................................4二、基于MapReduce的CApriori算法......................................................................5（一）MapReduce框架下的Apriori算法.........................................................5（二）Apriori算法并行化改進...........................................................................5三、實驗........................................................................................................................7（一）實驗環(huán)境....................................................................................................7（二）實驗結果與分析........................................................................................8四、結束語..................................................................................................................10五、源代碼..................................................................................................................101、代碼塊：Login..............................................................................................102、代碼塊：NaiveBayesFrame..........................................................................143、代碼塊：NaiveBayesConf............................................................................234、代碼塊：NaiveBayesMR..............................................................................255

剩... 頁未讀，繼續(xù)閱讀

閱讀已結束，您可以下載文檔離線閱讀

已有*人下載

下載本地文稿交換

本篇分享用戶

文檔簡介：

裝訂處1MapReduceMapReduce計算社交軟件共同好友計算社交軟件共同好友摘要摘要MapReduce是一個分布式運算程序的編程框架，是開發(fā)“基于Hadoop的數據分析應用”的核心框架。
MapReduce核心功能是將編寫的業(yè)務邏輯代碼和自帶默認組件整合成一個完整的分布式運算程序，并發(fā)運行在一個Hadoop集群上。
本文基于Hadoop平臺，編寫了MapReduce算法，對社交軟件的共同好友進行并行計算分析，在測試集數據上輸出結果符合預期要求。
關鍵字：關鍵字：MapReduce、并行計算、共同好友、Hado

精品久久国产精品,久久AV国产精品,国产精品久久久大片观看,熟女内射V888AV,亚洲av成人片无码网站网,一本一道波多野结衣av黑人

MapReduce計算社交軟件共同好友_127.doc

A PHP Error was encountered

A PHP Error was encountered

閱讀已結束，您可以下載文檔離線閱讀

推薦文檔