2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩61頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、微博是繼博客之后迅速發展起來的一種新興網絡社交平臺,作為新興的媒介,在中國社交網絡中占據著主要地位。它以“碎片化”的信息滲透到社會生活的各個領域,掀起了中國社會信息傳播的微博熱。在微博發展過程中逐漸形成了不同專業、興趣的微博社區,這些社區是非常重要的組成部分,不僅能為用戶提供可靠的、有價值的和及時的信息,方便用戶交友,還能為商業和傳媒帶來新的傳播方式。如何能發現微博中社區顯得至關重要。
  社區發現主要以社區的方式把網絡劃分為若干

2、群組,以加速微博用戶自發聚集從而形成社區的過程。傳統社區發現算法主要通過分析頁面的鏈接結構和頁面內容,基于分層的方法來劃分社區,社區結構通常是樹形的。但隨著互聯網技術的發展,基于單一特征的傳統社區發現算法不再適用于新的社交網站。近年來,隨著圖論及數據挖掘技術的發展,很多分類聚類的方法也被用于Web社區發現,許多針對特定的社交工具,如博客等?;谝陨媳尘?,本文在總結已有Web社區發現技術的基礎上,引入社會網絡分析方法,并綜合考慮微博用戶的

3、主題和鏈接關系,提出了一種基于社會網絡分析的微博社區發現方法。
  首先,論文分析了微博的結構和特點。微博和其他社交工具最大的不同在于采用了全新的“following”社交模式,并且博文“碎片化”,這些機制更能促進交友和交流。
  其次,根據微博屬性和社區特征對微博建模。研究表明,新浪微博社區滿足“小世界”效應,存在冪律分布,用戶之間包含主題同質性和鏈接關系,符合社會網絡模型的特征。因此,論文選用社會網絡模型對社區建模。

4、r>  再次,設計實現了基于主題與鏈接分析的微博社區發現算法。標簽傳遞算法是一種半監督的分類算法,執行速度快,運算量小,但在計算節點間邊的權重時未考慮節點緊密度,影響了劃分精度。本文分析了微博用戶的鏈接關系和博文主題相似性,通過對鏈接相關度和主題相關度推導出用戶總相關度公式,以此作為邊的權值來計算節點間的傳遞概率,然后運用改進的標簽傳遞算法對社區分類。
  最后,利用社會網絡分析方法對劃分的社區進行定性和定量的分析。利用“Paje

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論