国产日韩精品欧美一区喷,大又大粗又爽又黄少妇毛片男同 ,另类色综合,在线免费不卡视频,国产精品V日韩精品,伊人久综合,在线无码va中文字幕无码,欧美有码在线观看

Frame頁面網絡日志數據挖掘預處理方法的論文

時間:2021-06-11 09:11:33 論文 我要投稿

關于Frame頁面網絡日志數據挖掘預處理方法的論文

  摘 要

關于Frame頁面網絡日志數據挖掘預處理方法的論文

  本文結合網絡日志數據挖掘技術,通過對Frame頁面和SubFrame頁面進行分析,提出基于改進的Frame頁面數據挖掘預處理方法。該方法從SubFrame頁面信息著手,從而提高預處理過程中的信息識別能力。實驗表明,該方法在網絡日志的數據挖掘預處理過程中,有效提高了信息的精準度。

  【關鍵詞】數據挖掘 Frame頁面 SubFrame頁面

  1 引言

  隨著互聯網技術的迅猛發展,簡單的信息搜索技術已經不能滿足現階段網絡信息獲取的需求。網絡日志數據挖掘技術是結合網絡日志用戶的訪問行為規律、興趣需求等信息,加以分析,優化網絡內容與網絡文本文檔的組織結構,以此提高網絡站點的競爭力。我們發現網絡日志記錄往往十分龐大,傳統的預處理方法,并不能很好解決日志頁面對站點組織結構的影響。因此,進行網絡日志預處理方法的研究,具有一定的現實意義。

  對于傳統的網絡日志的數據挖掘,預處理階段的Frame頁面和SubFrame頁面在用戶會話文件出現的概率很高,這就降低了會話識別的興趣度。因此,必須消除Frame頁面對網絡日志數據挖掘的影響。我們將Frame頁面以及其SubFrame頁面被看為一個整體,用Frame頁面代替通過會話文件尋找Frame頁面和Subframe頁面,并剔除多余的頁面,以提高日志數據挖掘的興趣性。

  2 改進的'Frame頁面數據挖掘預處理方法

  通過對Frame頁面過濾方法,結合實際情況分析,我們利用ID3決策樹算法,提出基于改進的Frame頁面過濾方法,以提高網絡日志數據挖據的效率。該方法如下:

  輸入:FS表(pidframne , pidsubframe)所對應的集合;集合屬性包括 {index.html,top.html,left.html,main.html,…}

  輸出:判定策略

  For each users session

  {

  currentframe=null

  make_node(web)

  if((cerrenframe, pid, ∈FS) make_tree(currentframe,web_left)

  Else if pid, ∈dom(FS)

  {curremtframe pidi make_decition_tree(currentframe,web_left}

  else make_decition-tree(currentframe,web_rleft

  if attribute_list=null{make_decition_tree(currentframe,web_right);}

  else if(one ofattribute_list)>allgain

  currentframe=test-attribute;

  make_decition(ai,web_left)

  Else generate_decision_tree(ai,web_right)

  }

  上述策略認為,訪問站點的頁面為根節點,具有信息增益最高的特征,currentframe變量記錄web當前頁面pidi。若當前頁面pidi不屬于frame頁面,則歸類左子樹,反之當前頁面pidi歸入右子樹。即pid,∈DOM(FS)。而frame頁面的subframe頁面歸類左子樹。這樣一來,frame頁面為決策樹右樹,subframe頁面為決策樹左樹,subframe頁面在會話識別階段得到保留,以便后續路徑補充。該方法優化了站點的組織結構,較好提升了網絡日志數據預處理效率。

  3 實驗分析

  我們通過Frame頁面過濾預處理方法實驗,驗證本文提出的改進方法。實驗提取700個日志所記錄的訪問頁面,共20萬條日志文件,結合本文提出的改進Frame頁面網絡日志數據挖掘預處理方法,與傳統頁面預處理方法進行對比測試。結果如表1所示。

  在表1中,絕對支持度表示用戶頻繁訪問頁面的最小會話數,FSi表示用戶頻繁訪問頁面集合數,*為用戶不感興趣的頁面集,△表示頁面集是用戶感興趣的,△△表示頁面集用戶感興趣程度加強。實驗表明,改進Frame頁面過濾方法相比傳統方法,預處理結果得到提高,因此,網絡日志的數據挖掘效率得到加強。

  4 小結

  本文通過對網絡日志數據挖掘預處理技術進行分析,結合預處理過程中的實際情況,著重考慮SubFrame頁面剔除對站點組織結構的影響,提出了改進的Frame頁面網絡日志數據挖掘預處理方法,實驗表明,該方法較好的提高了網絡日志數據挖掘的預處理精度和效率。

  參考文獻

  [1]方元康等.一種改進的Web日志會話識別方法[J].計算機技術與發展,2008,18(11):214-216.

  [2]朱明.數據挖掘[M].合肥:中國科技大學出版社,2008:13-56.

  [3]朱志國等.持久偏愛的Web用戶訪問路徑信息挖掘方法[J].情報學報,2010,29(2).

  [4]凌海峰等.基于混合蟻群算法的web用戶會話聚類[J].計算機工程與應用,2013(22).

  [5]韓法旺.Web日志挖掘數據預處理過程研究[J].南京工業職業技術學院學報,2012(2).

  [6]凌海峰等.基于聚類的web用戶會話識別優化方法[J].計算機應用研究,2012(8).

【Frame頁面網絡日志數據挖掘預處理方法的論文】相關文章:

數據挖掘論文03-31

數據挖掘論文07-15

數據挖掘教學方法研究論文07-04

專利數據挖掘的論文06-12

數據挖掘論文精選5篇論文06-13

網絡數據挖掘規劃論文04-03

大數據自動分析與數據挖掘探討的論文04-26

數據挖掘技術在WEB的運用論文04-26

數據挖掘在CRM中的應用論文04-10

主站蜘蛛池模板: 国产粉嫩粉嫩的18在线播放91 | 中国精品自拍| 久久精品丝袜| 亚洲婷婷六月| 最新国产精品第1页| 黑人巨大精品欧美一区二区区| 国产91线观看| 四虎成人精品| 国产免费久久精品99re不卡 | 亚洲91在线精品| 欧美精品高清| 欧美伦理一区| 日韩欧美中文在线| 午夜不卡福利| 欧美精品啪啪| 日韩欧美国产区| AV不卡无码免费一区二区三区| 草逼视频国产| 午夜日韩久久影院| 国产一区二区免费播放| 精品亚洲麻豆1区2区3区| a免费毛片在线播放| 亚洲天堂久久新| 国产区免费精品视频| 亚洲中文字幕97久久精品少妇| 婷婷亚洲综合五月天在线| 日韩A∨精品日韩精品无码| 爽爽影院十八禁在线观看| 波多野结衣第一页| 成人无码区免费视频网站蜜臀| 日韩欧美中文| 欧美日韩中文国产va另类| 国产一区二区精品福利| 国产日韩欧美在线视频免费观看| 日韩不卡高清视频| 国产精品任我爽爆在线播放6080| 久久精品无码中文字幕| 二级毛片免费观看全程| 欧美精品1区2区| 亚洲视频在线观看免费视频| 中国一级特黄视频| 亚洲天堂网在线视频| 久久久波多野结衣av一区二区| 久久香蕉国产线看观看亚洲片| 在线看国产精品| 久久精品女人天堂aaa| 99re热精品视频中文字幕不卡| 亚洲男人的天堂视频| 亚洲另类色| 999福利激情视频| 国产微拍精品| 夜色爽爽影院18禁妓女影院| 日韩免费中文字幕| 国产噜噜噜视频在线观看| 性欧美久久| 日韩无码视频播放| 日本尹人综合香蕉在线观看| 毛片大全免费观看| jizz亚洲高清在线观看| 国产成人午夜福利免费无码r| 狼友av永久网站免费观看| 国产av剧情无码精品色午夜| 亚洲精品不卡午夜精品| 国产视频久久久久| 国产美女精品一区二区| 国产真实二区一区在线亚洲| 中文字幕啪啪| 久久无码av三级| 国产黄在线免费观看| 精品无码国产自产野外拍在线| 欧美不卡视频在线| 国产电话自拍伊人| 国产一区二区色淫影院| 国产全黄a一级毛片| 爆乳熟妇一区二区三区| 毛片一区二区在线看| 91po国产在线精品免费观看| 国产极品美女在线| 欧美综合激情| 在线播放真实国产乱子伦| 伊人精品成人久久综合| 日本午夜在线视频|