專有名詞對垃圾郵件偵測的影響

来源 :第18届海峡两岸咨询管理发展与策略学术研讨会暨2012两岸咨询发展高峰论坛 | 被引量 : 0次 | 上传用户:ceng0606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  垃圾郵件常包含產品名稱與價格資訊,或是夾帶名人的名字,本論文探討專有名詞詞彙辨識在垃圾郵件偵測上的運用,利用專有名詞辨識技術搭配資料探勘工具,探討對垃圾郵件偵測的影響。本論文利用英文、繁體中文及簡體中文等3種文字內容的電子郵件樣本,統計240個出現頻率較高的詞彙作為特徵(屬性),另外加上7種專有名詞作為特徵(屬性),包括:人(人名)、時(時間)、地(地點)、物(產品、物品)、百分比(%)、錢($)及數字(number)等專有名詞。搭配資料探勘工具,分析垃圾郵件辨識之正確率。
其他文献
  论文利用问卷调查和因子分析及多元回归等规范分析方法,从企业科技人员满意度的角度,对企业知识产权战略实施过程中高层领导特征及其对企业知识产权战略实施的影响等问题,进
会议
  因應電子商務的蓬勃發展,我國於民國89年推動電子發票實施計劃,提供營業人藉由資訊設備與網際網路傳遞電子發票給消費者,然而電子發票因有易傳遞、複製之特性,且所傳遞的內容
  由於過多來路不明的垃圾郵件(Spam Email),導致浪費了過多的網路頻寬資源,也造成了郵件伺服器過濾系統的龐大負擔。根據Symantec的統計數字顯示,垃圾郵件約佔郵件總量之70%,足
A globally optimal solution to vector quantization (VQ) index assignment on noisy channel, the evolutionary algorithm based index assignment algorithm (EAIAA),
  本論文探討利用自然語言處理技術對於中英文垃圾郵件過濾的效果,我們利用程式技術收集了英文、中文繁體、中文簡體垃圾郵件及正常郵件樣本,經過轉碼處理、詞彙處理、忽略詞
  2011年惡意程式、持續性攻擊與資料外洩威脅持續成為重要的網路攻擊趨勢,臺灣殭屍網路感染排名全球第二,僅次美國,惡意程式活動來源國排名亞太前三大,賽門鐵克安全威脅報告指
投案在确认之后3·24重大交通肇事逃逸案侦破纪实辽宁·程维忠3月25日晨7点多钟,法库县慈恩寺加油站米某刚迈出大门,就一眼瞅见门前路北俯卧着一位已经僵硬浑身是血的老者,距死者不远处
《阿惹妞》黎明即起,晚月犹在,静寂的彝家寨里,妹子红妆,阿哥素裹,“执手相看泪眼,竟无语凝咽”……自古以来,有缘无分的悲情故事就格外受到艺术创作者们的偏爱。马琳编导的
该文对一类带强迫项的高阶半线性分数阶微分方程建立了Lyapunov型和Hartman型不等式.推广并统一了现有文献中研究类似问题的结论,并减弱了相应条件.
太原市各界代表會議,自解放後成立以來,第一屆為時四個來月已開過五次會議,獲得了很大成績;它已在各界人民中樹立了相當深刻的印象,五次會議的内容在反映與集中各界人民的意