论文部分内容阅读
本論文探討利用自然語言處理技術對於中英文垃圾郵件過濾的效果,我們利用程式技術收集了英文、中文繁體、中文簡體垃圾郵件及正常郵件樣本,經過轉碼處理、詞彙處理、忽略詞處理後,利用詞頻的計算,找出垃圾郵件中共通性高的詞彙,最後再利用決策樹,找出垃圾郵件與正常郵件中的隱藏關係,並用不同語系的郵件,不同的郵件數量及不同的屬性,交叉實驗找出過濾效果最佳的組合,並建立一個分類模型,以此模型的測試結果來評估效果。