假设一个贝叶斯垃圾邮件过滤器在一个有10000个垃圾邮件信息和5000个非垃圾邮件信息的集合上训练。字"enhancement" 出现在了1500 个垃圾邮件信息和20个非垃圾邮件信息中。而字"herbal"出现在了800个垃圾邮件信息和200个非垃圾邮件信息中。估计收到的一条信息中既含有字"enhancement",又含有字"herbal"的概率。如果拒绝垃圾邮件的阈值是0.9,那么这条信息会被拒绝吗?
举一反三
- 假设在2000条垃圾邮件信息、1000条非垃圾邮件信息的集合上训练一个贝叶斯过滤器。字"stock"出现在了400条垃圾邮件信息和60条非垃圾邮件信息中,字"undervalued"出现在了200条垃圾邮件信息和25条非垃圾邮件信息中。一条信息中既含有字"stock"又含有字离散概率"undervalued",在事先不知道该信息是不是垃圾邮件的条件下,估计这条信息是垃圾邮件的概率。如果设置阈值为0.9,我们会认为这条信息是垃圾邮件而拒绝它吗?
- ()邮件时,一定要注意邮件主题和邮件内容,很多邮件服务器为过滤垃圾邮件设置了垃圾字词过滤。 A: 群发 B: 阅读 C: 下载 D: 上传
- 根据垃圾信息传播的媒体不同,垃圾信息又可以分为不同的类别,它们分别是() A: 垃圾短信息 B: 垃圾邮件 C: 即时垃圾信息 D: 博客垃圾信息 E: 搜索引擎垃圾信息
- 垃圾邮件是客户可以拒绝的邮件。
- 某邮件服务商希望开发垃圾邮件过滤的人工智能应用,实现自动区分垃圾邮件和非垃圾邮件的功能,下面哪种学习方法最适合此种应用需求: