• 2022-05-29
    假设在2000条垃圾邮件信息、1000条非垃圾邮件信息的集合上训练一个贝叶斯过滤器。字"stock"出现在了400条垃圾邮件信息和60条非垃圾邮件信息中,字"undervalued"出现在了200条垃圾邮件信息和25条非垃圾邮件信息中。一条信息中既含有字"stock"又含有字离散概率"undervalued",在事先不知道该信息是不是垃圾邮件的条件下,估计这条信息是垃圾邮件的概率。如果设置阈值为0.9,我们会认为这条信息是垃圾邮件而拒绝它吗?