那么,如果CAPTCHA即将推出,接下来会发生什么?
随着文本识别能力的提高和使用Mechanical Turks破解无法破解的密钥的CAPTCHA破解者,阻止脚本通过垃圾邮件破坏依赖用户输入的网站的下一项技术是什么?
解决方案
回答
我喜欢使用信用卡或者手机短信(例如Craigslist和Gmail)限制登录。这些方法的成本不高(<1美元),但是在控制垃圾邮件帐户方面非常有效。
但是,在SO之类的网站上这很棘手,因为创建目标之一是使摩擦最小化并允许匿名用户参与。我想这就是节制和投票发挥作用的地方。
回答
我喜欢"隐形验证码"的概念。 Phil Haack在这里详细介绍了一种实现。
这是基于机器人,蜘蛛和搜寻器未实现javascript引擎这一事实。这也可能在不久的将来改变。
回答
防止人们泛滥用户输入站点的最基本工具是链接上的" nofollow"标记。大多数垃圾评论发送者对Google果汁感兴趣,而不是真正看到他们的东西,因此nofollow消除了诱因。
回答
图像识别而不是文本识别。
回答
目前,声誉系统很难被击败。在不久的将来,社区站点将需要依靠其较高级别的成员来删除垃圾邮件。
垃圾邮件的趋势将变得与合法内容越来越难以区分,并且每新一代的机械过滤器都会因过度使用抗生素而死于无效性。
随着垃圾邮件发送者开始维护袜子木偶场以创建自己的高级会员,甚至信誉系统也将变得毫无用处,当社区反击时,垃圾邮件发送者将养活袜子木偶,这只是做生意的另一笔成本。
如果我们要建立一个包含用户内容的网站,则或者需要订阅永无休止的CAPTCHA后继者,或者首先可以找到一种消除诱使网站成为垃圾内容的方法。
回答
随着计算机不擅长人类擅长的问题,这个标准将不断提高。诸如识别人脸中的情绪之类的东西是人类特别擅长的事情。
另一个选择可能是区分恶心还是好。这完全是主观的,但是人类倾向于讨厌烂食,开放性伤口,便便等。
回答
图林测试阴性。在WordPress,IP.Board和MediaWiki网站上已经使用了一年多,并且垃圾邮件绝对为零。唯一的问题:我们必须考虑一个既不常见的问题/答案组合(否则,自动程序会适应)也不是特定于领域的(否则,潜在的用户可能不知道答案)。
回答
通常,对于具有任何价值的资源进行保护的站点,我们需要采用三管齐下的方法:
- 仅来自经过身份验证的用户的油门响应禁止匿名帖子。
- 尽量减少(但不阻止)经过身份验证的用户发布的几则垃圾帖子-例如基于信誉。
- 使用服务器端启发式逻辑来识别类似垃圾邮件的行为,或者更好的非人类行为。
当然,人类主持人也可以提供帮助,但是我们还有其他问题,即淹没(甚至淹没)主持人,并且某些站点更喜欢开放性...
回答
机器人很难被击败。在我参与的一个网站上,我们甚至没有使用Captcha标记为"将此字段留空"的字段。机器人总是无法通过真正简单的测试。
更大的问题是人为解决。用户可以通过许多实现方式来解决屏幕抓取的验证码问题,以换取诸如视频或者图像之类的东西(我们知道我的意思)。这意味着存在真正的人为解决验证码的问题,因此,情绪,面部和更复杂的模式毫无意义。
多步骤流程将阻止这种行为,但是以使真正的访问者更难的代价为代价,当我们所有人都试图设计更实用的网站时,这是可悲的。